Общие сведения об интерактивном запросе в Azure HDInsight

Статья
10/16/2023

Interactive Query (также называется Apache Hive LLAP или Low Latency Analytical Processing) — это тип кластера Azure HDInsight. Interactive Query поддерживает кэширование в памяти, благодаря чему запросы Apache Hive становятся более быстрыми и интерактивными. Клиенты используют интерактивный запрос для сверхбыстрого запроса данных, хранящихся в службе хранилища Azure и Azure Data Lake Storage. Интерактивный запрос упрощает разработчикам и специалистам по обработке и анализу данных работу с большими данными с помощью предпочитаемых средств бизнес-аналитики. Интерактивный запрос HDInsight поддерживает несколько инструментов для простого доступа к большим данным.

Примечание.

Узнайте больше о предстоящих улучшениях и возможностях.

Кластер Interactive Query отличается от кластера Apache Hadoop. Он содержит только службу Hive.

Получить доступ к службе Hive в кластере Interactive Query можно только с помощью представления Apache Ambari Hive, Beeline и драйвера Microsoft Hive ODBC. Эта служба недоступна через консоль Hive, Templeton, классический интерфейс командной строки Azure и Azure PowerShell.

Создание кластера Interactive Query

Дополнительные сведения о создании кластера HDInsight см. в статье Установка кластеров в HDInsight с использованием Hadoop, Spark, Kafka и других технологий. Выберите тип кластера Interactive Query.

Внимание

Минимальный размер головного узла для кластеров Interactive Query — это Standard_D13_v2. Дополнительные сведения см. в диаграмме размера виртуальных машин Azure.

Выполнение запросов Apache Hive из Interactive Query

Есть несколько способов выполнять запросы Hive:

Метод	Description
Microsoft Power BI	Ознакомьтесь со статьей о визуализации данных интерактивного запроса Apache Hive с помощью Power BI в Azure HDInsight и о визуализации больших данных с помощью Power BI в Azure HDInsight.
Visual Studio	Ознакомьтесь с разделом Выполнение интерактивных запросов Hive.
Visual Studio Code	Ознакомьтесь со статьей Use Azure HDInsight Tools for Visual Studio Code (Использование средств Azure HDInsight для Visual Studio Code).
Представление Ambari Apache Hive	Ознакомьтесь со статьей Использование представления Hive Apache Ambari с Apache Hadoop в HDInsight. В HDInsight 4.0 больше не используется представление Hive.
Apache Beeline	Ознакомьтесь со статьей Использование клиента Apache Beeline с Apache Hive. Вы можете использовать Beeline на головном узле или пустом граничном узле. Рекомендуем использовать Beeline на пустом граничном узле. Дополнительные сведения о создании кластера HDInsight с пустым граничным узлом см. в статье Использование пустых граничных узлов в кластерах Hadoop в HDInsight.
Hive ODBC	Ознакомьтесь со статьей Подключение Excel к Apache Hadoop с помощью драйвера Microsoft Hive ODBC в Azure HDInsight.

Чтобы найти строку подключения Java Database Connectivity (JDBC):

В веб-браузере перейдите на страницу https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, где CLUSTERNAME — это имя вашего кластера.
Чтобы скопировать URL-адрес, щелкните значок буфера обмена:

Следующие шаги

Узнайте, как создавать кластеры Interactive Query в HDInsight.
Узнайте, как визуализировать большие данные с помощью Power BI в Azure HDInsight.
Узнайте, как выполнять запросы Apache Hive в Azure HDInsight с помощью Apache Zeppelin.

Общие сведения об интерактивном запросе в Azure HDInsight

Создание кластера Interactive Query

Выполнение запросов Apache Hive из Interactive Query

Следующие шаги

Дополнительные ресурсы