Общие сведения об интерактивном запросе в Azure HDInsight

Interactive Query (также называется Apache Hive LLAP или Low Latency Analytical Processing) — это тип кластера Azure HDInsight. Interactive Query поддерживает кэширование в памяти, благодаря чему запросы Apache Hive становятся более быстрыми и интерактивными. Клиенты используют интерактивный запрос для сверхбыстрого запроса данных, хранящихся в службе хранилища Azure и &Azure Data Lake Storage. Интерактивный запрос упрощает разработчикам и специалистам по обработке и анализу данных работу с большими данными с помощью предпочитаемых средств бизнес-аналитики. Интерактивный запрос HDInsight поддерживает несколько инструментов для простого доступа к большим данным.

Кластер Interactive Query отличается от кластера Apache Hadoop. Он содержит только службу Hive.

Получить доступ к службе Hive в кластере Interactive Query можно только с помощью представления Apache Ambari Hive, Beeline и драйвера Microsoft Hive ODBC. Эта служба недоступна через консоль Hive, Templeton, классический интерфейс командной строки Azure и Azure PowerShell.

Создание кластера Interactive Query

Дополнительные сведения о создании кластера HDInsight см. в статье Установка кластеров в HDInsight с использованием Hadoop, Spark, Kafka и других технологий. Выберите тип кластера Interactive Query.

Важно!

Минимальный размер головного узла для кластеров Interactive Query — это Standard_D13_v2. Дополнительные сведения см. в спецификации размеров виртуальных машин Azure.

Выполнение запросов Apache Hive из Interactive Query

Есть несколько способов выполнять запросы Hive:

Метод Описание
Microsoft Power BI Ознакомьтесь со статьей о визуализации данных интерактивного запроса Apache Hive с помощью Power BI в Azure HDInsight и о визуализации больших данных с помощью Power BI в Azure HDInsight.
Visual Studio Ознакомьтесь с разделом Выполнение интерактивных запросов Hive.
Visual Studio Code Ознакомьтесь со статьей Use Azure HDInsight Tools for Visual Studio Code (Использование средств Azure HDInsight для Visual Studio Code).
Представление Ambari Apache Hive Ознакомьтесь со статьей Использование представления Hive Apache Ambari с Apache Hadoop в HDInsight. В HDInsight 4.0 больше не используется представление Hive.
Apache Beeline Ознакомьтесь со статьей Использование клиента Apache Beeline с Apache Hive. Вы можете использовать Beeline на головном узле или пустом граничном узле. Рекомендуем использовать Beeline на пустом граничном узле. Дополнительные сведения о создании кластера HDInsight с пустым граничным узлом см. в статье Использование пустых граничных узлов в кластерах Hadoop в HDInsight.
Hive ODBC Ознакомьтесь со статьей Подключение Excel к Apache Hadoop с помощью драйвера Microsoft Hive ODBC в Azure HDInsight.

Чтобы найти строку подключения Java Database Connectivity (JDBC):

  1. В веб-браузере перейдите на страницу https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, где CLUSTERNAME — это имя вашего кластера.

  2. Чтобы скопировать URL-адрес, щелкните значок буфера обмена:

    HDInsight Hadoop Interactive Query LLAP JDBC

Следующие шаги