O que é a Consulta Interativa no HDInsight

Consulta Interativa (também chamado Apache Hive LLAP ou Processamento Analítico de Baixa Latência) é um tipo de cluster do Azure HDInsight. A Consulta Interativa dá suporte ao cache na memória, o que torna as consultas do Apache Hive mais rápidas e muito mais interativas. Os clientes usam a consulta interativa para consultar dados armazenados no armazenamento do Azure e no Azure Data Lake Storage de modo extremamente rápido. A consulta interativa torna facilita o trabalho de cientista de dados e desenvolvedores com big data usando as ferramentas de BI que eles mais gostam. A Consulta interativa do HDInsight oferece suporte a várias ferramentas para acessar big data de maneira fácil.

Um cluster de Consulta Interativa é diferente de um cluster Apache Hadoop. Ele contém apenas o serviço do Hive.

É possível acessar o serviço do Hive no cluster da Consulta Interativa somente por meio da exibição do Hive do Apache Ambari, do Beeline e do driver Microsoft Hive Open Database Connectivity (Hive ODBC). Não é possível acessá-lo por meio do console do Hive, do Templeton, da CLI Clássica do Azure nem do Azure PowerShell.

Criar um cluster de Consulta Interativa

Para obter mais informações sobre a criação de um cluster HDInsight, veja Criar clusters Apache Hadoop no HDInsight. Escolha o tipo de cluster Consulta Interativa.

Importante

O tamanho mínimo do nó de cabeçalho para clusters de Consulta Interativa é Standard_D13_v2. Para obter mais informações, confira Gráfico de Dimensionamento de Máquinas Virtuais do Azure.

Executar consultas de Apache Hive da Consulta Interativa

Para executar consultas de Hive, você tem as seguintes opções:

Método Descrição
Microsoft Power BI Confira Visualizar dados do Apache Hive do Interactive Query com o Power BI no Azure HDInsight e Visualizar Big Data com o Power BI no Azure HDInsight.
Visual Studio Consulte Conectar-se ao Azure HDInsight e executar consultas Apache Hive usando Ferramentas do Data Lake para Visual Studio.
Visual Studio Code Veja Usar o Visual Studio Code para o Apache Hive, o LLAP ou o pySpark.
Exibição do Hive do Apache Ambari Use o Apache Ambari Hive View com o Apache Hadoop no HDInsight. A Exibição do Hive não está disponível no HDInsight 4.0.
Apache Beeline Consulte Usar Apache Hive com Apache Hadoop no HDInsight com Beeline. É possível usar o Beeline no nó de cabeçalho ou em um nó de borda vazio. Recomendamos usar o Beeline em um nó de borda vazio. Para obter informações sobre como criar um cluster HDInsight usando um nó de borda vazio, consulte Use empty edge nodes in HDInsight (Usar nós de borda vazios no HDInsight).
ODBC do Hive Veja Conectar o Excel ao Apache Hadoop com o driver ODBC do Microsoft Hive.

Para localizar a cadeia de conexão do JDBC (Java Database Connectivity):

  1. Em um navegador da Web, navegue até https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, em que CLUSTERNAME é o nome do cluster.

  2. Para copiar a URL, selecione o ícone da área de transferência:

    HDInsight Hadoop Interactive Query LLAP JDBC.

Próximas etapas