Partilhar via


Usar o Apache Zeppelin para executar consultas do Apache Phoenix no Apache HBase no Azure HDInsight

O Apache Phoenix é uma camada de banco de dados relacional massivamente paralela de código aberto construída no HBase. Phoenix permite que você use SQL como consultas sobre HBase. Phoenix usa drivers JDBC abaixo para permitir que você crie, exclua, altere tabelas, índices, exibições e sequências SQL. Você também pode usar Phoenix para atualizar linhas individualmente e em massa. Phoenix usa uma compilação nativa NOSQL em vez de usar MapReduce para compilar consultas, permitindo a criação de aplicativos de baixa latência sobre o HBase.

O Apache Zeppelin é um notebook baseado na Web de código aberto que permite criar documentos colaborativos orientados por dados usando análises de dados interativas e linguagens como SQL e Scala. Ele ajuda os desenvolvedores de dados e cientistas de dados a desenvolver, organizar, executar e compartilhar código para manipulação de dados. Ele permite que você visualize os resultados sem se referir à linha de comando ou precisar dos detalhes do cluster.

Os usuários do HDInsight podem usar o Apache Zeppelin para consultar tabelas Phoenix. O Apache Zeppelin é integrado ao cluster HDInsight e não há etapas adicionais para usá-lo. Crie um Notebook Zeppelin com interpretador JDBC e comece a escrever suas consultas Phoenix SQL

Pré-requisitos

Um cluster Apache HBase no HDInsight. Consulte Introdução ao Apache HBase.

Criar uma nota do Apache Zeppelin

  1. Substitua CLUSTERNAME pelo nome do cluster no seguinte URL https://CLUSTERNAME.azurehdinsight.net/zeppelin. Em seguida, insira o URL em um navegador da Web. Introduza o seu nome de utilizador e palavra-passe de início de sessão no cluster.

  2. Na página Zeppelin, selecione Criar nova nota.

    HDInsight Interactive Query zeppelin.

  3. Na caixa de diálogo Criar nova nota, digite ou selecione os seguintes valores:

    • Nota Nome: Introduza um nome para a nota.
    • Interpretador padrão: Selecione jdbc na lista suspensa.

    Em seguida, selecione Criar nota.

  4. Verifique se o cabeçalho do bloco de anotações mostra um status conectado. É indicado por um ponto verde no canto superior direito.

    Zeppelin notebook status.

  5. Crie uma tabela HBase. Digite o seguinte comando e pressione Shift + Enter:

    %jdbc(phoenix)
    CREATE TABLE Company (
        company_id INTEGER PRIMARY KEY,
        name VARCHAR(225)
    );
    

    A instrução %jdbc(phoenix) na linha de frente diz ao bloco de anotações para usar o interpretador JDBC Phoenix.

  6. Ver tabelas criadas.

    %jdbc(phoenix)
    SELECT DISTINCT table_name
    FROM SYSTEM.CATALOG
    WHERE table_schem is null or table_schem <> 'SYSTEM';
    
  7. Insira valores na tabela.

    %jdbc(phoenix)
    UPSERT INTO Company VALUES(1, 'Microsoft');
    UPSERT INTO Company (name, company_id) VALUES('Apache', 2);
    
  8. Consulte a tabela.

    %jdbc(phoenix)
    SELECT * FROM Company;
    
  9. Excluir um registro.

    %jdbc(phoenix)
    DELETE FROM Company WHERE COMPANY_ID=1;
    
  10. Solte a mesa.

    %jdbc(phoenix)
    DROP TABLE Company;
    

Próximos passos