Guia de início rápido: consultar o Apache HBase no Azure HDInsight com o HBase Shell

Neste início rápido, você aprenderá a usar o Apache HBase Shell para criar uma tabela HBase, inserir dados e consultar a tabela.

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Pré-requisitos

Criar uma tabela e manipular dados

Para a maioria das pessoas, os dados são apresentados no formato de tabela:

HDInsight Apache HBase tabular data.

No HBase (uma implementação do Cloud BigTable), os mesmos dados se parecem com:

HDInsight Apache HBase BigTable data.

Você pode usar SSH para se conectar a clusters HBase e, em seguida, usar o Apache HBase Shell para criar tabelas HBase, inserir dados e consultar dados.

  1. Use ssh o comando para se conectar ao cluster HBase. Edite o comando abaixo substituindo CLUSTERNAME pelo nome do cluster e digite o comando:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Use hbase shell o comando para iniciar o shell interativo do HBase. Digite o seguinte comando em sua conexão SSH:

    hbase shell
    
  3. Use create o comando para criar uma tabela HBase com famílias de duas colunas. Introduza o seguinte comando:

    create 'Contacts', 'Personal', 'Office'
    
  4. Use list o comando para listar todas as tabelas no HBase. Introduza o seguinte comando:

    list
    
  5. Use put o comando para inserir valores em uma coluna especificada em uma linha especificada em uma tabela específica. Introduza o seguinte comando:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Use scan o comando para verificar e retornar os dados da Contacts tabela. Introduza o seguinte comando:

    scan 'Contacts'
    
  7. Use get o comando para buscar o conteúdo de uma linha. Introduza o seguinte comando:

    get 'Contacts', '1000'
    

    Você vê resultados semelhantes ao usar o scan comando porque há apenas uma linha.

  8. Use delete o comando para excluir um valor de célula em uma tabela. Introduza o seguinte comando:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Use disable o comando para desativar a tabela. Introduza o seguinte comando:

    disable 'Contacts'
    
  10. Use drop o comando para soltar uma tabela do HBase. Introduza o seguinte comando:

    drop 'Contacts'
    
  11. Use exit o comando para parar o shell interativo do HBase. Introduza o seguinte comando:

    exit
    

Para obter mais informações sobre o esquema de tabela do HBase, consulte Introdução ao design do esquema do Apache HBase. Para obter mais comandos HBase, consulte o artigo Guia de referência Apache HBase.

Clean up resources (Limpar recursos)

Depois de concluir o início rápido, convém excluir o cluster. Com o HDInsight, os dados são armazenados no Storage do Azure, pelo que pode eliminar um cluster em segurança quando este não está a ser utilizado. Também lhe é cobrado o valor de um cluster do HDInsight mesmo quando não o está a utilizar. Uma vez que os custos do cluster são muito superiores aos custos do armazenamento, faz sentido do ponto de vista económico eliminar os clusters quando não estiverem a ser utilizados.

Para excluir um cluster, consulte Excluir um cluster HDInsight usando seu navegador, PowerShell ou a CLI do Azure.

Próximos passos

Neste início rápido, você aprendeu como usar o Apache HBase Shell para criar uma tabela HBase, inserir dados e consultar a tabela. Para saber mais sobre os dados armazenados no HBase, o próximo artigo mostrará como executar consultas com o Apache Spark.