Comece com uma sandbox do Apache Hadoop, um emulador em uma máquina virtual

Aprenda a instalar o sandbox Apache Hadoop do Hortonworks em uma máquina virtual para aprender sobre o ecossistema do Hadoop. A área restrita fornece um ambiente de desenvolvimento local para saber mais sobre o Hadoop, o HDFS (Sistema de Arquivos Distribuído Hadoop) e o envio de trabalhos. Quando estiver familiarizado com o Hadoop, você poderá começar a usar o Hadoop no Azure, criando um cluster do HDInsight. Para saber mais sobre como começar, confira Introdução ao Hadoop no HDInsight.

Pré-requisitos

Baixar e instalar a máquina virtual

  1. Navegue até Downloads do Cloudera.

  2. Clique em VIRTUALBOX em Escolher tipo de instalação para fazer download da área restrita mais recente do Hortonworks em uma VM. Entre ou preencha o formulário de interesse do produto.

  3. Clique no botão ÁREA RESTRITA DO HDP (MAIS RECENTE) para iniciar o download.

Para obter instruções sobre como configurar a área restrita, confira Guia de implantação e instalação da área restrita.

Para baixar uma área restrita da versão mais antiga do HDP, confira os links em Versões mais antigas.

Iniciar a máquina virtual

  1. Abra o Oracle VM VirtualBox.

  2. No menu Arquivo, clique em Importar Dispositivo e especifique a imagem da Área Restrita da Hortonworks.

  3. Selecione a Área Restrita da Hortonworks, clique em Iniciar e em Início Normal. Quando a máquina virtual tiver terminado o processo de inicialização, ela exibirá instruções de logon.

    virtualbox manager normal start

  4. Abra um navegador da web e acesse a URL exibida (geralmente http://127.0.0.1:8888).

Definir senhas da Área Restrita

  1. Na etapa de introdução da página da Hortonworks Sandbox, selecione Exibir Opções Avançadas. Use as informações desta página para fazer logon na área restrita usando SSH. Use o nome e a senha fornecidos.

    Observação

    Se você não tiver um cliente SSH instalado, use o SSH baseado na Web fornecido pela máquina virtual em http://localhost:4200/ .

    Na primeira vez que você se conectar usando SSH, você receberá uma solicitação para alterar a senha da conta raiz. Insira uma nova senha, que você usa quando faz logon usando SSH.

  2. Depois de conectado, digite o seguinte comando:

    ambari-admin-password-reset
    

    Quando receber uma solicitação, forneça uma senha para a conta de administrador do Ambari. Isso é usado quando você acessa a interface do usuário da Web do Ambari.

Usar comandos do Hive

  1. De uma conexão SSH com a área restrita, use o seguinte comando para iniciar o shell do Hive:

    hive
    
  2. Quando o shell for iniciado, use o seguinte para exibir as tabelas que são fornecidas com a área restrita:

    show tables;
    
  3. Use o seguinte para recuperar 10 linhas da tabela sample_07 :

    select * from sample_07 limit 10;
    

Próximas etapas