Comece com uma sandbox do Apache Hadoop, um emulador em uma máquina virtual
Aprenda a instalar o sandbox Apache Hadoop do Hortonworks em uma máquina virtual para aprender sobre o ecossistema do Hadoop. A área restrita fornece um ambiente de desenvolvimento local para saber mais sobre o Hadoop, o HDFS (Sistema de Arquivos Distribuído Hadoop) e o envio de trabalhos. Quando estiver familiarizado com o Hadoop, você poderá começar a usar o Hadoop no Azure, criando um cluster do HDInsight. Para saber mais sobre como começar, confira Introdução ao Hadoop no HDInsight.
Pré-requisitos
- Oracle VirtualBox. Baixe-o e instale-o aqui.
Baixar e instalar a máquina virtual
Navegue até Downloads do Cloudera.
Clique em VIRTUALBOX em Escolher tipo de instalação para fazer download da área restrita mais recente do Hortonworks em uma VM. Entre ou preencha o formulário de interesse do produto.
Clique no botão ÁREA RESTRITA DO HDP (MAIS RECENTE) para iniciar o download.
Para obter instruções sobre como configurar a área restrita, confira Guia de implantação e instalação da área restrita.
Para baixar uma área restrita da versão mais antiga do HDP, confira os links em Versões mais antigas.
Iniciar a máquina virtual
Abra o Oracle VM VirtualBox.
No menu Arquivo, clique em Importar Dispositivo e especifique a imagem da Área Restrita da Hortonworks.
Selecione a Área Restrita da Hortonworks, clique em Iniciar e em Início Normal. Quando a máquina virtual tiver terminado o processo de inicialização, ela exibirá instruções de logon.
Abra um navegador da web e acesse a URL exibida (geralmente
http://127.0.0.1:8888
).
Definir senhas da Área Restrita
Na etapa de introdução da página da Hortonworks Sandbox, selecione Exibir Opções Avançadas. Use as informações desta página para fazer logon na área restrita usando SSH. Use o nome e a senha fornecidos.
Observação
Se você não tiver um cliente SSH instalado, use o SSH baseado na Web fornecido pela máquina virtual em http://localhost:4200/ .
Na primeira vez que você se conectar usando SSH, você receberá uma solicitação para alterar a senha da conta raiz. Insira uma nova senha, que você usa quando faz logon usando SSH.
Depois de conectado, digite o seguinte comando:
ambari-admin-password-reset
Quando receber uma solicitação, forneça uma senha para a conta de administrador do Ambari. Isso é usado quando você acessa a interface do usuário da Web do Ambari.
Usar comandos do Hive
De uma conexão SSH com a área restrita, use o seguinte comando para iniciar o shell do Hive:
hive
Quando o shell for iniciado, use o seguinte para exibir as tabelas que são fornecidas com a área restrita:
show tables;
Use o seguinte para recuperar 10 linhas da tabela
sample_07
:select * from sample_07 limit 10;