Introduzione a una sandbox di Hadoop, un emulatore in una macchina virtuale

Informazioni su come installare l'ambiente sandbox Hadoop da Hortonworks in una macchina virtuale per acquisire familiarità con l'ecosistema di Hadoop. L'ambiente sandbox è un ambiente di sviluppo locale per informazioni su Hadoop, Hadoop Distributed File System (HDFS) e l'invio di processi. Dopo aver acquisito familiarità con Hadoop è possibile iniziare a usare Hadoop in Azure creando un cluster HDInsight. Per altre informazioni sulle attività iniziali, vedere l'articolo Introduzione all'uso di Hadoop basato su Linux in HDInsight.

Prerequisiti

Scaricare e installare la macchina virtuale

  1. Passare ai download di Hortonworks.

  2. Fare clic su DOWNLOAD FOR VIRTUALBOX per scaricare la versione più recente di Hortonworks Sandbox in una macchina virtuale. È necessario registrarsi con Hortonworks prima di avviare il download. Il download può richiedere da una a due ore a seconda della velocità della rete.

    Immagine di collegamento per scaricare Sandbox di Hortonworks per VirtualBox

  3. Nella stessa pagina Web, fare clic sul collegamento Import on Virtual Box per scaricare un file PDF contenente le istruzioni di installazione per la macchina virtuale.

Per scaricare una versione precedente di sandbox HDP, espandere l'archivio:

Archivio Hortonworks Sandbox

Avviare la macchina virtuale

  1. Aprire Oracle VM VirtualBox.
  2. Scegliere Import Appliance dal menu File e quindi specificare l'immagine di Hortonworks Sandbox.
  3. Selezionare Hortonworks Sandbox, fare clic su Start e quindi su Normal Start. Al termine del processo di avvio della macchina virtuale, vengono visualizzate le istruzioni di accesso.

    Avvio normale

  4. Aprire un Web browser e passare all'URL visualizzato, in genere http://127.0.0.1:8888.

Impostare le password Sandbox

  1. Dal passaggio introduttivo della pagina di Sandbox di Hortonworks, selezionare View Advanced Options (Visualizza opzioni avanzate). Utilizzare le informazioni in questa pagina per accedere alla sandbox con SSH. Utilizzare il nome e la password forniti.

    Nota

    Se non è stato installato un client SSH, è possibile usare l'SSH basato sul Web fornito dalla macchina virtuale all'indirizzo http://localhost:4200/.

    Al primo collegamento tramite SSH viene richiesto di cambiare la password per l'account root. Immettere una nuova password da usare quando si accede tramite SSH.

  2. Dopodiché immettere il comando seguente:

     ambari-admin-password-reset
    

    Quando richiesto, fornire una password per l'account di amministratore di Ambari. Questo viene utilizzato quando si accede all'interfaccia utente Web di Ambari.

Usare i comandi Hive

  1. Da una connessione SSH a Sandbox, utilizzare il comando seguente per avviare la shell di Hive:

     hive
    
  2. Una volta avviata la shell, utilizzarla per visualizzare le tabelle fornite con Sandbox:

     show tables;
    
  3. Usare il codice seguente per recuperare 10 righe dalla tabella sample_07 :

     select * from sample_07 limit 10;
    

Passaggi successivi