Creare cluster basati su Linux in HDInsight tramite il portale di Azure

Il portale di Azure è uno strumento di gestione basato sul Web per servizi e risorse ospitati nel cloud di Microsoft Azure. In questo articolo si apprenderà come creare cluster HDInsight basati su Linux tramite il portale.

Prerequisiti

Avviso

La fatturazione dei cluster HDInsight viene calcolata al minuto, indipendentemente dal fatto che siano in uso o meno. Assicurarsi di eliminare il cluster dopo aver finito di usarlo. Per altre informazioni, vedere l'articolo su come eliminare un cluster HDInsight.

Creare i cluster

Il portale di Azure espone la maggior parte delle proprietà del cluster. Con il modello di Azure Resource Manager è possibile nascondere molti dettagli. Per altre informazioni, vedere Creare cluster Hadoop basati su Linux in HDInsight tramite modelli di Azure Resource Manager.

Nota

La funzionalità Trasferimento sicuro obbligatorio richiede la connessione sicura per tutte le richieste all'account. Questa funzionalità è supportata solo dal cluster HDInsight versione 3.6 o successiva. Per altre informazioni, vedere Creare un cluster Hadoop con account di archiviazione con trasferimento sicuro in Azure HDInsight.

  1. Accedere al Portale di Azure.
  2. Fare clic su +, Intelligence e analisi e quindi su HDInsight.

    Creazione di un nuovo cluster nel portale di Azure

  3. Nel pannello HDInsight fare clic su Custom (size, settings, apps) (Personalizza dimensioni, impostazioni,app), scegliere Nozioni di base, quindi immettere le informazioni seguenti.

    Creazione di un nuovo cluster nel portale di Azure

    • Inserire il Nome cluster: il nome deve essere univoco a livello globale.

    • Nell'elenco a discesa Sottoscrizione selezionare la sottoscrizione di Azure che verrà usata per il cluster.

    • Fare clic su Tipo di cluster, quindi scegliere:

      • Tipo di cluster: in caso di dubbi su questa opzione, scegliere Hadoop. È il tipo di cluster più diffuso.

        Importante

        Sono disponibili molti tipi di cluster HDInsight, che corrispondono al carico di lavoro o alla tecnologia per cui è ottimizzato il cluster. Non è disponibile alcun metodo supportato per creare un cluster che combini più tipi, ad esempio Storm e HBase in un cluster.

      • Sistema operativo: selezionare Linux.

      • Versione: utilizzare la versione predefinita, in caso di dubbi. Per altre informazioni, vedere Versioni del cluster HDInsight.

      • Livello del cluster: HDInsight di Azure fornisce offerte cloud per i Big Data in due categorie: livello Standard e livello Premium. Per ulteriori informazioni, vedere Livelli di cluster.
    • Per Nome utente dell'account di accesso del cluster e Password dell'account di accesso del cluster immettere il nome utente e la password dell'utente amministratore.

    • Immettere un Nome utente SSH e se si desidera che la password SSH sia uguale alla password dell'amministratore specificata in precedenza, selezionare la casella di controllo Usa la stessa password dell'account di accesso del cluster. In caso contrario, inserire una PASSWORD o una CHIAVE PUBBLICA da usare per autenticare l'utente SSH. Si consiglia di utilizzare una chiave pubblica. Fare clic su Seleziona nella parte inferiore per salvare la configurazione delle credenziali.

      Per altre informazioni, vedere Usare SSH con HDInsight.

    • Per Gruppo di risorse, specificare se si desidera creare un nuovo gruppo di risorse o usarne uno esistente.

    • Specificare un percorso per il data center in cui verrà creato il cluster.

    • Fare clic su Avanti.

  4. Nel pannello Archiviazione specificare se si desidera impostare Archiviazione di Azure (WASB) o Data Lake Store come risorsa di archiviazione predefinita. Per altre informazioni, vedere la tabella di seguito.

    Creazione di un nuovo cluster nel portale di Azure

    Archiviazione Descrizione
    BLOB del servizio di archiviazione di Azure come risorsa di archiviazione predefinita
    • Per Tipo di archiviazione primario selezionare Archiviazione di Azure. Successivamente, per Metodo di selezione, è possibile scegliere Sottoscrizioni personali se si desidera specificare un account di archiviazione che fa parte della sottoscrizione Azure e quindi selezionare l'account di archiviazione. In caso contrario, fare clic su Chiave di accesso e fornire le informazioni relative all'account di archiviazione che si desidera scegliere all'esterno della sottoscrizione Azure.
    • Per Contenitore predefinito, è possibile scegliere di usare il nome del contenitore predefinito suggerito dal portale oppure specificarne uno personale.
    • Se si usa WASB come risorsa di archiviazione predefinita, è possibile (facoltativamente) fare clic su Account archiviazione aggiuntivi per specificare gli account di archiviazione aggiuntivi da associare al cluster. Nel pannello Chiavi di archiviazione di Azure fare clic su Aggiungi una chiave di archiviazione. Sarà quindi possibile fornire un account di archiviazione da sottoscrizioni Azure o da altre sottoscrizioni (fornendo la chiave di accesso all'account di archiviazione).
    • Se si usa WASB come risorsa di archiviazione predefinita, è possibile (facoltativamente) fare clic su Accesso a Data Lake Store per specificare Azure Data Lake Store come risorsa di archiviazione aggiuntiva. Per altre informazioni, vedere Creare un cluster HDInsight con Data Lake Store tramite il Portale di Azure.
    Azure Data Lake Store come risorsa di archiviazione predefinita Per Tipo di archiviazione primario selezionare Data Lake Store e quindi fare riferimento all'articolo Creare un cluster HDInsight con Data Lake Store tramite il Portale di Azure per le istruzioni.
    Metastore esterni È possibile, facoltativamente, specificare un database SQL per salvare i metadati Hive e Oozie associati al cluster. Per Seleziona un database SQL per Hive, selezionare un database SQL e quindi specificare il nome utente e la password per il database stesso. Ripetere questi passaggi per i metadati Oozie.

    Alcune considerazioni durante l'utilizzo del database SQL di Azure per metastore.
    • Il database SQL di Azure usato per il metastore deve consentire la connettività ad altri servizi di Azure, incluso Azure HDInsight. Sul lato destro del dashboard del database SQL di Azure fare clic sul nome del server, cioè il server in cui è in esecuzione l'istanza di database SQL. Nella visualizzazione server fare clic su Configura, quindi per Servizi di Microsoft Azure fare clic su e infine su Salva.
    • Quando si crea un metastore personalizzato, non utilizzare un nome di database che contiene trattini o segni meno, poiché il processo di creazione del cluster non andrebbe a buon fine.

    Fare clic su Avanti.

    Avviso

    L'uso di un account di archiviazione aggiuntivo in una località diversa rispetto al cluster HDInsight non è supportato.

  5. Se lo si desidera, fare clic su Applicazioni per installare le applicazioni che funzionano con i cluster HDInsight. Queste applicazioni possono essere sviluppate da Microsoft, da fornitori di software indipendenti (ISV) o dall'utente. Per altre informazioni, vedere Installare applicazioni HDInsight.

  6. Fare clic su Dimensione del cluster per visualizzare informazioni sui nodi che verranno creati per questo cluster. Impostare il numero di nodi del ruolo di lavoro necessari per il cluster. Verrà visualizzato il costo stimato del cluster all'interno del pannello.

    Pannello Piani tariffari per il nodo

    Importante

    Se si prevedono più di 32 nodi di lavoro, al momento della creazione del cluster o con il ridimensionamento del cluster dopo la creazione, è necessario selezionare una dimensione del nodo head con almeno 8 core e 14GB di RAM.

    Per altre informazioni sulle dimensioni di nodo e i costi associati, vedere Prezzi di HDInsight.

    Fare clic su Avanti per salvare la configurazione dei piani tariffari per il nodo.

  7. Fare clic su Impostazioni avanzate per configurare altre impostazioni facoltative, ad esempio l'utilizzo di Azioni Script per personalizzare un cluster per installare i componenti personalizzati o per la partecipazione a una Rete virtuale. Per altre informazioni, vedere la tabella di seguito.

    Pannello Piani tariffari per il nodo

    Opzione Descrizione
    Azioni Script Se si desidera usare uno script personalizzato per personalizzare un cluster durante la creazione. Per altre informazioni sulle azioni di script, vedere Personalizzare i cluster HDInsight mediante le azioni script.
    Rete virtuale Selezionare una rete virtuale di Azure e la subnet, se si desidera posizionare il cluster in una rete virtuale. Per informazioni sull'uso di HDInsight con una rete virtuale, inclusi i requisiti di configurazione specifici per la rete virtuale, vedere Estendere le funzionalità di HDInsight usando Rete virtuale di Azure.

    Fare clic su Avanti.

  8. Nel pannello Riepilogo verificare le informazioni immesse in precedenza e quindi fare clic su Crea.

    Pannello Piani tariffari per il nodo

    Nota

    La creazione del cluster richiederà del tempo, in genere circa 15 minuti. Usare il riquadro sulla schermata iniziale, o la voce Notifiche a sinistra della pagina per controllare il processo di provisioning.

  9. Al termine della procedura di creazione, fare clic sul riquadro per il cluster dalla Schermata iniziale per avviare il pannello del cluster. Nel pannello relativo al cluster sono disponibili le informazioni indicate di seguito.

    Pannello Cluster

    Usare le informazioni seguenti per comprendere le icone nella parte superiore di questo pannello.

    • Il pannello Panoramica fornisce tutte le informazioni essenziali sul cluster, ad esempio nome, gruppo di risorse a cui appartiene, percorso, sistema operativo, URL per il dashboard del cluster e così via.
    • Dashboard permette di passare al portale di Ambari associato al cluster.
    • Secure Shell: informazioni necessarie per accedere al cluster tramite SSH.
    • Ridimensiona cluster consente di aumentare il numero di nodi di lavoro associati al cluster.
    • Elimina: consente di eliminare il cluster HDInsight.

Personalizzare i cluster

Eliminazione del cluster

Avviso

La fatturazione dei cluster HDInsight viene calcolata al minuto, indipendentemente dal fatto che siano in uso o meno. Assicurarsi di eliminare il cluster dopo aver finito di usarlo. Per altre informazioni, vedere l'articolo su come eliminare un cluster HDInsight.

Risoluzione dei problemi

Se si verificano problemi di creazione dei cluster HDInsight, vedere i requisiti dei controlli di accesso.

Passaggi successivi

Dopo aver creato un cluster HDInsight, usare le informazioni seguenti per acquisire familiarità con il cluster:

Cluster Hadoop

Cluster HBase

Cluster Storm

Cluster Spark