Installare applicazioni Hadoop di terze parti in Azure HDInsight

Questo articolo illustra come installare un'applicazione Hadoop di terze parti già pubblicata in Azure HDInsight. Per istruzioni sull'installazione di un'applicazione personalizzata, vedere l'articolo su come installare applicazioni HDInsight personalizzate.

Un'applicazione HDInsight è un'applicazione che gli utenti possono installare in un cluster HDInsight basato su Linux. Queste applicazioni possono essere sviluppate da Microsoft, da fornitori di software indipendenti (ISV) o dall'utente.

Attualmente sono disponibili quattro applicazioni pubblicate:

  • DATAIKU DDS on HDInsight: Dataiku DSS (Data Science Studio) è un software che consente ai professionisti che lavorano con i dati (data scientist, business analyst, sviluppatori e così via) di creare prototipi, compilare e distribuire servizi altamente specifici che trasformano i dati non elaborati in stime aziendali di grande impatto.
  • Datameer: Datameer offre agli analisti un modo interattivo per rilevare, analizzare e visualizzare i risultati nei Big Data. Consente di effettuare il pull di altre origini dati con facilità per individuare nuove relazioni e ottenere rapidamente le risposte necessarie.
  • Streamsets Data Collector for HDnsight offre un ambiente di sviluppo integrato (IDE) completo che consente di progettare, testare, distribuire e gestire pipeline di inserimento any-to-any che uniscono dati batch e del flusso e includono varie trasformazioni all'interno del flusso, senza dover scrivere codice personalizzato.
  • Cask CDAP for HDInsight: offre la prima piattaforma di integrazione unificata per Big Data che riduce i tempi per la produzione di applicazioni dati e Data Lake dell'80%. Questa applicazione supporta solo i cluster Standard HBase 3.4.
  • H2O Artificial Intelligence for HDInsight (Beta): H2O Sparkling Water supporta gli algoritmi distribuiti GLM, Naïve Bayes, Distributed Random Forest, Gradient Boosting Machine, Deep Neural Networks, Deep learning, K-Means, PCA, Generalized Low Rank Models, Anomaly Detection e Autoencoders.
  • Kyligence Analytics Platform: Kyligence Analytics Platform (KAP) è un data warehouse di livello aziendale con tecnologia Apache Kylin e Apache Hadoop che supporta una latenza di query inferiore al secondo su set di dati di enormi dimensioni e semplifica l'analisi dei dati per gli utenti business e gli analisti.
  • SnapLogic Hadooplex: l'esecuzione di SnapLogic Hadooplex in HDInsight consente ai clienti di ottenere più rapidamente informazioni aziendali approfondite offrendo funzionalità di preparazione e inserimento self-service di dati da quasi tutte le origini alla piattaforma cloud Microsoft Azure.
  • Spark Job Server for KNIME Spark Executor: Spark Job Server for KNIME Spark Executor consente di connettere la piattaforma di analisi KNIME ai cluster HDInsight.

Nelle istruzioni illustrate in questo articolo si usa il portale di Azure. È anche possibile esportare il modello di Azure Resource Manager dal portale oppure ottenere una copia del modello di Resource Manager dai fornitori e usare l'interfaccia della riga di comando di Azure e Azure PowerShell per distribuire il modello. Vedere Creare cluster Hadoop basati su Linux in HDInsight tramite modelli ARM.

Prerequisiti

Per installare applicazioni HDInsight in un cluster HDInsight esistente, è necessario un cluster HDInsight. Per crearne uno, vedere Creare cluster. È anche possibile installare applicazioni HDInsight quando si crea un cluster HDInsight.

Installare applicazioni in cluster esistenti

La procedura seguente illustra come installare applicazioni HDInsight in un cluster HDInsight esistente.

Per installare un'applicazione HDInsight

  1. Accedere al portale di Azure.
  2. Fare clic su Cluster HDInsight nel menu a sinistra. Se non è visualizzato, fare clic su Altri servizi e quindi su Cluster HDInsight.
  3. Fare clic su un cluster HDInsight. Se non ci sono cluster disponibili, è necessario crearne uno. Vedere Creare cluster.
  4. Fare clic su Applicazioni nella categoria Configurazioni. Verrà visualizzato un elenco delle applicazioni installate. Se non è possibile trovare Applicazioni, significa che non sono disponibili applicazioni per questa versione del cluster HDInsight.

    Menu del portale Applicazioni di HDInsight

  5. Fare clic su Aggiungi nel menu del pannello.

    App installate in Applicazioni di HDInsight

    Verrà visualizzato un elenco delle applicazioni HDInsight esistenti.

    Applicazioni disponibili in Applicazioni di HDInsight

  6. Fare clic su una delle applicazioni, accettare le condizioni legali e quindi fare clic su Seleziona.

È possibile vedere lo stato di installazione dell'applicazione dalle notifiche del portale facendo clic sull'icona a forma di campana nella parte superiore del portale. Dopo l'installazione dell'applicazione, questa verrà visualizzata nel pannello App installate.

Installare applicazioni durante la creazione del cluster

È possibile installare applicazioni HDInsight quando si crea un cluster. Durante il processo, le applicazioni HDInsight vengono installate dopo la creazione del cluster e mentre è nello stato in corso di esecuzione. La procedura seguente illustra come installare applicazioni HDInsight mentre si crea un cluster.

Per installare un'applicazione HDInsight

  1. Accedere al Portale di Azure.
  2. Fare clic su Nuovo, su Analisi dei dati e quindi su HDInsight.
  3. Inserire il Nome cluster: il nome deve essere univoco a livello globale.
  4. Fare clic su Sottoscrizione per selezionare la sottoscrizione di Azure usata per il cluster.
  5. Fare clic su Selezionare il tipo di cluster, quindi selezionare:

    • Tipo di cluster: in caso di dubbi su questa opzione, scegliere Hadoop. È il tipo di cluster più diffuso.
    • Sistema operativo: selezionare Linux.
    • Versione: utilizzare la versione predefinita, in caso di dubbi. Per altre informazioni, vedere Versioni del cluster HDInsight.
    • Livello del cluster: HDInsight di Azure fornisce offerte cloud per i Big Data in due categorie: livello Standard e livello Premium. Per ulteriori informazioni, vedere Livelli di cluster.
  6. Fare clic su Applicazioni, fare clic su una delle applicazioni pubblicate e quindi su Seleziona.
  7. Fare clic su Credenziali e quindi immettere una password per l'utente amministratore. È anche necessario immettere un valore in Nome utente SSH e in PASSWORD o CHIAVE PUBBLICA. Questi valori verranno usati per autenticare l'utente SSH. Si consiglia di utilizzare una chiave pubblica. Fare clic su Seleziona nella parte inferiore per salvare la configurazione delle credenziali.
  8. Fare clic su Origine dati e selezionare uno degli account di archiviazione esistenti oppure crearne uno nuovo da usare come account di archiviazione predefinito per il cluster.
  9. Fare clic su Gruppo di risorse per selezionare un gruppo di risorse esistente o fare clic su Nuovo per crearne uno nuovo.
  10. Nel pannello Nuovo cluster HDInsight assicurarsi che l'opzione Aggiungi alla Schermata iniziale sia selezionata, quindi fare clic su Crea.

Elencare le app HDInsight installate e le proprietà

Il portale include un elenco delle applicazioni HDInsight installate per un cluster e le proprietà di ognuna.

Per elencare le applicazioni HDInsight e visualizzare le proprietà

  1. Accedere al portale di Azure.
  2. Fare clic su Cluster HDInsight nel menu a sinistra. Se non è visualizzato, fare clic su Esplora e quindi su Cluster HDInsight.
  3. Fare clic su un cluster HDInsight.
  4. Nel pannello Impostazioni fare clic su Applicazioni nella categoria Generale. Il pannello App installate elenca tutte le applicazioni installate.

    App installate in Applicazioni di HDInsight

  5. Fare clic su una delle applicazioni installate per visualizzare la proprietà. Il pannello delle proprietà elenca:

    • Nome dell'app: nome all'applicazione.
    • Stato: stato dell'applicazione.
    • Pagina Web: URL dell'applicazione Web distribuita nel nodo perimetrale. Le credenziali sono le stesse usate per le credenziali utente HTTP configurate per il cluster.
    • Endpoint HTTP: le credenziali sono le stesse usate per le credenziali utente HTTP configurate per il cluster.
    • Endpoint SSH: è possibile usare SSH per connettersi al nodo perimetrale. Le credenziali SSH sono le stesse usate per le credenziali utente SSH configurate per il cluster. Per altre informazioni, vedere Usare SSH con HDInsight.
  6. Per eliminare un'applicazione, fare clic con il pulsante destro del mouse sull'applicazione e quindi scegliere Elimina dal menu di scelta rapida.

Connettersi al nodo perimetrale

È possibile connettersi al nodo perimetrale tramite HTTP e SSH. Le informazioni sull'endpoint sono disponibili nel portale. Per altre informazioni, vedere Usare SSH con HDInsight.

Le credenziali dell'endpoint HTTP sono le credenziali utente HTTP configurate per il cluster HDInsight. Le credenziali dell'endpoint SSH sono le credenziali SSH configurate per il cluster HDInsight.

Risoluzione dei problemi

Vedere Risolvere i problemi di installazione.

Passaggi successivi