Installare e usare Presto nei cluster HDInsight HadoopInstall and use Presto on HDInsight Hadoop clusters

In questo argomento si apprenderà come installare Presto nei cluster HDInsight Hadoop usando le azioni di script.In this topic, you learn how to install Presto on HDInsight Hadoop clusters by using Script Action. Si apprenderà anche come installare Airpal in un cluster HDInsight Presto esistente.You also learn how to install Airpal on an existing Presto HDInsight cluster.

Importante

I passaggi descritti in questo documento richiedono un cluster HDInsight 3.5 Hadoop che usa Linux.The steps in this document require an HDInsight 3.5 Hadoop cluster that uses Linux. Linux è l'unico sistema operativo usato in HDInsight versione 3.4 o successiva.Linux is the only operating system used on HDInsight version 3.4 or greater. Per altre informazioni, vedere Versioni di HDInsight.For more information, see HDInsight versions.

Che cos'è Presto?What is Presto?

Presto è un motore di query SQL distribuito veloce per Big Data.Presto is a fast distributed SQL query engine for big data. Presto è adatto per l'esecuzione di query interattive di petabyte di dati.Presto is suitable for interactive querying of petabytes of data. Per altre informazioni sui componenti di Presto e il relativo funzionamento, vedere Presto concepts (Concetti di Presto).For more information on the components of Presto and how they work together, see Presto concepts.

Avviso

I componenti forniti con il cluster HDInsight sono supportati in modo completo e il Supporto Microsoft contribuirà a isolare e risolvere i problemi correlati a questi componenti.Components provided with the HDInsight cluster are fully supported and Microsoft Support will help to isolate and resolve issues related to these components.

I componenti personalizzati, ad esempio Presto, ricevono un supporto commercialmente ragionevole per semplificare la risoluzione dei problemi.Custom components, such as Presto, receive commercially reasonable support to help you to further troubleshoot the issue. È possibile che si ottenga la risoluzione dei problemi o che venga richiesto di usare i canali disponibili per le tecnologie open source, in cui è possibile ottenere supporto approfondito per la tecnologia specifica.This might result in resolving the issue OR asking you to engage available channels for the open source technologies where deep expertise for that technology is found. È ad esempio possibile ricorrere a molti siti di community, come il forum MSDN per HDInsight o http://stackoverflow.com. Anche per i progetti Apache sono disponibili siti specifici in http://apache.org, ad esempio Hadoop.For example, there are many community sites that can be used, like: MSDN forum for HDInsight, http://stackoverflow.com. Also Apache projects have project sites on http://apache.org, for example: Hadoop.

Installare Presto mediante l'azione di scriptInstall Presto using script action

Questa sezione fornisce istruzioni su come usare lo script di esempio quando si crea un nuovo cluster usando il portale di Azure.This section provides instructions on how to use the sample script when creating a new cluster by using the Azure portal.

  1. Avviare il provisioning di un cluster seguendo i passaggi descritti in Effettuare il provisioning di cluster HDInsight basati su Linux.Start provisioning a cluster by using the steps in Provision Linux-based HDInsight clusters. Assicurarsi di creare il cluster usando il flusso di creazione del cluster personalizzato.Make sure you create the cluster using the Custom cluster creation flow. È necessario assicurarsi che il cluster creato soddisfi i requisiti seguenti.You must ensure that the cluster you create meets the following requirements.

    a.a. Deve essere un cluster Hadoop con HDInsight versione 3.5.It must be a Hadoop cluster with HDInsight version 3.5.

    b.b. Deve usare Archiviazione di Azure come archivio dati.It must use Azure Storage as the data store. L'uso di Presto in un cluster che usa Azure Data Lake Store come opzione di archiviazione non è ancora supportato.Using Presto on a cluster that uses Azure Data Lake Store as the storage option is not yet supported.

    Creazione del cluster HDInsight con opzioni personalizzate

  2. Nel pannello Impostazioni avanzate selezionare Azioni script e specificare le informazioni seguenti:On the Advanced settings blade, select Script Actions, and provide the information below:

    • NOME: immettere un nome descrittivo per l'azione script.NAME: Enter a friendly name for the script action.
    • URI script Bash: https://raw.githubusercontent.com/hdinsight/presto-hdinsight/master/installpresto.shBash script URI: https://raw.githubusercontent.com/hdinsight/presto-hdinsight/master/installpresto.sh
    • HEAD: selezionare questa opzioneHEAD: Check this option
    • RUOLO DI LAVORO: selezionare questa opzioneWORKER: Check this option
    • ZOOKEEPER: deselezionare questa casella di controlloZOOKEEPER: Clear this check box
    • PARAMETRI: lasciare questo campo vuotoPARAMETERS: Leave this field blank
  3. Nella parte inferiore del pannello Azioni script fare clic sul pulsante Seleziona per salvare la configurazione.At the bottom of the Script Actions blade, click the Select button to save the configuration. Infine fare clic sul pulsante Seleziona nella parte inferiore del pannello Impostazioni avanzate per salvare le informazioni relative alla configurazione.Finally, click the Select button at the bottom of the Advanced Settings blade to save the configuration information.

  4. Continuare il provisioning del cluster come descritto nell'argomento relativo all' esecuzione del provisioning di cluster HDInsight basati su Linux.Continue provisioning the cluster as described in Provision Linux-based HDInsight clusters.

    Nota

    Per applicare le azioni script è possibile usare anche Azure PowerShell, l'interfaccia della riga di comando di Azure, HDInsight .NET SDK o i modelli di Azure Resource Manager.Azure PowerShell, the Azure CLI, the HDInsight .NET SDK, or Azure Resource Manager templates can also be used to apply script actions. È anche possibile applicare azioni script a cluster già in esecuzione.You can also apply script actions to already running clusters. Per altre informazioni, vedere Personalizzare cluster HDInsight basati su Linux tramite Azione script.For more information, see Customize HDInsight clusters with Script Actions.

Usare Presto con HDInsightUse Presto with HDInsight

Eseguire i passaggi seguenti per usare Presto in un cluster HDInsight dopo averlo installato con la procedura descritta in precedenza.Perform the following steps to use Presto in an HDInsight cluster after you have installed it using the steps described above.

  1. Connettersi al cluster HDInsight usando SSH:Connect to the HDInsight cluster using SSH:

     ssh USERNAME@CLUSTERNAME-ssh.azurehdinsight.net
    

    Per altre informazioni, vedere Usare SSH con HDInsight.For more information, see Use SSH with HDInsight.

  2. Avviare la shell di Presto usando il comando seguente.Start the Presto shell using the following command.

     presto --schema default
    
  3. Eseguire una query sulla tabella di esempio, hivesampletable, che è disponibile in tutti i cluster HDInsight per impostazione predefinita.Run a query on a sample table, hivesampletable, which is available on all HDInsight clusters by default.

     select count (*) from hivesampletable;
    

    Per impostazione predefinita sono già configurati i connettori Hive e TPCH per Presto.By default, Hive and TPCH connectors for Presto are already configured. Il connettore Hive è configurato per usare l'installazione Hive predefinita, in modo che tutte le tabelle provenienti da Hive diventino automaticamente visibili in Presto.Hive connector is configured to use the default installed Hive installation, so all the tables from Hive will be automatically visible in Presto.

    Per informazioni dettagliate su come è possibile usate Presto, vedere la documentazione su Presto.For a detailed description on how you can use Presto, see Presto documentation.

Usare Airpal con PrestoUse Airpal with Presto

Airpal è un'interfaccia per query basate su Web open source per Presto.Airpal is an open-source web-based query interface for Presto. Per altre informazioni su Airpal, vedere la documentazione su Airpal.For more information on Airpal, see Airpal documentation.

In questa sezione verrà esaminata la procedura per installare Airpal sul nodo perimetrale di un cluster HDInsight Hadoop in cui Presto è già installato.In this section, we look at the steps to install Airpal on the edgenode of an HDInsight Hadoop cluster, that already has Presto installed. Ciò garantisce che l'interfaccia per query Web Airpal sia disponibile su Internet.This ensures that the Airpal web query interface is available over the Internet.

  1. Connettersi tramite SSH al nodo head del cluster HDInsight in cui è installato Presto:Using SSH, connect to the headnode of the HDInsight cluster that has Presto installed:

     ssh USERNAME@CLUSTERNAME-ssh.azurehdinsight.net
    

    Per altre informazioni, vedere Usare SSH con HDInsight.For more information, see Use SSH with HDInsight.

  2. Una volta eseguita la connessione, eseguire il comando seguente.Once you are connected, run the following command.

     sudo slider registry  --name presto1 --getexp presto 
    

    Verrà visualizzato un output simile al seguente:You should see an output like the following:

     {
         "coordinator_address" : [ {
             "value" : "10.0.0.12:9090",
             "level" : "application",
             "updatedTime" : "Mon Apr 03 20:13:41 UTC 2017"
     } ]
    
  3. Nell'output prendere nota del valore per la proprietà value.From the output, note the value for the value property. Sarà necessario durante l'installazione di Airpal nel nodo perimetrale del cluster.You will need this while installing Airpal on the cluster edgenode. Dall'output precedente il valore che sarà necessario è 10.0.0.12:9090.From the output above, the value that you will need is 10.0.0.12:9090.

  4. Usare il modello qui per creare un nodo perimetrale del cluster HDInsight e fornire i valori come illustrato nello screenshot seguente.Use the template here to create an HDInsight cluster edgenode and provide the values as shown in the following screenshot.

    Installazione di HDInsight Airpal nel cluster Presto

  5. Fare clic su Acquista.Click Purchase.

  6. Dopo le modifiche vengono applicate alla configurazione del cluster, è possibile accedere all'interfaccia web Airpal usando la procedura seguente.Once the changes are applied to the cluster configuration, you can access the Airpal web interface by using the following steps.

    a.a. Fare clic su Applicazioni nel pannello del cluster.From the cluster blade, click Applications.

    Avvio di HDInsight Airpal nel cluster Presto

    b.b. Dal pannello App installate fare clic su Portale per Airpal.From the Installed Apps blade, click Portal against airpal.

    Avvio di HDInsight Airpal nel cluster Presto

    c.c. Quando richiesto, immettere le credenziali admin specificate durante la creazione del cluster HDInsight Hadoop.When prompted, enter the admin credentials that you specified while creating the HDInsight Hadoop cluster.

Personalizzare un'installazione Presto nel cluster HDInsightCustomize a Presto installation on HDInsight cluster

Dopo avere installato Presto in un cluster HDInsight Hadoop, è possibile personalizzare l'installazione per apportare modifiche, ad esempio aggiornare le impostazioni della memoria, modificare i connettori e così via. Seguire quindi questa procedura.After you have installed Presto on an HDInsight Hadoop cluster, you can customize the installation to make changes such as update memory settings, change connectors, etc. Perform the following steps to do so.

  1. Connettersi tramite SSH al nodo head del cluster HDInsight in cui è installato Presto:Using SSH, connect to the headnode of the HDInsight cluster that has Presto installed:

     ssh USERNAME@CLUSTERNAME-ssh.azurehdinsight.net
    

    Per altre informazioni, vedere Usare SSH con HDInsight.For more information, see Use SSH with HDInsight.

  2. Apportare le modifiche di configurazione nel file /var/lib/presto/presto-hdinsight-master/appConfig-default.json.Make your configuration changes in the file /var/lib/presto/presto-hdinsight-master/appConfig-default.json. Per altre informazioni sulla configurazione di Presto, vedere Configurazione di Presto per i cluster basati su YARN.For more information on Presto configuration, see Presto configuration for YARN-based clusters.

  3. Arrestare e terminare l'istanza in esecuzione corrente di Presto.Stop and kill the current running instance of Presto.

     sudo slider stop presto1 --force
     sudo slider destroy presto1 --force
    
  4. Avviare una nuova istanza di Presto con la personalizzazione.Start a new instance of Presto with the customization.

    sudo slider create presto1 --template /var/lib/presto/presto-hdinsight-master/appConfig-default.json --resources /var/lib/presto/presto-hdinsight-master/resources-default.json
    
  5. Attendere che la nuova istanza sia pronta e annotare l'indirizzo del coordinatore di Presto.Wait for the new instance to be ready and note presto coordinator address.

   sudo slider registry --name presto1 --getexp presto

Generare dati di benchmark per i cluster HDInsight in cui è in esecuzione PrestoGenerate benchmark data for HDInsight clusters that run Presto

TPC-DS è lo standard del settore per la misurazione delle prestazioni di molti sistemi di supporto decisionale, compresi i sistemi di Big Data.TPC-DS is the industry standard for measuring the performance of many decision support systems, including big data systems. È possibile usare Presto nei cluster HDInsight per generare i dati e confrontarli con i dati di benchmark di HDInsight.You can use Presto on HDInsight clusters to generate data and evaluate how it compares with your own HDInsight benchmark data. Per altre informazioni, vedere qui.For more information, see here.

Vedere ancheSee also

  • Installare e usare Hue nei cluster HDInsight.Install and use Hue on HDInsight clusters. Hue è un'interfaccia utente che semplifica la creazione, l'esecuzione e il salvataggio di processi Pig e Hive, nonché l'esplorazione dell'archivio predefinito per il cluster HDInsight.Hue is a web UI that makes it easy to create, run and save Pig and Hive jobs, as well as browse the default storage for your HDInsight cluster.

  • Installare Giraph in cluster HDInsight.Install Giraph on HDInsight clusters. Usare la personalizzazione cluster per installare Giraph in cluster Hadoop di HDInsight.Use cluster customization to install Giraph on HDInsight Hadoop clusters. Giraph permette di elaborare grafici con Hadoop e può essere usato con Azure HDInsight.Giraph allows you to perform graph processing by using Hadoop, and can be used with Azure HDInsight.

  • Installare Solr in cluster HDInsight.Install Solr on HDInsight clusters. Usare la personalizzazione cluster per installare Solr in cluster Hadoop di HDInsight.Use cluster customization to install Solr on HDInsight Hadoop clusters. Solr consente di eseguire operazioni di ricerca avanzate sui dati archiviati.Solr allows you to perform powerful search operations on stored data.