Spark in HDInsight con DirectQuerySpark on HDInsight with DirectQuery

Spark in Azure HDInsight con DirectQuery consente di creare report dinamici basati su dati e metriche già presenti nel cluster di Spark.Spark on Azure HDInsight with DirectQuery allows you to create dynamic reports based on data and metric you already have in your Spark cluster. Con DirectQuery le query vengono inviate nuovamente al cluster Spark di Azure HDInsight durante l'esplorazione dei dati nella visualizzazione report.With DirectQuery, queries are sent back to your Azure HDInsight Spark cluster as you explore the data in the report view. Si tratta di un'esperienza consigliata per gli utenti che hanno familiarità con le entità cui si connettono.This experience is suggested for users who are familiar with the entities they connect to.

Avviso

L'aggiornamento automatico dei riquadri è stato disabilitato per i riquadri del dashboard basati su set di dati basati su Spark.Automatic tile refresh has been disabled for dashboard tiles built on Spark based datasets. È possibile selezionare Aggiorna riquadri del dashboard per eseguire manualmente l'aggiornamento.You can select Refresh Dashboard Tiles to refresh manually. I report non sono interessati e dovrebbero rimanere aggiornati.Reports are not impacted and should remain up-to-date.

La procedura seguente consente di connettersi all'origine dati Spark in Azure HDInsight usando DirectQuery all'interno del servizio Power BI.You can use the following steps to connect to your Spark on Azure HDInsight data source using DirectQuery within the Power BI service.

  1. Selezionare Recupera dati nella parte inferiore del riquadro di spostamento sinistro.Select Get Data at the bottom of the left navigation pane.

  2. Selezionare Database e altro.Select Databases & More.

  3. Selezionare il connettore di Spark in HDInsight e scegliere Connetti.Select the Spark on HDInsight connector and choose Connect.

  4. Immettere il nome del server a cui connettersi, oltre a nome utente e password.Enter the name of the server you want to connect to, as well as your username and password. Il formato del nome del server è sempre <nomecluster>.azurehdinsight.net. Per altre informazioni su come trovare questi valori, vedere di seguito.The server is always in the form <clustername>.azurehdinsight.net, see more details about finding these values below.

  5. Dopo la connessione verrà visualizzato un nuovo set di dati denominato "SparkDataset".Once connected, you'll see a new dataset with named “SparkDataset”. È anche possibile accedere al set di dati attraverso il riquadro segnaposto creato.You can also access the dataset through the placeholder tile that is created.

  6. Esaminando il set di dati è possibile esplorare tutte le tabelle e le colonne presenti nel database.Drilling into the dataset, you can explore all of the tables and columns in your database. Selezionando una colonna verrà inviata una query all'origine e verrà quindi creato dinamicamente l'oggetto visivo.Selecting a column will send a query back to the source, dynamically creating your visual. Gli oggetti visivi possono essere salvati in un nuovo report e riaggiunti al dashboard.These visuals can be saved in a new report, and pinned back to your dashboard.

Ricerca dei parametri di Spark in HDInsightFinding your Spark on HDInsight parameters

Il formato del nome del server è sempre <nomecluster>.azurehdinsight.net e il nome è presente nel portale di Azure.The server is always in the form <clustername>.azurehdinsight.net, and can be found in the Azure portal.

Anche nome utente e password sono indicati nel portale di Azure.The username and password can also be found in the Azure portal.

LimitazioniLimitations

Queste restrizioni e note possono cambiare dal momento che le esperienze vengono costantemente migliorate.These restrictions and notes may change as we continue to improve the experiences. Per altra documentazione, vedere Usare gli strumenti di Business Intelligence con Apache Spark in HDInsightAdditional documentation can be found at Use BI tools with Apache Spark on Azure HDInsight

  • Il servizio Power BI supporta solo una configurazione di Spark 2.0 e HDInsight 3.5.The Power BI service only supports a configuration of Spark 2.0 and HDInsight 3.5.
  • Ogni azione, ad esempio la selezione di una colonna o l'aggiunta di un filtro invierà una query al database. Prima di selezionare i campi di dimensioni molto ampie, è consigliabile scegliere un tipo di elemento visivo appropriato.Every action such as selecting a column or adding a filter will send a query back to the database – before selecting very large fields, consider choosing an appropriate visual type.
  • La funzione Domande e risposte non è disponibile per i set di dati di DirectQuery.Q&A is not available for DirectQuery datasets.
  • Le modifiche allo schema non vengono selezionate automaticamente.Schema changes are not picked up automatically.
  • Power BI supporta 16.000 colonne in tutte le tabelle all'interno di un set di dati.Power BI supports 16,000 columns across all tables within a dataset. Power BI include anche una colonna dei numeri di riga interna per tabella.Power BI also includes an internal row number column per table. In questo modo, se nel set di dati sono presenti 100, il numero di colonne disponibili è 15.900.This means if you have 100 tables in the dataset, the available number of columns would be 15,900. A seconda della quantità di dati in uso dall'origine dati Spark, è possibile che si raggiunga questo limite.Depending on the amount of data you are working with from your Spark data source, you may encounter this limitation.

Risoluzione dei problemiTroubleshooting

Se si riscontrano problemi durante l'esecuzione di query sul cluster, verificare che l'applicazione sia ancora in esecuzione e riavviarla se necessario.If you're hitting issues executing queries against your cluster, verify the application is still running and restart if necessary.

È anche possibile allocare risorse aggiuntive nel portale di Azure in Configurazione > Ridimensiona cluster:You can also allocate additional resources within the Azure portal under Configuration > Scale Cluster:

Passaggi successiviNext steps

Introduzione: creare un cluster Apache Spark in HDInsight Linux ed eseguire query interattive usando SQL SparkGet started: Create Apache Spark cluster on HDInsight Linux and run interactive queries using Spark SQL
Introduzione a Power BIGet started with Power BI
Recuperare dati per Power BIGet Data for Power BI
Altre domande?More questions? Provare la community di Power BITry the Power BI Community