Spark on HDInsight mit DirectQuerySpark on HDInsight with DirectQuery

Spark on Azure HDInsight mit DirectQuery ermöglicht es Ihnen, dynamische Berichte auf Basis von Daten und Metriken zu erstellen, die bereits im Spark-Cluster verfügbar sind.Spark on Azure HDInsight with DirectQuery allows you to create dynamic reports based on data and metric you already have in your Spark cluster. Mit DirectQuery werden Abfragen zurück zum Azure HDInsight Spark-Cluster gesendet, während Sie die Daten in der Berichtsansicht untersuchen.With DirectQuery, queries are sent back to your Azure HDInsight Spark cluster as you explore the data in the report view. Diese Variante wird für Benutzer empfohlen, die mit den Entitäten vertraut sind, mit denen die Verbindung hergestellt wird.This experience is suggested for users who are familiar with the entities they connect to.

Warnung

Die automatische Aktualisierung von Kacheln wurde für auf Grundlage von Spark-Datasets erstellte Dashboardkacheln deaktiviert.Automatic tile refresh has been disabled for dashboard tiles built on Spark based datasets. Mit der Option Dashboardkacheln aktualisieren können Sie die Kacheln manuell aktualisieren.You can select Refresh Dashboard Tiles to refresh manually. Berichte sind hiervon nicht betroffen und sollten auf dem neuesten Stand bleiben.Reports are not impacted and should remain up-to-date.

Sie können die folgenden Schritte ausführen, um mithilfe von DirectQuery im Power BI-Dienst eine Verbindung mit der Spark on Azure HDInsight-Datenquelle herzustellen.You can use the following steps to connect to your Spark on Azure HDInsight data source using DirectQuery within the Power BI service.

  1. Wählen Sie unten im linken Navigationsbereich Daten abrufen aus.Select Get Data at the bottom of the left navigation pane.

  2. Wählen Sie Datenbanken und mehr aus.Select Databases & More.

  3. Wählen Sie den Connector Spark auf HDInsight und anschließend Verbindenaus.Select the Spark on HDInsight connector and choose Connect.

  4. Geben Sie den Namen des Servers ein, zu dem eine Verbindung hergestellt werden soll, sowie Ihren Benutzernamen und das Kennwort.Enter the name of the server you want to connect to, as well as your username and password. Der Server erscheint immer in der Form „<Clustername>.azurehdinsight.net“. Weitere Informationen zum Suchen dieser Werte finden Sie unten.The server is always in the form <clustername>.azurehdinsight.net, see more details about finding these values below.

  5. Nachdem die Verbindung hergestellt ist, sehen Sie ein neues Dataset mit dem Namen „SparkDataset“.Once connected, you'll see a new dataset with named “SparkDataset”. Sie können auf das Dataset auch über die erstellte Platzhalterkachel zugreifen.You can also access the dataset through the placeholder tile that is created.

  6. Beim Drilldown in das Dataset können Sie alle Tabellen und Spalten in der Datenbank durchsuchen.Drilling into the dataset, you can explore all of the tables and columns in your database. Wenn Sie eine Spalte auswählen, wird eine Abfrage zurück an die Quelle gesendet, wodurch Ihre Visualisierung dynamisch erstellt wird.Selecting a column will send a query back to the source, dynamically creating your visual. Diese Visualisierungen können in einem neuen Bericht gespeichert und wieder auf Ihrem Dashboard angeheftet werden.These visuals can be saved in a new report, and pinned back to your dashboard.

Suchen von Spark auf HDInsight-ParameternFinding your Spark on HDInsight parameters

Der Server besitzt immer die Form „<Clustername>.azurehdinsight.net“ und steht im Azure-Portal.The server is always in the form <clustername>.azurehdinsight.net, and can be found in the Azure portal.

Benutzername und Kennwort finden Sie ebenfalls im Azure-Portal.The username and password can also be found in the Azure portal.

EinschränkungenLimitations

Diese Einschränkungen und Hinweise können sich ändern, da wir die Benutzeroberfläche fortlaufend optimieren.These restrictions and notes may change as we continue to improve the experiences. Zusätzliche Dokumentation finden Sie unter Verwenden von BI-Tools mit Apache Spark für Azure HDInsight.Additional documentation can be found at Use BI tools with Apache Spark on Azure HDInsight

  • Der Power BI-Dienst unterstützt nur eine Konfiguration, die Spark 2.0 und HDInsights 3.5 umfasst.The Power BI service only supports a configuration of Spark 2.0 and HDInsight 3.5.
  • Durch jede Aktion, wie z. B. das Auswählen einer Spalte oder das Hinzufügen eines Filters, wird eine Abfrage an die Datenbank gesendet – bevor Sie sehr große Felder auswählen, sollten Sie einen geeigneten Visualisierungstyp wählen.Every action such as selecting a column or adding a filter will send a query back to the database – before selecting very large fields, consider choosing an appropriate visual type.
  • Q&A steht für DirectQuery-Datasets nicht zur Verfügung.Q&A is not available for DirectQuery datasets.
  • Schemaänderungen werden nicht automatisch übernommen.Schema changes are not picked up automatically.
  • Power BI unterstützt 16.000 Spalten für alle Tabellen insgesamt in einem Dataset.Power BI supports 16,000 columns across all tables within a dataset. Power BI enthält außerdem eine interne Zeilennummernspalte pro Tabelle.Power BI also includes an internal row number column per table. Dies bedeutet, dass 15.900 Spalten verfügbar sind, wenn das Dataset 100 Tabellen enthält.This means if you have 100 tables in the dataset, the available number of columns would be 15,900. Abhängig vom Umfang der Daten aus der Spark-Datenquelle, mit denen Sie arbeiten, kann diese Einschränkung zur Wirkung kommen.Depending on the amount of data you are working with from your Spark data source, you may encounter this limitation.

ProblembehandlungTroubleshooting

Wenn Probleme beim Ausführen von Abfragen gegen Ihr Cluster auftreten, stellen Sie sicher, dass die Anwendung weiterhin ausgeführt wird, und starten Sie sie bei Bedarf neu.If you're hitting issues executing queries against your cluster, verify the application is still running and restart if necessary.

Sie können im Azure-Portal unter Konfiguration > Cluster skalieren auch zusätzliche Ressourcen zuordnen:You can also allocate additional resources within the Azure portal under Configuration > Scale Cluster:

Nächste SchritteNext steps

Erste Schritte: Erstellen eines Apache Spark-Clusters für HDInsight (Linux) und Ausführen von interaktiven Abfragen per Spark-SQLGet started: Create Apache Spark cluster on HDInsight Linux and run interactive queries using Spark SQL
Erste Schritte mit Power BIGet started with Power BI
Abrufen von Daten in Power BIGet Data for Power BI
Weitere Fragen?More questions? Wenden Sie sich an die Power BI-CommunityTry the Power BI Community