Freigeben über


Semantische Datenverteilung aus semantischen Modellen

Wenn Sie ein semantisches Modell in ein FabricDataFrame einlesen, werden semantische Informationen wie Metadaten und Anmerkungen aus dem semantischen Modell automatisch an FabricDataFrame angefügt. In diesem Artikel erfahren Sie, wie die SemPy-Python-Bibliothek Anmerkungen erhält, die an die Tabellen und Spalten Ihres semantischen Modells angefügt sind.

Semantische Verteilung für Pandas-Benutzer

Die SemPy Python-Bibliothek ist Teil des Semantic Link-Funktionen und dient Pandas-Benutzern. SemPy unterstützt die Vorgänge, mit denen Pandas Sie Ihre Daten bearbeiten lässt. Darüber hinaus ermöglicht es Ihnen SemPy, semantische Daten aus semantischen Modellen, an denen Sie arbeiten, zu verteilen. Durch die Verteilung semantischer Daten können Sie Anmerkungen beibehalten, die an Tabellen und Spalten im semantischen Modell angefügt sind, wenn Sie Vorgänge wie Aufspaltungen, Zusammenführungen und Verkettungen ausführen.

Sie können eine FabricDataFrame-Datenstruktur auf eine von zwei Arten erstellen: Sie können eine Tabelle oder die Ausgabe eines Measures aus einem semantischen Modell in einen FabricDataFrame einlesen. Alternativ können Sie In-Memory-Daten verwenden, um FabricDataFrame zu erstellen, genau wie bei Pandas DataFrames.

  • Wenn Sie aus einem semantischen Modell in ein FabricDataFrame lesen, werden die Metadaten von Power BI automatisch mit FabricDataFrame hydratisiert. Anders ausgedrückt werden die semantischen Informationen aus den Tabellen oder Measures des semantischen Modells im FabricDataFrame beibehalten.
  • Wenn Sie einen FabricDataFrame aus Speicherdaten erstellen, müssen Sie den Namen eines semantischen Modells angeben, aus dem FabricDataFrame Metadateninformationen abrufen kann.

Wie semantische Daten erhalten werden, hängt von mehreren Faktoren ab, z. B. den Vorgängen, die Sie ausführen, und der Reihenfolge der FabricDataFrames, an denen Sie arbeiten.

Semantische Verteilung bei Zusammenführung

Wenn Sie zwei FabricDataFrames zusammenführen, bestimmt die Reihenfolge der DataFrames, wie semantische Informationen weitergegeben werden.

  • Wenn beide FabricDataFrames kommentiertsind, haben die Metadaten auf Tabellenebene des linken FabricDataFrame Vorrang. Die gleiche Regel gilt für einzelne Spalten. Die Spaltenanmerkungen, die im linken FabricDataFrame vorhanden sind, haben Vorrang vor den Spaltenanmerkungen im rechten.
  • Wenn nur ein FabricDataFrame kommentiertist, werden dessen Metadaten verwendet. Die gleiche Regel gilt für einzelne Spalten. Die Spaltenanmerkungen, die im kommentierten FabricDataFrame vorhanden sind, werden verwendet.

Semantische Verteilung bei Verkettung

Wenn Sie eine Verkettung für mehrere FabricDataFrames durchführen, kopiert SemPy für jede Spalte die Metadaten aus dem ersten FabricDataFrame, der dem Spaltennamen entspricht. Wenn mehrere Übereinstimmungen vorhanden sind und die Metadaten nicht identisch sind, wird eine Warnung ausgegeben.

Sie können auch Verkettungen von FabricDataFrames mit regulären Pandas DataFrames verteilen, indem Sie den FabricDataFrame an erster Stelle anordnen.

Semantische Verteilung für Spark-Benutzer

Der native Spark-Connector von Semantic Link hydratisiert (oder füllt) das Metadaten-Wörterbuch einer Spark-Spalte auf. Derzeit ist die Unterstützung für die semantische Verteilung begrenzt und unterliegt der internen Implementierung der Weitergabe von Schemainformationen von Spark. Beispielsweise werden die Metadaten bei der Spaltenaggregation entfernt.