Share via


セマンティック リンクとは

セマンティック リンクは、Microsoft Fabric でセマンティック モデルと Synapse Data Science の間の接続を確立できる機能です。 セマンティック リンクの使用は、Microsoft Fabric でのみサポートされています。

Spark 3.4 以降では、Fabric を使用する場合、セマンティック リンクは既定のランタイムで使用でき、インストールする必要はありません。 Spark 3.3 以前を使用している場合、またはセマンティック リンクの最新バージョンに更新する場合は、次のコマンドを実行できます。

%pip install -U semantic-link

セマンティック リンクの主な目標は、データ接続を容易にし、セマンティック情報の伝達を可能にして、データ サイエンティストが使用する確立されたツール (ノートブックなど) とシームレスに統合することです。 セマンティック リンクを使用すると、標準化された方法で、データ セマンティクスに関するドメイン知識を保持することができ、これによってデータ分析を高速化してエラーを減らすことができます。

データ フローは、データとセマンティック情報を含むセマンティック モデルから始まります。 セマンティック リンクは、Power BI と Data Science エクスペリエンスの間のギャップを埋めます。

Power BI から Synapse Data Science のノートブックへのデータ フローと Power BI へ戻るデータ フローを示す図。

セマンティック リンクを使用すると、Data Science エクスペリエンスで Power BI のセマンティック モデルを使用して、詳細な統計分析や機械学習手法を使用した予測モデリングなどのタスクを実行できます。 データ サイエンス作業の出力は、Apache Spark を使用して OneLake に保存したり、Direct Lake を使用して Power BI に取り込んだりすることができます。

Power BI 接続

セマンティック モデルは、単一の表形式オブジェクト モデルとして機能し、Power BI メジャーなど、セマンティック定義の信頼できるソースを提供します。 セマンティック モデルに接続するには、次のようにします。

  • セマンティック リンクは、SemPy Python ライブラリを介して Python pandas エコシステムへのデータ接続を提供し、データ サイエンティストによるデータ処理を容易にします。
  • セマンティック リンクは、Apache Spark エコシステムに精通しているデータ サイエンティスト向けに、Spark ネイティブ コネクタを介してセマンティック モデルへのアクセスを提供します。 この実装では、PySpark、Spark SQL、R、Scala など、さまざまな言語をサポートしています。

セマンティック情報の適用

データ内のセマンティック情報には、住所と郵便番号、テーブル間のリレーションシップ、階層情報など、Power BI のデータ カテゴリが含まれます。 これらのデータ カテゴリは、セマンティック リンクが Data Science 環境に伝達して新しいエクスペリエンスを実現し、データ系列を維持するためのメタデータで構成されます。 セマンティック リンクのいくつかの適用例を次に示します。

  • 組み込みのセマンティック関数のインテリジェントな提案。
  • add-measures を使用して Power BI メジャーでデータを拡張するための革新的な統合。
  • テーブル間のリレーションシップとテーブル内の機能依存関係に基づくデータ品質検証を行うためのツール。

セマンティック リンクは、ビジネス アナリストが包括的なデータ サイエンス環境でデータを効果的に使用できる強力なツールです。 セマンティック リンクを使用すると、Power BI メジャーに埋め込まれたビジネス ロジックを再実装する必要がなくなるため、データ サイエンティストとビジネス アナリストの間のシームレスなコラボレーションが容易になります。 このアプローチにより、両当事者が効率的かつ生産的に作業し、データ主導の分析情報の可能性を最大限に高めることができます。

FabricDataFrame データ構造

FabricDataFrame は、セマンティック リンクのコア データ構造です。 pandas DataFrame をサブクラス化し、セマンティック情報や系列などのメタデータを追加します。 FabricDataFrame は、セマンティック リンクでセマンティック モデルから Data Science 環境にセマンティック情報を伝達するために使われる主要なデータ構造です。

コネクタからセマンティック モデル、FabricDataFrame、セマンティック関数へのデータ フローを示す図。

FabricDataFrame では、すべての pandas 操作とその他の操作がサポートされます。 データ サイエンス作業で Power BI メジャーを使用できるようにするセマンティック関数と add-measure メソッドが公開されます。