Čo je sémantické prepojenie?

Sémantické prepojenie je funkcia, ktorá umožňuje vytvoriť spojenie medzi sémantickými modelmi a službou Synapse Data Science v službe Microsoft Fabric. Používanie sémantických prepojení je podporované len v službe Microsoft Fabric.

Pre službu Spark 3.4 a vyššiu je sémantické prepojenie k dispozícii v predvolenom režime runtime pri použití služby Fabric a nie je potrebné ho nainštalovať. Ak používate Spark 3.3 alebo nižšie, alebo ak chcete aktualizovať na najnovšiu verziu sémantického prepojenia, môžete spustiť príkaz:

%pip install -U semantic-link

Hlavným cieľom sémantického prepojenia je uľahčiť pripájanie údajov, umožniť šírenie sémantických informácií a bezproblémovo sa integrovať s vytvorenými nástrojmi používanými dátovými vedcami, ako sú poznámkové bloky. sémantické prepojenie pomáha zachovať znalosti domény o sémantike údajov štandardizovaným spôsobom, ktorý môže urýchliť analýzu údajov a znížiť chyby.

Tok údajov začína sémantickými modelmi, ktoré obsahujú údaje a sémantické informácie. Sémantické prepojenie spája priepasť medzi Power BI a prostredím dátovej vedy.

Diagram znázorňujúci tok údajov zo služby Power BI do poznámkových blokov v službe Synapse Data Science a späť do služby Power BI.

So sémantickým prepojením môžete pomocou sémantických modelov zo služby Power BI v prostredí dátovej vedy vykonávať úlohy, ako je napríklad hĺbková štatistická analýza a prediktívne modelovanie s technikami strojového učenia. Výstup vašej práce v dátovej vede je možné uložiť do služby OneLake pomocou Apache Spark a požitia do Power BI pomocou Direct Lake.

Pripojenie k službe Power BI

Sémantické modely slúžia ako jeden tabuľkový objektový model, ktorý poskytuje spoľahlivý zdroj pre sémantické definície, ako sú napríklad mierky Power BI. Pripojenie k sémantickým modelom:

  • Sémantické prepojenie ponúka pripojenie k údajom do ekosystému Pandas jazyka Python prostredníctvom knižnice SemPy Python, čím sa dátovým vedcom uľahčí práca s údajmi.
  • Sémantické prepojenie poskytuje prístup k sémantickým modelom prostredníctvom natívneho konektora Spark pre dátových vedcov, ktorí sú viac oboznámení s ekosystémom Apache Spark . Táto implementácia podporuje rôzne jazyky vrátane PySparku, Spark SQL, R a Scala.

Aplikácie sémantických informácií

Sémantické informácie v údajoch zahŕňajú kategórie údajov služby Power BI, ako sú adresa a PSČ, vzťahy medzi tabuľkami a hierarchické informácie. Tieto kategórie údajov zahŕňajú metaúdaje, ktoré sa sémantické prepojenie šíri do prostredia dátovej vedy, aby bolo možné vytvárať nové prostredia a udržiavať pôvod údajov. Príklady aplikácií sémantických prepojení:

  • Inteligentné návrhy vstavaných sémantických funkcií.
  • Inovatívna integrácia na rozšírenie údajov s mierkami Power BI pomocou doplnkových mierok.
  • Nástroje na overenie kvality údajov na základe vzťahov medzi tabuľkami a funkčných závislostí v tabuľkách.

Sémantické prepojenie je výkonný nástroj, ktorý podnikovým analytikom umožňuje efektívne používať údaje v komplexnom prostredí dátovej vedy. Sémantické prepojenie uľahčuje bezproblémovú spoluprácu medzi dátovými vedcami a obchodnými analytikmi tým, že eliminuje potrebu opätovného prepojenia obchodnej logiky zahrnutej v mierkach služby Power BI. Tento prístup zaručuje, že obe strany môžu pracovať efektívne a produktívne a maximalizovať potenciál svojich prehľadov založených na údajoch.

FabricDataFrame štruktúra údajov

FabricDataFrame je základná štruktúra údajov sémantického prepojenia. Podtriedy pandas DataFrame a pridáva metaúdaje, ako sú sémantické informácie a pôvod. FabricDataFrame je primárna štruktúra údajov, ktorá sémantické prepojenie používa na šírenie sémantických informácií zo sémantických modelov do prostredia Data Science.

Diagram znázorňujúci tok údajov z konektorov do sémantických modelov do prvku FabricDataFrame a sémantických funkcií.

FabricDataFrame podporuje všetky operácie pandas a mnoho ďalšieho. Sprístupňuje sémantické funkcie a metódu doplnku , ktorá vám umožňuje používať mierky Power BI vo vašej práci v dátovej vede.