Share via


O que é o link semântico?

O Link Semântico é um recurso que permite estabelecer uma conexão entre os modelos semânticos e a Ciência de Dados do Synapse no Microsoft Fabric. O uso do Link Semântico só é compatível com o Microsoft Fabric.

Para o Spark 3.4 e superior, o link semântico está disponível no runtime padrão ao usar o Fabric e não há necessidade de instalá-lo. Se você estiver usando o Spark 3.3 ou inferior, ou se quiser atualizar para a versão mais recente do link semântico, poderá executar o comando:

%pip install -U semantic-link

Os principais objetivos do Link Semântico são facilitar a conectividade de dados, permitir a propagação de informações semânticas e integrar-se perfeitamente às ferramentas conhecidas usadas pelos cientistas de dados, como os notebooks. O Link Semântico ajuda você a preservar o conhecimento do domínio sobre a semântica dos dados de forma padronizada que pode acelerar a análise de dados e reduzir erros.

O fluxo de dados começa com modelos semânticos que contêm dados e informações semânticas. O Link Semântico faz a ponte entre o Power BI e a experiência de Ciência de Dados.

Um diagrama que mostra o fluxo de dados do Power BI para blocos de anotações no Synapse Data Science e de volta para o Power BI.

Com o Link Semântico, você pode usar modelos semânticos do Power BI na experiência de Ciência de Dados para executar tarefas como análise estatística detalhada e modelagem preditiva com técnicas de machine learning. O resultado do trabalho de ciência de dados pode ser armazenada no OneLake usando o Apache Spark e ingerida no Power BI usando o Direct Lake.

Conectividade do Power BI

Os modelos semânticos servem como o único modelo de objeto tabular único, oferecendo uma fonte confiável para definições semânticas, como medidas do Power BI. Para se conectar a modelos semânticos:

  • O Link Semântico oferece conectividade de dados com o ecossistema pandas no Python por meio da biblioteca Python SemPy, facilitando o trabalho dos cientistas de dados.
  • O Link Semântico possibilita o acesso a modelos semânticos por meio do conector nativo do Spark para cientistas de dados que estão mais familiarizados com o ecossistema Apache Spark. Essa implementação é compatível com várias linguagens de programação, incluindo PySpark, Spark SQL, R e Scala.

Aplicativos de informações semânticas

As informações semânticas nos dados incluem categorias de dados do Power BI, como endereço e código postal, relações entre tabelas e informações hierárquicas. Essas categorias de dados incluem metadados propagados pelo Link Semântico no ambiente de Ciência de Dados para permitir novas experiências e manter a linhagem de dados. Alguns exemplos de aplicativos do Link Semântico são:

O Link Semântico é uma ferramenta poderosa que permite que os analistas de negócios usem dados de forma eficaz em um ambiente amplo de ciência de dados. O Link Semântico facilita a colaboração entre cientistas de dados e analistas de negócios, eliminando a necessidade de reimplementar a lógica de negócios incorporada nas medidas do Power BI. Essa abordagem garante que ambas as partes possam trabalhar de forma eficiente e produtiva, maximizando o potencial dos insights orientados por dados.

Estrutura de dados do FabricDataFrame

O FabricDataFrame é a principal estrutura de dados do Link Semântico. Ele subclassifica o pandas DataFrame e adiciona metadados, como informações semânticas e de linhagem. O FabricDataFrame é a estrutura de dados primária que o Link Semântico usa para propagar informações semânticas de modelos semânticos para o ambiente de Ciência de Dados.

Um diagrama que mostra o fluxo de dados de conectores para modelos semânticos para FabricDataFrame para funções semânticas.

O FabricDataFrame é compatível com todas as operações pandas e muito mais. Ele expõe funções semânticas e o método add-measure que permitem que você use medidas do Power BI em seu trabalho de ciência de dados.