Partilhar via


O que é link semântico?

O link semântico é um recurso que permite estabelecer uma conexão entre modelos semânticos e o Synapse Data Science no Microsoft Fabric. O uso de link semântico só é suportado no Microsoft Fabric.

Para o Spark 3.4 e superior, o link semântico está disponível no tempo de execução padrão ao usar o Fabric e não há necessidade de instalá-lo. Se você estiver usando o Spark 3.3 ou inferior, ou se quiser atualizar para a versão mais recente do Link Semântico, poderá executar o comando:

%pip install -U semantic-link

Os principais objetivos do link semântico são facilitar a conectividade de dados, permitir a propagação de informações semânticas e integrar-se perfeitamente com ferramentas estabelecidas usadas por cientistas de dados, como notebooks. O link semântico ajuda você a preservar o conhecimento do domínio sobre semântica de dados de uma forma padronizada que pode acelerar a análise de dados e reduzir erros.

O fluxo de dados começa com modelos semânticos que contêm dados e informações semânticas. A ligação semântica preenche a lacuna entre o Power BI e a experiência de Ciência de Dados.

Um diagrama que mostra o fluxo de dados do Power BI para blocos de anotações no Synapse Data Science e de volta para o Power BI.

Com o link semântico, você pode usar modelos semânticos do Power BI na experiência em Ciência de Dados para executar tarefas como análise estatística aprofundada e modelagem preditiva com técnicas de aprendizado de máquina. A saída do seu trabalho de ciência de dados pode ser armazenada no OneLake usando o Apache Spark e ingerida no Power BI usando o Direct Lake.

Conectividade do Power BI

Os modelos semânticos servem como o modelo de objeto tabular único, fornecendo uma fonte confiável para definições semânticas, como medidas do Power BI. Para conectar-se a modelos semânticos:

  • O link semântico oferece conectividade de dados para o ecossistema Python pandas através da biblioteca Python SemPy, facilitando o trabalho dos cientistas de dados com os dados.
  • O link semântico fornece acesso a modelos semânticos por meio do conector nativo do Spark para cientistas de dados que estão mais familiarizados com o ecossistema do Apache Spark. Esta implementação suporta várias linguagens, incluindo PySpark, Spark SQL, R e Scala.

Aplicações da informação semântica

As informações semânticas nos dados incluem categorias de dados do Power BI, como endereço e código postal, relações entre tabelas e informações hierárquicas. Essas categorias de dados compreendem metadados que o link semântico se propaga no ambiente de Ciência de Dados para permitir novas experiências e manter a linhagem de dados. Alguns exemplos de aplicações de ligação semântica são:

  • Sugestões inteligentes de funções semânticas integradas.
  • Integração inovadora para aumentar dados com medidas do Power BI através do uso de medidas adicionais.
  • Ferramentas para validação da qualidade de dados com base nas relações entre tabelas e dependências funcionais dentro de tabelas.

O link semântico é uma ferramenta poderosa que permite que os analistas de negócios usem dados de forma eficaz em um ambiente abrangente de ciência de dados. O link semântico facilita a colaboração perfeita entre cientistas de dados e analistas de negócios, eliminando a necessidade de reimplementar a lógica de negócios incorporada nas medidas do Power BI. Essa abordagem garante que ambas as partes possam trabalhar de forma eficiente e produtiva, maximizando o potencial de seus insights orientados por dados.

FabricDataFrame Estrutura de dados

FabricDataFrame é a estrutura de dados principal do link semântico. Ele subclasses o DataFrame pandas e adiciona metadados, como informações semânticas e linhagem. FabricDataFrame é a estrutura de dados primária que o link semântico usa para propagar informações semânticas de modelos semânticos para o ambiente de Ciência de Dados.

Um diagrama que mostra o fluxo de dados de conectores para modelos semânticos para FabricDataFrame para funções semânticas.

O FabricDataFrame suporta todas as operações de pandas e muito mais. Ele expõe funções semânticas e o método add-measure que permitem que você use medidas do Power BI em seu trabalho de ciência de dados.