O que é link semântico?
O link semântico é um recurso que permite estabelecer uma conexão entre modelos semânticos e o Synapse Data Science no Microsoft Fabric. O uso de link semântico só é suportado no Microsoft Fabric.
Para o Spark 3.4 e superior, o link semântico está disponível no tempo de execução padrão ao usar o Fabric e não há necessidade de instalá-lo. Se você estiver usando o Spark 3.3 ou inferior, ou se quiser atualizar para a versão mais recente do Link Semântico, poderá executar o comando:
%pip install -U semantic-link
Os principais objetivos do link semântico são facilitar a conectividade de dados, permitir a propagação de informações semânticas e integrar-se perfeitamente com ferramentas estabelecidas usadas por cientistas de dados, como notebooks. O link semântico ajuda você a preservar o conhecimento do domínio sobre semântica de dados de uma forma padronizada que pode acelerar a análise de dados e reduzir erros.
Visão geral do link semântico
O fluxo de dados começa com modelos semânticos que contêm dados e informações semânticas. A ligação semântica preenche a lacuna entre o Power BI e a experiência de Ciência de Dados.
Com o link semântico, você pode usar modelos semânticos do Power BI na experiência em Ciência de Dados para executar tarefas como análise estatística aprofundada e modelagem preditiva com técnicas de aprendizado de máquina. A saída do seu trabalho de ciência de dados pode ser armazenada no OneLake usando o Apache Spark e ingerida no Power BI usando o Direct Lake.
Conectividade do Power BI
Os modelos semânticos servem como o modelo de objeto tabular único, fornecendo uma fonte confiável para definições semânticas, como medidas do Power BI. Para conectar-se a modelos semânticos:
- O link semântico oferece conectividade de dados para o ecossistema Python pandas através da biblioteca Python SemPy, facilitando o trabalho dos cientistas de dados com os dados.
- O link semântico fornece acesso a modelos semânticos por meio do conector nativo do Spark para cientistas de dados que estão mais familiarizados com o ecossistema do Apache Spark. Esta implementação suporta várias linguagens, incluindo PySpark, Spark SQL, R e Scala.
Aplicações da informação semântica
As informações semânticas nos dados incluem categorias de dados do Power BI, como endereço e código postal, relações entre tabelas e informações hierárquicas. Essas categorias de dados compreendem metadados que o link semântico se propaga no ambiente de Ciência de Dados para permitir novas experiências e manter a linhagem de dados. Alguns exemplos de aplicações de ligação semântica são:
- Sugestões inteligentes de funções semânticas integradas.
- Integração inovadora para aumentar dados com medidas do Power BI através do uso de medidas adicionais.
- Ferramentas para validação da qualidade de dados com base nas relações entre tabelas e dependências funcionais dentro de tabelas.
O link semântico é uma ferramenta poderosa que permite que os analistas de negócios usem dados de forma eficaz em um ambiente abrangente de ciência de dados. O link semântico facilita a colaboração perfeita entre cientistas de dados e analistas de negócios, eliminando a necessidade de reimplementar a lógica de negócios incorporada nas medidas do Power BI. Essa abordagem garante que ambas as partes possam trabalhar de forma eficiente e produtiva, maximizando o potencial de seus insights orientados por dados.
FabricDataFrame
Estrutura de dados
FabricDataFrame é a estrutura de dados principal do link semântico. Ele subclasses o DataFrame pandas e adiciona metadados, como informações semânticas e linhagem. FabricDataFrame é a estrutura de dados primária que o link semântico usa para propagar informações semânticas de modelos semânticos para o ambiente de Ciência de Dados.
O FabricDataFrame suporta todas as operações de pandas e muito mais. Ele expõe funções semânticas e o método add-measure que permitem que você use medidas do Power BI em seu trabalho de ciência de dados.
Conteúdos relacionados
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários