Compartilhar via


Descobrir, conectar e explorar dados no Synapse usando o Microsoft Purview

Neste documento, você aprenderá os tipos de interações que poderá realizar ao registrar uma conta do Microsoft Purview no Synapse.

Pré-requisitos

Usar o Microsoft Purview no Synapse

O uso do Microsoft Purview no Synapse exige que você tenha acesso a essa conta do Microsoft Purview. O Synapse passa pela permissão do Microsoft Purview. Por exemplo, se você tiver uma função de permissão de curador, poderá editar metadados verificados pelo Microsoft Purview.

Descoberta de dados: conjuntos de dados de pesquisa

Para descobrir os dados registrados e verificados pelo Microsoft Purview, você poderá usar a barra de pesquisa na parte superior central do workspace do Synapse. Selecione o Microsoft Purview para pesquisar todos os dados da sua organização.

Pesquisar ativos do Microsoft Purview

Ações do Microsoft Purview

Abaixo, é apresentada uma lista dos recursos do Microsoft Purview que estão disponíveis no Synapse:

  • Visão geral dos metadados.
  • Exibir e editar o esquema dos metadados com classificações, termos de glossário, tipos de dados e descrições.
  • Exibir linhagem de dados para entender as dependências e fazer a análise de impacto. Para obter mais informações, confira linhagem de dados.
  • Exibir e editar Contatos para saber quem é um proprietário ou especialista em um conjuntos de dados.
  • Relacionar para entender as dependências hierárquicas de um conjuntos de dados específico. Essa experiência ajuda você a navegar pela hierarquia de dados.
  • Clique em Solicitar acesso para solicitar acesso aos dados acionando o fluxo de trabalho de acesso a dados de autoatendimento configurado pelo Administrador de fluxo de trabalho no Microsoft Purview. Para obter mais informações, consulte Solicitar acesso e fluxo de trabalho de acesso a dados de autoatendimento.

Ações que você pode executar nos conjuntos de dados com recursos do Synapse

Conectar dados ao Synapse

  • Você pode criar um novo serviço vinculado para o Synapse. Essa ação será necessária para copiar dados para o Synapse ou tê-los no hub de dados (para fontes de dados com suporte, como ADLSg2)
  • Para objetos como arquivos, pastas e tabelas, você pode criar diretamente um novo conjunto de dados de integração e utilizar um serviço vinculado existente, se já tiver sido criado

Ainda não podemos inferir se há um conjunto de dados de uma integração ou um serviço vinculado existente.

 Desenvolver no Synapse

Há três ações que você pode executar: Novo script SQL, Novo notebook e Novo fluxo de dados.

Dependendo do tipo de suporte, o Novo script SQL permite o seguinte:

  • Exibir as 100 principais linhas para entender a forma dos dados.
  • Criar uma tabela externa a partir do banco de dados SQL do Synapse.
  • Carregar os dados em um banco de dados SQL do Synapse.

O Novo notebook permite:

  • Carregar dados em um DataFrame do Spark
  • Criar uma tabela do Spark (se você usar o formato Parquet para isso, ele também criará uma tabela de pools de SQL sem servidor).

O Novo fluxo de dados permite criar um conjunto de dado de integração que pode ser usado como uma origem em um pipeline de fluxo de dados. O fluxo de dados é uma funcionalidade de desenvolvedor sem código para executar a transformação de dados. Saiba mais sobre como usar o fluxo de dados no Synapse.

 Próximas etapas