Azure Data Lake Storage Gen2 conector do Microsoft Graph

O conector Azure Data Lake Storage Gen2 Microsoft Graph permite que os usuários da sua organização pesquisem arquivos armazenados em contas de armazenamento do Armazenamento de Blobs do Azure e do Azure Data Lake Gen 2.

Observação

Leia o artigo Configurar seu conector do Microsoft Graph para entender as instruções gerais de instalação dos conectores.

Este artigo é para qualquer pessoa que configure, execute e monitore um conector Azure Data Lake Storage Gen2. Ele complementa o processo de instalação geral e mostra instruções que se aplicam apenas ao conector Azure Data Lake Storage Gen2. Este artigo também inclui informações sobre Limitações.

No artigo, usamos o Armazenamento do Azure como um termo genérico para Armazenamento de Blobs do Azure e armazenamento do Azure Data Lake Gen 2.

Etapa 1: Adicionar um conector no Centro de administração do Microsoft 365

Adicionar Azure Data Lake Storage Gen2 conector

(Confira instruções de instalação geral para obter mais detalhes)

Etapa 2: nomear a conexão

Siga as instruções de configuração geral.

Etapa 3: configurar as configurações de conexão

Insira seu cadeia de conexão de armazenamento primário. Essa cadeia de caracteres é necessária para permitir o acesso à sua conta de armazenamento. Para localizar seu cadeia de conexão, acesse o portal do Azure e navegue até a seção Chaves da sua conta de Armazenamento do Azure relevante.

Se preferir não fornecer o AccountKey (um parâmetro no cadeia de conexão de armazenamento primário), conceda acesso ao serviço de conectores do Microsoft Graph para as seguintes funções:

  • Leitor de dados de blob de armazenamento
  • Colaborador de dados da fila de armazenamento
  • Delegador de Blobs de Armazenamento

Navegue até a guia Controle de Acesso de sua conta de Armazenamento do Azure e siga as instruções para conceder acesso ao seguinte aplicativo:

  • ID do Aplicativo de Primeira Parte: 56c1da01-2129-48f7-9355-af6d59d42766
  • Nome do aplicativo de primeira parte: Serviço do Conector de Grafo

Notificações de fila e conta de armazenamento (opcional)

O suporte para processar alterações em tempo real no Serviço de Conectores do Graph pode ser adicionado no futuro. Nesse caso, monitoraremos as notificações de alteração do Armazenamento do Azure armazenadas em uma fila. Você precisará criar uma fila na mesma conta que sua conta de Armazenamento do Azure.

Depois de criar uma fila, acesse a guia Eventos na página de fila para configurar a Assinatura de Eventos. Escolha todos os eventos de Blob que a fila receberá e conecte a fila à conta de Armazenamento do Azure.

Testar a conexão

Testar a conexão clicando no botão Testar Conexão

Observação

A Conexão de Teste deve ter êxito antes que você possa passar para a próxima seção de configuração. A conta de armazenamento habilitada para ADLS gen 2 DEVE ter um contêiner E pelo menos um arquivo dentro dele como um mínimo para que a Conexão de Teste tenha êxito. Um erro de conexão será gerado se o conteúdo não existir.

Etapa 4: Atribuir rótulos de propriedade

Você pode atribuir uma propriedade de origem a cada rótulo escolhendo em um menu de opções. Embora essa etapa não seja obrigatória, ter alguns rótulos de propriedade melhorará a relevância da pesquisa e garantirá melhores resultados de pesquisa para os usuários finais.

Etapa 5: Gerenciar esquema

Na tela Gerenciar Esquema , você pode alterar os atributos de esquema associados às propriedades, as opções são Consulta, Pesquisa, Recuperação e Refinamento. Você também pode adicionar aliases opcionais e escolher a propriedade Content .

Etapa 6: Gerenciar permissões de pesquisa

Azure Data Lake Gen 2

Você pode optar por ingerir as ACLs (Listas de Controle de Acesso) da sua conta de armazenamento do Azure Data Lake Gen 2. Quando essas permissões de pesquisa são definidas, o conteúdo da pesquisa é cortado com base nas permissões do usuário conectado Microsoft Entra ID. Como alternativa, você pode optar por tornar todo o conteúdo indexado da sua conta de armazenamento visível para todos na sua organização. Nesse caso, todos em sua organização terão acesso a todos os dados em sua conta de armazenamento.

O conector Azure Data Lake Storage Gen2 dá suporte a permissões de pesquisa visíveis para Todos ou somente pessoas com acesso a essa fonte de dados. Os dados indexados exibidos nos resultados da pesquisa podem estar visíveis para os usuários da organização que têm acesso a cada item.

Azure Storage Blob

Para uma conexão com Armazenamento de Blobs do Azure, todo o conteúdo indexado da fonte configurada é visível para todos na sua organização. Não há suporte para listas de controle de acesso no nível do Blob no Armazenamento de Blobs do Azure.

Etapa 7: definir a agenda de atualização

Na tela Configurações de Atualização , você pode definir o intervalo de rastreamento incremental e o intervalo de rastreamento completo. Os intervalos padrão para o conector Azure Data Lake Storage Gen2 são de 15 minutos para um rastreamento incremental e uma semana para um rastreamento completo.

Etapa 8: Revisar conexão

Siga as instruções de configuração geral.

Limitações

Uma conexão publicada para Armazenamento de Blobs do Azure não pode ser reconfigurada para Azure Data Lake Storage Gen2 fonte e o contrário. Nesses cenários, é recomendável configurar uma nova conexão.

Além disso, o tamanho dos arquivos precisa ser de 4 MB ou menos para que ele seja rastreado. Atualmente, os tipos de arquivo com suporte são:

  • Word (docx, .docm, .dotx, .dotm)
  • PowerPoint (.pptm, .pptx, .potm, .potx, .ppam, .ppsm, .ppsx)
  • Excel (.xlsx, .xlsm)
  • Formatos herdados do Office (.doc, .dot etc.)
  • Texto (.txt)
  • HTML
  • PDF

Não há suporte para arquivos binários como imagens (.jpg, .bmp etc.). Por exemplo, se um arquivo .docx contiver apenas imagens, ele poderá ser ignorado porque não retornou nenhum conteúdo.