Registrar dados do Azure Data Lake Storage Gen1 no Catálogo de Dados do Azure

Neste artigo, você aprenderá como integrar o Azure Data Lake Storage Gen1 com Catálogo de Dados do Azure para tornar os dados detectáveis em uma organização, integrando-os ao Catálogo de Dados. Para obter mais informações sobre a catalogação de dados, consulte Catálogo de Dados do Azure. Para compreender os cenários em que você pode usar o Catálogo de Dados, consulte Cenários comuns do Catálogo de Dados do Azure.

Pré-requisitos

Antes de começar este tutorial, você deve ter o seguinte:

Registrar o Data Lake Storage Gen1 como uma fonte para o Catálogo de Dados

  1. Vá para https://azure.microsoft.com/services/data-cataloge clique em Introdução.

  2. Faça logon no portal do Catálogo de Dados do Azure e clique em Publicar dados.

    Registrar uma fonte de dados

  3. Na página seguinte, clique em Iniciar Aplicativo. Isso baixará o arquivo de manifesto do aplicativo no seu computador. Clique duas vezes no arquivo de manifesto para iniciar o aplicativo.

  4. Na página de Boas-vindas, clique em Entrare insira suas credenciais.

    Tela de boas-vindas

  5. Na página Selecionar uma Fonte de Dados, selecione Azure Data Lake Storee, em seguida, clique em Avançar.

    Selecionar fonte de dados

  6. Na próxima página, forneça o nome da conta do Data Lake Storage Gen1 que você quer registrar no Catálogo de Dados. Deixe as outras opções como padrão e clique em Conectar.

    Conectar-se à fonte de dados

  7. A próxima página pode ser dividida nos seguintes segmentos.

    a. A caixa Hierarquia do Servidor representa a estrutura da pasta da conta do Data Lake Storage Gen1. $Root representa a raiz da conta do Data Lake Storage Gen1 e AmbulanceData representa a pasta criada na raiz da conta do Data Lake Storage Gen1.

    b. A caixa Objetos disponíveis lista os arquivos e pastas na pasta AmbulanceData.

    c. A caixa Objetos a serem registrados lista os arquivos e pastas que você deseja registrar no Catálogo de Dados do Azure.

    Captura de tela da caixa de diálogo Catálogo de Dados do Microsoft Azure – Conta do Repositório.

  8. Para este tutorial, você deve registrar todos os arquivos no diretório. Para fazer isso, clique no botão (mover objetos) para mover todos os arquivos para a caixa Objetos a serem registrados.

    Como os dados serão registrados em um catálogo de dados de toda a organização, a abordagem recomendada é adicionar alguns metadados que você possa usar posteriormente para localizar rapidamente os dados. Por exemplo, você pode adicionar um endereço de email para o proprietário dos dados (por exemplo, que está carregando os dados) ou adicionar uma marca para identificar os dados. A captura de tela abaixo mostra uma marcação que você adicionou aos dados.

    Captura de tela da caixa de diálogo Catálogo de Dados do Microsoft Azure – Conta do Repositório com a marca que foi adicionada aos dados em destaque.

    Clique em Registrar.

  9. A captura de tela a seguir indica que os dados foram registrados com êxito no Catálogo de Dados.

    Registro concluído

  10. Clique em Exibir Portal para voltar ao portal do Catálogo de Dados e verificar se agora você pode acessar os dados registrados no portal. Para pesquisar os dados, você pode usar a marca que usada ao registrar os dados.

    Pesquisar dados no catálogo

  11. Agora você pode executar operações como adicionar anotações e documentação aos dados. Para obter mais informações, consulte os links a seguir.

Confira também