Registrare i dati da Archivio Data Lake in Azure Data Catalog

Questo articolo descrive come integrare Archivio Azure Data Lake con Azure Data Catalog per individuare i dati all'interno dell'organizzazione integrandoli con il catalogo dati. Per altre informazioni sulla catalogazione dei dati, vedere Azure Data Catalog. Per informazioni sugli scenari in cui è possibile usare il catalogo dati, vedere l'articolo relativo agli scenari comuni di Azure Data Catalog.

Prerequisiti

Prima di iniziare questa esercitazione, è necessario disporre di quanto segue:

Registrare Archivio Data Lake come origine per Data Catalog

  1. Passare a https://azure.microsoft.com/services/data-cataloge fare clic su Introduzione.
  2. Accedere al portale di Azure Data Catalog e fare clic su Pubblica dati.

    Registrare un'origine dati

  3. Nella pagina successiva fare clic su Avvia applicazione. Verrà scaricato il file manifesto dell'applicazione nel computer in uso. Fare doppio clic sul file manifesto per avviare l'applicazione.
  4. Nella pagina iniziale fare clic su Accedie immettere le credenziali.

    Schermata iniziale

  5. Nella pagina Selezionare un'origine dati selezionare Azure Data Lake e quindi fare clic su Avanti.

    Selezionare l'origine dati

  6. Nella pagina successiva fornire il nome dell'account Archivio Data Lake che si vuole registrare in Data Catalog. Lasciare l'impostazione predefinita per le altre opzioni e quindi fare clic su Connetti.

    Connessione all'origine dati

  7. La pagina successiva può essere suddivisa nei segmenti seguenti.

    a. La casella Gerarchia server rappresenta la struttura della cartella dell'account Archivio Data Lake. $Root rappresenta la radice dell'account Data Lake Store, mentre AmbulanceData rappresenta la cartella creata nella radice dell'account Data Lake Store.

    b. La casella Oggetti disponibili elenca i file e le cartelle sotto la cartella AmbulanceData.

    c. Oggetti da registrare elenca i file e le cartelle che si vogliono registrare in Azure Data Catalog.

    Visualizzare la struttura dei dati

  8. Per questa esercitazione, è necessario registrare tutti i file nella directory. A tale scopo, fare clic sul pulsante (spostamento di oggetti) per spostare tutti i file nella casella Oggetti da registrare.

    Poiché i dati vengono registrati in un catalogo dati dell'organizzazione, è consigliabile aggiungere alcuni metadati che è possibile usare in un secondo momento per individuare rapidamente i dati. Ad esempio, è possibile aggiungere un indirizzo di posta elettronica per il proprietario dei dati (ad esempio, uno che si occupa del caricamento dei dati) o aggiungere un tag per identificare i dati. La schermata seguente mostra un tag aggiunto ai dati.

    Visualizzare la struttura dei dati

    Fare clic su Register.

  9. La schermata seguente indica che i dati sono stati registrati correttamente nel catalogo dati.

    Registrazione completata

  10. Fare clic su Visualizza portale per tornare al portale di Data Catalog e verificare che sia quindi possibile accedere ai dati registrati dal portale. Per cercare i dati, è possibile usare il tag che è stato usato durante la registrazione dei dati.

    Cercare dati nel catalogo

  11. È ora possibile eseguire operazioni come l'aggiunta di annotazioni e documentazione ai dati. Per altre informazioni, vedere i collegamenti seguenti:

Vedere anche