Registrare i dati da Archivio Data Lake in Azure Data CatalogRegister data from Data Lake Store in Azure Data Catalog

Questo articolo descrive come integrare Archivio Azure Data Lake con Azure Data Catalog per individuare i dati all'interno dell'organizzazione integrandoli con il catalogo dati.In this article you will learn how to integrate Azure Data Lake Store with Azure Data Catalog to make your data discoverable within an organization by integrating it with Data Catalog. Per altre informazioni sulla catalogazione dei dati, vedere Azure Data Catalog.For more information on cataloging data, see Azure Data Catalog. Per informazioni sugli scenari in cui è possibile usare il catalogo dati, vedere l'articolo relativo agli scenari comuni di Azure Data Catalog.To understand scenarios in which you can use Data Catalog, see Azure Data Catalog common scenarios.

PrerequisitiPrerequisites

Prima di iniziare questa esercitazione, è necessario disporre di quanto segue:Before you begin this tutorial, you must have the following:

  • Una sottoscrizione di Azure.An Azure subscription. Vedere Ottenere una versione di valutazione gratuita di Azure.See Get Azure free trial.
  • Abilitare la sottoscrizione di Azure per l'anteprima pubblica di Data Lake Store.Enable your Azure subscription for Data Lake Store Public Preview. Vedere le istruzioni.See instructions.
  • Account di Archivio Data Lake di Azure.Azure Data Lake Store account. Seguire le istruzioni fornite in Introduzione ad Archivio Azure Data Lake tramite il portale di Azure.Follow the instructions at Get started with Azure Data Lake Store using the Azure Portal. Per questa esercitazione, viene creato un account Archivio Data Lake denominato datacatalogstore.For this tutorial, let us create a Data Lake Store account called datacatalogstore.

    Dopo aver creato l'account, caricare un set di dati di esempio.Once you have created the account, upload a sample data set to it. Per questa esercitazione, caricare tutti i file con estensione csv nella cartella AmbulanceData del repository Git di Azure Data Lake.For this tutorial, let us upload all the .csv files under the AmbulanceData folder in the Azure Data Lake Git Repository. È possibile usare vari tipi di client, ad esempio Azure Storage Explorer, per caricare i dati in un contenitore BLOB.You can use various clients, such as Azure Storage Explorer, to upload data to a blob container.

  • Azure Data Catalog.Azure Data Catalog. È necessario che per l'organizzazione sia già stato creato un catalogo di Azure Data Catalog.Your organization must already have an Azure Data Catalog created for your organization. Per ogni organizzazione è consentito un solo catalogo.Only one catalog is allowed for each organization.

Registrare Archivio Data Lake come origine per Data CatalogRegister Data Lake Store as a source for Data Catalog

  1. Passare a https://azure.microsoft.com/services/data-cataloge fare clic su Introduzione.Go to https://azure.microsoft.com/services/data-catalog, and click Get started.
  2. Accedere al portale di Azure Data Catalog e fare clic su Pubblica dati.Log into the Azure Data Catalog portal, and click Publish data.

    Registrare un'origine datiRegister a data source

  3. Nella pagina successiva fare clic su Avvia applicazione.On the next page, click Launch Application. Verrà scaricato il file manifesto dell'applicazione nel computer in uso.This will download the application manifest file on your computer. Fare doppio clic sul file manifesto per avviare l'applicazione.Double-click the manifest file to start the application.
  4. Nella pagina iniziale fare clic su Accedie immettere le credenziali.On the Welcome page, click Sign in, and enter your credentials.

    Schermata inizialeWelcome screen

  5. Nella pagina Selezionare un'origine dati selezionare Azure Data Lake e quindi fare clic su Avanti.On the Select a Data Source page, select Azure Data Lake, and then click Next.

    Selezionare l'origine datiSelect data source

  6. Nella pagina successiva fornire il nome dell'account Archivio Data Lake che si vuole registrare in Data Catalog.On the next page, provide the Data Lake Store account name that you want to register in Data Catalog. Lasciare l'impostazione predefinita per le altre opzioni e quindi fare clic su Connetti.Leave the other options as default and then click Connect.

    Connessione all'origine datiConnect to data source

  7. La pagina successiva può essere suddivisa nei segmenti seguenti.The next page can be divided into the following segments.

    a.a. La casella Gerarchia server rappresenta la struttura della cartella dell'account Archivio Data Lake.The Server Hierarchy box represents the Data Lake Store account folder structure. $Root rappresenta la radice dell'account Data Lake Store, mentre AmbulanceData rappresenta la cartella creata nella radice dell'account Data Lake Store.$Root represents the Data Lake Store account root, and AmbulanceData represents the folder created in the root of the Data Lake Store account.

    b.b. La casella Oggetti disponibili elenca i file e le cartelle sotto la cartella AmbulanceData.The Available objects box lists the files and folders under the AmbulanceData folder.

    c.c. Oggetti da registrare elenca i file e le cartelle che si vogliono registrare in Azure Data Catalog.Objects to be registered box lists the files and folders that you want to register in Azure Data Catalog.

    Visualizzare la struttura dei datiView data structure

  8. Per questa esercitazione, è necessario registrare tutti i file nella directory.For this tutorial, you should register all the files in the directory. A tale scopo, fare clic sul pulsante (spostamento di oggetti) per spostare tutti i file nella casella Oggetti da registrare.For that, click the (move objects) button to move all the files to Objects to be registered box.

    Poiché i dati vengono registrati in un catalogo dati dell'organizzazione, è consigliabile aggiungere alcuni metadati che è possibile usare in un secondo momento per individuare rapidamente i dati.Because the data will be registered in an organization-wide data catalog, it is a recommened approach to add some metadata which you can later use to quickly locate the data. Ad esempio, è possibile aggiungere un indirizzo di posta elettronica per il proprietario dei dati (ad esempio, uno che si occupa del caricamento dei dati) o aggiungere un tag per identificare i dati.For example, you can add an e-mail address for the data owner (for example, one who is uploading the data) or add a tag to identify the data. La schermata seguente mostra un tag aggiunto ai dati.The screen capture below shows a tag that we add to the data.

    Visualizzare la struttura dei datiView data structure

    Fare clic su Register.Click Register.

  9. La schermata seguente indica che i dati sono stati registrati correttamente nel catalogo dati.The following screen capture denotes that the data is successfully registered in the Data Catalog.

    Registrazione completataRegistration complete

  10. Fare clic su Visualizza portale per tornare al portale di Data Catalog e verificare che sia quindi possibile accedere ai dati registrati dal portale.Click View Portal to go back to the Data Catalog portal and verify that you can now access the registered data from the portal. Per cercare i dati, è possibile usare il tag che è stato usato durante la registrazione dei dati.To search the data, you can use the tag you used while registering the data.

    Cercare dati nel catalogoSearch data in catalog

  11. È ora possibile eseguire operazioni come l'aggiunta di annotazioni e documentazione ai dati.You can now perform operations like adding annotations and documentation to the data. Per altre informazioni, vedere i collegamenti seguenti:For more information, see the following links.

Vedere ancheSee also