Registrare le origini dati in Azure Data CatalogRegister data sources in Azure Data Catalog

IntroduzioneIntroduction

Azure Data Catalog è un servizio cloud completamente gestito che funge da sistema di registrazione e di individuazione per le origini dati aziendali.Azure Data Catalog is a fully managed cloud service that serves as a system of registration and discovery for enterprise data sources. In altre parole, Data Catalog permette agli utenti di trovare, comprendere e usare le origini dati e consente alle organizzazioni di ottenere maggior valore dai dati esistenti.In other words, Data Catalog helps people discover, understand, and use data sources, and it helps organizations get more value from their existing data. Il primo passaggio per rendere individuabile un'origine dati in Data Catalog consiste nel registrare l'origine dati.The first step to making a data source discoverable via Data Catalog is to register that data source.

Registrare le origini datiRegister data sources

La registrazione è il processo di estrazione dei metadati da un'origine dati e di copia dei dati nel servizio Data Catalog.Registration is the process of extracting metadata from the data source and copying that data to the Data Catalog service. I dati rimangono nella posizione in cui risiedono attualmente e sotto il controllo degli amministratori e dei criteri del sistema corrente.The data remains where it currently resides, and it remains under the control of the administrators and policies of the current system.

Per registrare un'origine dati, seguire questa procedura:To register a data source, do the following:

  1. Nel portale di Azure Data Catalog avviare lo strumento di registrazione delle origini dati di Data Catalog.In the Azure Data Catalog portal, start the Data Catalog data source registration tool.
  2. Eseguire l'accesso con l'account aziendale o dell'istituto di istruzione con le stesse credenziali usate per accedere al portale.Sign in with your work or school account with the same Azure Active Directory credentials that you use to sign in to the portal.
  3. Selezionare l'origine dati che si vuole registrare.Select the data source you want to register.

Per altre informazioni dettagliate, vedere Introduzione ad Azure Data Catalog.For more step-by-step details, see the Get Started with Azure Data Catalog tutorial.

Dopo la registrazione dell'origine dati, il catalogo tiene traccia della posizione e ne indicizza i metadati.After you've registered the data source, the catalog tracks its location and indexes its metadata. Gli utenti possono cercare, esplorare e trovare l'origine dati e quindi usarne la posizione per connettersi tramite l'applicazione o lo strumento preferito.Users can search, browse, and discover the data source, and then use its location to connect to it by using the application or tool of their choice.

Origini dati supportateSupported data sources

Per un elenco di origini dati attualmente supportate, vedere Riferimento per l'origine dati di Azure Data Catalog.For a list of currently supported data sources, see Data Catalog DSR.

Metadati strutturaliStructural metadata

Quando si registra un'origine dati, lo strumento di registrazione estrae le informazioni sulla struttura degli oggetti selezionati.When you register a data source, the registration tool extracts information about the structure of the objects you select. Queste informazioni sono dette metadati strutturali.This information is referred to as structural metadata.

Per tutti gli oggetti, questi metadati strutturali includono la posizione dell'oggetto, in modo che gli utenti che trovano i dati possano usare tali informazioni per connettersi all'oggetto negli strumenti client di propria scelta.For all objects, this structural metadata includes the object’s location, so that users who discover the data can use that information to connect to the object in the client tools of their choice. Altri metadati strutturali includono il tipo e il nome dell'oggetto e il nome di colonna/attributo e il tipo di dati.Other structural metadata includes object name and type, and attribute/column name and data type.

Metadati descrittiviDescriptive metadata

Oltre ai metadati strutturali di base estratti dall'origine dati, lo strumento di registrazione dell'origine dati estrae i metadati descrittivi.In addition to the core structural metadata that's extracted from the data source, the data source registration tool extracts descriptive metadata. Per SQL Server Analysis Services e SQL Server Reporting Services questi metadati vengono estratti dalle proprietà Description esposte da questi servizi.For SQL Server Analysis Services and SQL Server Reporting Services, this metadata is taken from the Description properties exposed by these services. Per SQL Server vengono estratti i valori specificati con la proprietà estesa ms_description.For SQL Server, values provided using the ms_description extended property is extracted. Per il database Oracle lo strumento di registrazione dell'origine dati estrae la colonna COMMENTS dalla vista ALL_TAB_COMMENTS.For Oracle Database, the data-source registration tool extracts the COMMENTS column from the ALL_TAB_COMMENTS view.

Oltre ai metadati descrittivi estratti dall'origine dati, gli utenti possono immettere metadati descrittivi usando lo strumento di registrazione dell'origine dati.In addition to the descriptive metadata that's extracted from the data source, users can enter descriptive metadata by using the data source registration tool. Gli utenti possono aggiungere tag e identificare esperti per gli oggetti in fase di registrazione.Users can add tags, and they can identify experts for the objects being registered. Tutti questi metadati descrittivi vengono copiati nel servizio Data Catalog con i metadati strutturali.All this descriptive metadata is copied to the Data Catalog service along with the structural metadata.

Includere le anteprimeInclude previews

Per impostazione predefinita, solo i metadati vengono estratti dalle origini dati e copiati nel servizio Data Catalog, ma un'origine dati spesso è più facile da comprendere quando è possibile visualizzare un esempio dei dati che contiene.By default, only metadata is extracted from data sources and copied to the Data Catalog service, but understanding a data source is often made easier when you can view a sample of the data it contains.

Usando lo strumento di registrazione dell'origine dati di Data Catalog, è possibile includere un'anteprima dei dati in ogni tabella sotto forma di snapshot e una vista registrata.By using the Data Catalog data-source registration tool, you can include a snapshot preview of the data in each table and view that is registered. Se si sceglie di includere anteprime durante la registrazione, lo strumento di registrazione include un massimo di 20 record da ogni tabella e vista.If you choose to include previews during registration, the registration tool includes up to 20 records from each table and view. Questo snapshot viene quindi copiato nel catalogo con i metadati strutturali e descrittivi.This snapshot is then copied to the catalog along with the structural and descriptive metadata.

Nota

Nell'anteprima delle tabelle di grandi dimensioni con un numero elevato di colonne potrebbero essere inclusi meno di 20 record.Wide tables with a large number of columns might have fewer than 20 records included in their preview.

Includere i profili dei datiInclude data profiles

Esattamente come l'inclusione delle anteprime può offrire un contesto utile per gli utenti che cercano le origini dati in Data Catalog, includere un profilo dei dati può semplificare la comprensione delle origini dati trovate.Just as including previews can provide valuable context for users who search for data sources in Data Catalog, including a data profile can make it easier to understand discovered data sources.

Usando lo strumento di registrazione dell'origine dati di Data Catalog, è possibile includere un profilo dei dati in ogni tabella e vista registrate.By using the Data Catalog data-source registration tool, you can include a data profile for each table and view that is registered. Se si sceglie di includere un profilo dei dati durante la registrazione, lo strumento di registrazione include statistiche aggregate sui dati in ogni tabella o vista, tra cui:If you choose to include a data profile during registration, the registration tool includes aggregate statistics about the data in each table and view, including:

  • Il numero di righe e le dimensioni dei dati nell'oggetto.The number of rows and size of the data in the object.
  • La data dell'aggiornamento più recente dei dati e lo schema dell'oggetto.The date for the most recent update of the data and the object schema.
  • Il numero di record null e i valori distinti per colonne.The number of null records and distinct values for columns.
  • I valori minimo, massimo, medio e deviazione standard per le colonne.The minimum, maximum, average, and standard deviation values for columns.

Queste statistiche vengono quindi copiate nel catalogo con i metadati strutturali e descrittivi.These statistics are then copied to the catalog along with the structural and descriptive metadata.

Nota

Le colonne del testo e della data non includono le statistiche della media o della deviazione standard nel profilo dei dati.Text and date columns do not include average or standard deviation statistics in their data profile.

Aggiornare le registrazioniUpdate registrations

La registrazione di un'origine dati la rende individuabile in Data Catalog quando si usano i metadati e l'anteprima facoltativa estratti durante la registrazione.Registering a data source makes it discoverable in Data Catalog when you use the metadata and optional preview extracted during registration. Se l'origine dati deve essere aggiornata nel catalogo (ad esempio, se lo schema di un oggetto è stato modificato, le tabelle escluse in origine devono essere incluse oppure si vuole aggiornare i dati inclusi nelle anteprime), è possibile eseguire di nuovo lo strumento di registrazione dell'origine dati.If the data source needs to be updated in the catalog (for example, if the schema of an object has changed, tables originally excluded should be included, or you want to update the data that's included in the previews), the data source registration tool can be re-run.

La nuova registrazione di un'origine dati già registrata esegue un'operazione di unione "upsert": gli oggetti esistenti vengono aggiornati e i nuovi oggetti vengono creati.Re-registering an already-registered data source performs a merge “upsert” operation: existing objects are updated, and new objects are created. Tutti i metadati forniti dagli utenti tramite il portale di Data Catalog vengono mantenuti.Any metadata provided by users through the Data Catalog portal are retained.

RiepilogoSummary

La registrazione dell'origine dati in Data Catalog, poiché copia i metadati strutturali e descrittivi da un'origine dati al servizio catalogo, rende più facile trovare e comprendere i dati.Because it copies structural and descriptive metadata from a data source to the catalog service, registering the data source in Data Catalog makes the data easier to discover and understand. Dopo avere registrato l'origine dati, è possibile annotarla, gestirla e trovarla usando il portale di Data Catalog.After you have registered the data source, you can annotate, manage, and discover it by using the Data Catalog portal.

Passaggi successiviNext steps

Per altre informazioni sulla registrazione delle origini dati, vedere l'esercitazione Introduzione ad Azure Data Catalog.For more information about registering data sources, see the Get Started with Azure Data Catalog tutorial.