Eseguire il profiling dati delle origini datiData profile data sources

IntroduzioneIntroduction

Catalogo dati di Microsoft Azure è un servizio cloud completamente gestito che funge da sistema di registrazione e di individuazione per origini dati aziendali.Microsoft Azure Data Catalog is a fully managed cloud service that serves as a system of registration and system of discovery for enterprise data sources. In altre parole, il Catalogo dati di Azure consente agli utenti di individuare, comprendere e usare origini dati e aiuta le organizzazioni a ottenere maggior valore dai dati esistenti.In other words, Azure Data Catalog is all about helping people discover, understand, and use data sources, and helping organizations to get more value from their existing data. Quando un'origine dati viene registrata con Azure Data Catalog, i relativi metadati vengono copiati e indicizzati dal servizio, ma non è tutto.When a data source is registered with Azure Data Catalog, its metadata is copied and indexed by the service, but the story doesn’t end there.

La funzione di profiling dati di Azure Data Catalog esamina i dati delle origini dati supportate nel catalogo e raccoglie statistiche e informazioni sui dati.The Data Profiling feature of Azure Data Catalog examines the data from supported data sources in your catalog and collects statistics and information about that data. È facile includere un profilo degli asset di dati.It's easy to include a profile of your data assets. Quando si registra un asset di dati, scegliere Includi profilo dati nello strumento di registrazione delle origini dati.When you register a data asset, choose Include Data Profile in the data source registration tool.

Informazioni sul profiling datiWhat is Data Profiling

Il profiling dati esamina i dati nell'origine dati di cui è in corso la registrazione e raccoglie statistiche e informazioni sui dati.Data profiling examines the data in the data source being registered, and collects statistics and information about that data. Durante l'individuazione delle origini dati, le statistiche consentono di determinare l'idoneità dei dati per la risoluzione del problema aziendale.During data source discovery, these statistics can help you determine the suitability of the data to solve their business problem.

Le origini dati seguenti supportano il profiling dati:The following data sources support data profiling:

  • Viste e tabelle di SQL Server, inclusi database SQL di Azure e Azure SQL Data Warehouse.SQL Server (including Azure SQL DB and Azure SQL Data Warehouse) tables and views
  • Viste e tabelle di OracleOracle tables and views
  • Viste e tabelle di TeradataTeradata tables and views
  • Tabelle HiveHive tables

Includendo i profili dati durante la registrazione degli asset di dati gli utenti possono rispondere a domande sulle origini dati, ad esempio:Including data profiles when registering data assets helps users answer questions about data sources, including:

  • Può essere usata per risolvere il problema aziendale?Can it be used to solve my business problem?
  • I dati sono conformi a standard o modelli particolari?Does the data conform to particular standards or patterns?
  • Quali sono alcune delle anomalie dell'origine dati?What are some of the anomalies of the data source?
  • Quali sono i possibili problemi legati all'integrazione di questi dati nell'applicazione?What are possible challenges of integrating this data into my application?

Nota

È anche possibile aggiungere della documentazione a un asset per descrivere come integrare i dati in un'applicazione.You can also add documentation to an asset to describe how data could be integrated into an application. Vedere l'articolo relativo alla documentazione delle origini dati.See How to document data sources.

Come includere un profilo dati durante la registrazione di un'origine datiHow to include a data profile when registering a data source

È facile includere un profilo dell'origine dati.It's easy to include a profile of your data source. Quando si registra un'origine dati, nel pannello Oggetti da registrare dello strumento di registrazione delle origini dati scegliere Includi profilo dati.When you register a data source, in the Objects to be registered panel of the data source registration tool, choose Include Data Profile.

Per altre informazioni su come registrare le origini dati, vedere Come registrare le origini dati e Introduzione ad Azure Data Catalog.To learn more about how to register data sources, see How to register data sources and Get started with Azure Data Catalog.

Applicazione di filtri su asset di dati che includono profili datiFiltering on data assets that include data profiles

Per trovare asset di dati che includono un profilo dati, è possibile specificare has:tableDataProfiles o has:columnsDataProfiles come termini di ricerca.To discover data assets that include a data profile, you can include has:tableDataProfiles or has:columnsDataProfiles as one of your search terms.

Nota

Selezionando Includi profilo dati nello strumento di registrazione dell'origine dati, è possibile includere le informazioni del profilo a livello di tabella e a livello di colonna.Selecting Include Data Profile in the data source registration tool includes both table and column-level profile information. Tuttavia, l'API del catalogo dati consente la registrazione degli asset di dati con un solo set di informazioni sul profilo.However, the Data Catalog API allows data assets to be registered with only one set of profile information included.

Visualizzazione delle informazioni sul profilo datiViewing data profile information

Dopo aver individuato un'origine dati adatta con un profilo, è possibile visualizzare i dettagli relativi al profilo dati.Once you find a suitable data source with a profile, you can view the data profile details. Per visualizzare il profilo dati, selezionare un asset di dati e scegliere Profilo dati nella finestra del portale di Azure Data Catalog.To view the data profile, select a data asset and choose Data Profile in the Data Catalog portal window.

Un profilo dati in Azure Data Catalog include informazioni sul profilo a livello di tabella e di colonna, ad esempio:A data profile in Azure Data Catalog shows table and column profile information including:

Profilo dati dell'oggettoObject data profile

  • Numero di righeNumber of rows
  • Dimensioni della tabellaTable size
  • Ultimo aggiornamento dell'oggettoWhen the object was last updated

Profilo dati della colonnaColumn data profile

  • Tipo di dati della colonnaColumn data type
  • Numero di valori distinctNumber of distinct values
  • Numero di righe con valori NULLNumber of rows with NULL values
  • Deviazione minima, massima, media e standard per i valori di colonnaMinimum, maximum, average, and standard deviation for column values

RiepilogoSummary

Il profiling dati fornisce statistiche e informazioni sugli asset di dati registrati per consentire di determinare l'idoneità dei dati per la risoluzione di problemi aziendali.Data profiling provides statistics and information about registered data assets to help you determine the suitability of the data to solve business problems. Oltre che annotare e documentare le origini dati, i profili dati permettono agli utenti di comprendere meglio i dati.Along with annotating, and documenting data sources, data profiles can give users a deeper understanding of your data.

Vedere ancheSee Also