Come annotare le origini datiHow to annotate data sources

IntroduzioneIntroduction

Microsoft Azure Data Catalog è un servizio cloud completamente gestito che funge da sistema di registrazione e di individuazione per origini dati aziendali.Microsoft Azure Data Catalog is a fully managed cloud service that serves as a system of registration and system of discovery for enterprise data sources. In altre parole, Data Catalog permette agli utenti di individuare, comprendere e usare le origini dati e consente alle organizzazioni di ottenere maggior valore dai dati esistenti.In other words, Data Catalog is all about helping people discover, understand, and use data sources, and helping organizations to get more value from their existing data. Quando un'origine dati viene registrata in Data Catalog, i relativi metadati vengono copiati e indicizzati dal servizio, ma non è tutto.When a data source is registered with Data Catalog, its metadata is copied and indexed by the service, but the story doesn’t end there. Data Catalog consente agli utenti di specificare propri metadati descrittivi, ad esempio descrizioni e tag, per integrare i metadati estratti dall'origine dati e rendere l'origine dati più comprensibile a un maggior numero di persone.Data Catalog allows users to provide their own descriptive metadata – such as descriptions and tags – to supplement the metadata extracted from the data source, and to make the data source more understandable to more people.

Annotazione e crowdsourcingAnnotation and crowdsourcing

Oggi tutti hanno un parere.Everyone has an opinion. E questo è positivo.And this is a good thing. Data Catalog riconosce che utenti diversi hanno prospettive diverse sulle origini dati aziendali e che ognuna di queste prospettive può essere utile.Data Catalog recognizes that different users have different perspectives on enterprise data sources, and that each of these perspectives can be valuable. Si consideri lo scenario seguente:Consider the following scenario:

  • L'amministratore di sistema conosce il contratto di servizio per il server o servizi che ospitano l'origine dati.The system administrator knows the service level agreement for the servers or services that host the data source.
  • L'amministratore del database conosce la pianificazione del backup per ogni database e le finestre di elaborazione ETL consentite.The database administrator knows the backup schedule for each database, and the allowed ETL processing windows.
  • Il proprietario del sistema conosce il processo di richiesta di accesso all'origine dati utilizzato dagli utenti.The system owner knows the process for users to request access to the data source.
  • L'amministratore dei dati conosce il modo in cui asset e attributi nell’origine dati si relazionano al modello di dati aziendali.The data steward knows how the assets and attributes in the data source map to the enterprise data model.
  • L'analista sa come i dati vengono utilizzati nel contesto dei processi aziendali che supporta.The analyst knows how the data is used in the context of the business processes he supports.

Ognuna di queste prospettive è utile e Data Catalog usa un approccio crowdsourcing ai metadati che consente di acquisirle tutte e usarle per offrire un quadro completo delle origini dati registrate.Each of these perspectives is valuable, and Data Catalog uses a crowdsourcing approach to metadata that allows each one to be captured and used to provide a complete picture of registered data sources. Usando il portale di Data Catalog, ogni utente può aggiungere e modificare le proprie annotazioni e ha al tempo stesso la possibilità di visualizzare le annotazioni di altri utenti.Using the Data Catalog portal, each user can add and edit his own annotations, while being able to view annotations provided by other users.

Diversi tipi di annotazioniDifferent types of annotations

Data Catalog supporta i tipi di annotazione seguenti:Data Catalog supports the following types of annotations:

AnnotazioneAnnotation NoteNotes
Nome descrittivoFriendly name È possibile fornire nomi descrittivi a livello di asset di dati, per rendere le risorse di dati più facilmente comprensibili.Friendly names can be supplied at the data asset level, to make the data assets more easily understood. I nomi descrittivi sono particolarmente utili quando il nome dell'oggetto sottostante è di difficile interpretazione, abbreviato o non significativo per gli utenti.Friendly names are most useful when the underlying object name is cryptic, abbreviated or otherwise not meaningful to users.
DescrizioneDescription È possibile fornire descrizioni a livello asset di dati e attributo / colonna.Descriptions can be supplied at the data asset and attribute / column levels. Le descrizioni sono annotazioni di testo breve in formato libero che descrivono la prospettiva dell’utente sull’asset dati o sul relativo utilizzo.Descriptions are free-form short text annotations that describe the user’s perspective on the data asset or its use.
Tag (tag utente)Tags (user tags) I tag possono essere forniti a livello asset di dati e attributo / colonna.Tags can be supplied at the data asset and attribute / column levels. I tag utente sono etichette definite dall'utente che possono essere usate per definire categorie di asset di dati o attributi.User tags are user-defined labels that can be used to categorize data assets or attributes.
Tag (tag glossario)Tags (glossary tags) I tag possono essere forniti a livello asset di dati e attributo / colonna.Tags can be supplied at the data asset and attribute / column levels. I tag di glossario sono termini di glossario definiti a livello centrale che possono essere usati per definire categorie di asset di dati o attributi tramite una tassonomia aziendale comune.Glossary tags are centrally-defined glossary terms that can be used to categorize data assets or attributes using a common business taxonomy. Per altre informazioni, vedere Come configurare il glossario aziendale per l'assegnazione di tag regolamentataFor more information see How to set up the Business Glossary for Governed Tagging
EspertiExperts Gli esperti possono essere forniti a livello di asset di dati.Experts can be supplied at the data asset level. Gli esperti identificano utenti o gruppi con prospettive da esperti sui dati e possono fungere come punto di contatto per gli utenti che individuano le origini dei dati registrati e hanno domande le cui risposte non vengono fornite dalle annotazioni esistenti.Experts identify users or groups with expert perspectives on the data and can serve as points of contact for users who discover the registered data sources and have questions that are not answered by the existing annotations.
Richiedere l'accessoRequest access Le informazioni di richiesta di accesso possono essere fornite a livello di asset di dati.Request access information can be supplied at the data asset level. Queste informazioni sono per gli utenti che individuano un'origine dati per cui non dispongono di autorizzazioni di accesso.This information is for users who discover a data source that they do not yet have permissions to access. Gli utenti possono immettere l'indirizzo di posta elettronica dell'utente o del gruppo che concede l'accesso, l'URL del processo o lo strumento a cui gli utenti devono accedere, oppure immettere lo stesso processo come testo.Users can enter the email address of the user or group who grants access, the URL of the process or tool that users need to gain access, or can enter the process itself as text.
DocumentazioneDocumentation La documentazione può essere fornita a livello di asset di dati.Documentation can be supplied at the data asset level. La documentazione degli asset è costituita da informazioni in formato RTF che possono includere collegamenti e immagini e fornire informazioni aggiuntive rispetto a descrizioni e tag.Asset documentation is rich text information that can include links and images, and which can provide any information not conveyed through descriptions and tags.

Asset con più annotazioniAnnotating multiple assets

Selezionando più asset di dati nel portale di Data Catalog, gli utenti possono annotare tutti gli asset selezionati in un'unica operazione.When selecting multiple data assets in the Data Catalog portal, users can annotate all selected assets in a single operation. Le annotazioni verranno applicate a tutti gli asset selezionati, rendendo più semplice selezionare e fornire una descrizione coerente e set di tag e esperti per asset di dati correlati.Annotations will apply to all selected assets, making it easy to select and provide a consistent description and sets of tags and experts for related data assets.

Nota

I tag e gli esperti possono essere specificati anche durante la registrazione degli asset di dati con il tool di registrazione delle origini dati di Data Catalog.Tags and experts can also be provided when registering data assets using the Data Catalog data source registration tool.

Quando si selezionano più tabelle e viste, nel portale di Data Catalog verranno visualizzate solo le colonne comuni a tutti gli asset di dati selezionati.When selecting multiple tables and views, only columns that all selected data assets have in common will be displayed in the Data Catalog portal. In questo modo gli utenti possono fornire tag e descrizioni per tutte le colonne con lo stesso nome per tutti gli asset selezionati.This allows users to provide tags and descriptions for all columns with the same name for all selected assets.

Individuazione e annotazioniAnnotations and discovery

Così come i metadati estratti dall'origine dati durante la registrazione vengono aggiunti all'indice di ricerca di Data Catalog, anche i metadati forniti dagli utenti vengono indicizzati.Just as the metadata extracted from the data source during registration is added to the Data Catalog search index, user-supplied metadata is also indexed. Ciò significa che le annotazioni non facilitano soltanto la comprensione dei dati individuati dagli utenti ma che esse rendono anche più semplice individuare gli asset di dati con annotazioni tramite ricerche effettuate utilizzando termini conosciuti dagli utenti stessi.This means that not only do annotations make it easier for users to understand the data they discover, annotations also make it easier for users to discover the annotated data assets by searching using the terms that make sense to them.

RiepilogoSummary

La registrazione di un'origine dati in Data Catalog rende individuabili tali dati copiando i metadati strutturali e descrittivi dall'origine dati al servizio Catalog.Registering a data source with Data Catalog makes that data discoverable by copying structural and descriptive metadata from the data source into the Catalog service. Dopo la registrazione di un'origine dati, gli utenti possono specificare annotazioni per facilitare l'individuazione e la comprensione dal portale di Data Catalog.Once a data source has been registered, users can provide annotations to make easier to discover and understand from within the Data Catalog portal.

Vedere ancheSee also