Scenari comuni del Catalogo dati di AzureAzure Data Catalog common scenarios

In questo articolo vengono presentati scenari comuni in cui Azure Data Catalog può aiutare l'organizzazione a incrementare il valore delle origini dati esistenti.This article presents common scenarios where Azure Data Catalog can help your organization get more value from its existing data sources.

Scenario 1: Registrazione delle origini dati centraliScenario 1: Registration of central data sources

Le organizzazioni hanno spesso molte origini dati di valore elevato.Organizations often have many high-value data sources. Queste origini dati includono sistemi di elaborazione di transazioni online (OLTP) line-of-business, data warehouse e database di business intelligence/analisi.These data sources include line-of-business, online transaction processing (OLTP) systems, data warehouses, and business intelligence/analytics databases. Il numero dei sistemi e la sovrapposizione tra di essi in genere cresce nel tempo in base all'evoluzione dell'azienda e delle relative necessità, ad esempio dopo acquisizioni e fusioni.The number of systems, and the overlap between them, typically grows over time as business needs evolve and the business itself evolves through, for example, mergers and acquisitions.

Può essere difficile per i membri dell'organizzazione sapere dove si trovano i dati all'interno delle origini dati.It can be difficult for organization members to know where to locate the data within these data sources. Domande come le seguenti sono molto diffuse:Questions like the following are all too common:

  • Tra i tre sistemi HR usati nella società, quale è opportuno usare per creare questo tipo di report?Of the three HR systems used within the company, which should I use to create this type of report?
  • Dove è necessario rivolgersi per ottenere i numeri delle vendite certificate per l'anno fiscale appena finito?Where should I go to get the certified sales numbers for the fiscal year that just ended?
  • A chi è necessario rivolgersi o qual è il processo per ottenere l'accesso al data warehouse?Who should I ask, or what is the process I should use to get access to the data warehouse?
  • Se non si è certi che i numeri siano corretti,I don’t know if these numbers are right. a chi è possibile rivolgersi per ottenere informazioni su come questi dati devono essere usati prima di condividere questo dashboard con il team?Who can I ask for insight on how this data is supposed to be used before I share this dashboard with my team?

Azure Data Catalog può offrire le risposte a queste e altre domande.To these and other questions, Azure Data Catalog can provide answers. Le origini dati centrali, di valore elevato e gestite da team IT, che vengono usate nelle organizzazioni sono spesso il punto di partenza logico per il popolamento del catalogo.The central, high-value, IT-managed data sources that are used across organizations are often the logical starting point for populating the catalog. Anche se qualsiasi utente può registrare un'origine dati, se il catalogo viene avviato con le origini di dati che hanno più probabilità di fornire valore a un maggior numero di utenti, si contribuisce all'adozione e all'uso del sistema.Although any user can register a data source, having the catalog kick-started with the data sources that are most likely to provide value to the largest number of users helps drive adoption and use of the system.

Se si sta iniziando a usare Azure Data Catalog, l'identificazione e la registrazione delle origini dati principali usate da molti team diversi di consumer di dati può essere il primo passo per il successo.If you are getting started with Azure Data Catalog, identifying and registering key data sources that are used by many different teams of data consumers can be your first step to success.

Questo scenario presenta anche un'opportunità per annotare le origini dati di valore elevato per facilitarne la comprensione e l'accesso.This scenario also presents an opportunity to annotate the high-value data sources to make them easier to understand and access. Un aspetto fondamentale di questa operazione consiste nell'includere informazioni su come gli utenti possono richiedere l'accesso all'origine dati.One key aspect of this effort is to include information on how users can request access to the data source. Con Azure Data Catalog è possibile fornire l'indirizzo di posta elettronica dell'utente o del team responsabile del controllo dell'accesso all'origine dati, collegamenti a strumenti o documenti esistenti oppure testo libero che descrive il processo di richiesta di accesso.With Azure Data Catalog, you can provide the email address of the user or team that's responsible for controlling data-source access, links to existing tools or documentation, or free text that describes the access-request process. Queste informazioni consentono ai membri che individuano origini dati registrate, ma che non hanno ancora le autorizzazioni per accedere ai dati, di richiedere facilmente l'accesso usando i processi definiti e controllati dai proprietari dell'origine dati.This information helps members who discover registered data sources but who do not yet have permissions to access the data to easily request access by using the processes that are defined and controlled by the data-source owners.

Scenario 2: Business intelligence in modalità self-serviceScenario 2: Self-service business intelligence

Anche se le soluzioni di business intelligence aziendali tradizionali continuano a essere scenari di dati di molte organizzazioni, i vari cambiamenti di mercato hanno reso la soluzione BI in modalità self-service sempre più importante.Although traditional corporate business-intelligence solutions continue to be an invaluable part of many organizations’ data landscapes, the changing pace of business has made self-service BI more and more important. Usando la BI in modalità self-service, gli information worker e gli analisti possono creare report, cartelle di lavoro e dashboard senza basarsi su un team IT centrale oppure senza limitazioni di pianificazione e disponibilità del team IT.By using self-service BI, information workers and analysts can create their own reports, workbooks, and dashboards without relying on a central IT team or being restricted by that IT team’s schedule and availability.

In scenari di business intelligence in modalità self-service gli utenti normalmente combinano dati da più origini, molte delle quali potrebbero non essere ancora state usate per analisi e business intelligence.In self-service BI scenarios, users commonly combine data from multiple sources, many of which might not have previously been used for BI and analysis. Anche se alcune di queste origini dati potrebbero essere già note, può essere difficile capire che cosa fare per individuare e valutare le potenziali origini dati per una determinata attività.Although some of these data sources might already be known, it can be challenging to discover what to do to locate and evaluate potential data sources for a given task.

In genere, questo processo di individuazione è manuale: gli analisti usano le connessioni di rete peer per identificare altre persone che lavorano con i dati cercati.Traditionally, this discovery process is a manual one: analysts use their peer network connections to identify others who work with the data being sought. Dopo che un'origine dati è stata trovata e usata, il processo viene ripetuto nuovamente per ogni successiva attività di BI in modalità self-service, con più utenti che eseguono un processo manuale ridondante di individuazione.After a data source is found and used, the process repeats itself again for each subsequent self-service BI effort, with multiple users performing a redundant manual process of discovery.

Con Azure Data Catalog, l'organizzazione può interrompere questo ciclo di attività.With Azure Data Catalog, your organization can break this cycle of effort. Dopo l'individuazione di un'origine dati tramite mezzi tradizionali, un analista può registrarla per renderla più facilmente individuabile da altri utenti in futuro.After discovering a data source through traditional means, an analyst can register it to make it more easily discoverable by other users in the future. Anche se l'analista può aggiungere più valore annotando gli asset dei dati registrati, questa annotazione non è necessaria contestualmente alla registrazione.Although the analyst can add more value by annotating the registered data assets, this annotation does not need to take place at the same time as registration. Gli utenti possono contribuire in futuro, come permesso dalle pianificazioni, aggiungendo gradualmente valore alle origini dati registrate nel catalogo.Users can contribute over time, as their schedules permit, gradually adding value to the data sources registered in the catalog.

Questa crescita strutturale del contenuto del catalogo è un complemento naturale alla registrazione iniziale delle origini dati centrali.This organic growth of the catalog content is a natural complement to the up-front registration of central data sources. La precompilazione del catalogo con i dati di molti utenti può essere una motivazione per l'uso e l'individuazione iniziali.Pre-populating the catalog with data that many users will need can be a motivator for initial use and discovery. Consentendo agli utenti di registrare e annotare altre origini, si offre un modo per mantenere l'impegno di utenti e altri membro dell'organizzazione.Enabling users to register and annotate additional sources can be a way to keep them and other organization members engaged.

È importante notare che, anche se questo scenario è incentrato specificamente sulla business intelligence in modalità self-service, i modelli e le richieste si applicano anche a progetti di BI aziendali su larga scala.It’s worth noting that although this scenario focuses specifically on self-service BI, the same patterns and challenges apply to large-scale corporate BI projects as well. Usando Data Catalog, l'organizzazione può migliorare qualsiasi attività comporti un processo manuale di individuazione delle origini dati.By using Data Catalog, your organization can improve any effort that involves a manual process of data-source discovery.

Scenario 3: Acquisizione di conoscenze specificheScenario 3: Capturing tribal knowledge

Di seguito sono riportate informazioni per sapere quali dati devono essere eseguiti dal processo e dove si trovano.How do you know what data you need to do your job, and where to find that data?

Se si ha una certa familiarità con il processo, probabilmente già si hanno le conoscenze necessarie.If you’ve been in your job for a while, you probably just know. L'utente ha intrapreso gradualmente il processo di apprendimento e nel corso del tempo ha imparato a usare le origini dati che sono fondamentali quotidianamente.You’ve gone through a gradual learning process, and over time have learned about the data sources that are key to your day-to-day work.

Quando un nuovo dipendente viene aggiunto al team, probabilmente non sa quali dati sono necessari per il lavoro e dove si trovano,When a new employee joins your team, how does that person know what data is required for the job, and where to find it?

anzi quasi certamente chiederà proprio queste informazioni.Odds are, the new person comes to you with these questions.

Il trasferimento delle conoscenze specifiche in atto fa parte del processo di individuazione delle origini dati di piccole e grandi aziende.This ongoing transfer of tribal knowledge is part of the data-source discovery process in organizations large and small. I membri del team più esperti hanno acquisito competenze nel corso degli anni e i membri del team più recenti hanno imparato a rivolgersi agli esperti per le domande.More senior and experienced team members have built up knowledge over the years, and newer team members have learned to ask them when they have questions. Spesso le informazioni più importanti sono presenti solo nelle teste di alcune persone chiave e quando tali utenti sono in vacanza o lasciano il team, l'organizzazione soffre.The most vital information often exists only in the heads of a few key people, and when those people are on vacation or leave the team, the organization suffers.

Gli esperti di dati si impegnano in genere per documentare le proprie conoscenze e condividerle tramite posta elettronica o in documenti di Word in un sito di SharePoint del team.Data experts ordinarily make an effort to document their knowledge, sharing it via email or in Word documents on a team SharePoint site. Anche se questo approccio può essere utile, è necessario considerare un nuovo problema di individuazione, ossia come fanno gli utenti a sapere quale documentazione è disponibile e dove reperirla.Although this approach can be valuable, it introduces a new discovery problem: how do people know what documentation exists, and where to find it?

Con Azure Data Catalog, l'organizzazione ha un'unica posizione centrale in cui archiviare e condividere queste informazioni specifiche, rendendole facilmente individuabili.With Azure Data Catalog, your organization has a single, central location for storing and sharing this tribal knowledge, and for making it easily discoverable. In Data Catalog gli esperti di dati possono annotare direttamente gli asset di dati e possono fornire i collegamenti alla documentazione esistente.In Data Catalog, your data experts can annotate data assets directly and provide links to existing documentation. Quando i membri dell'organizzazione usano il catalogo per trovare un'origine dati, troveranno non solo l'origine stessa, ma anche le conoscenze che prima erano detenute esclusivamente dagli esperti dell'organizzazione.When organization members use the catalog to discover a data source, they'll find not only the source itself, but also the knowledge that previously existed only in the minds of your organization's experts.