Profiling di dati e notifiche in DQSData Profiling and Notifications in DQS

Il profiling dei dati in Data Quality ServicesData Quality Services (DQS) è il processo di analisi dei dati in un'origine dati esistente e la visualizzazione di statistiche sui dati nelle attività DQS.Data profiling in Data Quality ServicesData Quality Services (DQS) is the process of analyzing the data in an existing data source, and displaying statistics about the data in DQS activities. L'attività consente di eseguire la misurazione automatizzata della qualità dei dati.It provides you with automated measurements of data quality. Il profiling in DQS è integrato nei progetti di gestione e di qualità dei dati di DQSDQS profiling is integrated into DQS knowledge management and data-quality projects. e si tratta di una funzionalità dinamica e adattabile.It is dynamic and adjustable. Gli obiettivi principali del profiling sono due: semplificare l'esecuzione dei processi relativi alla qualità dei dati, supportando il processo decisionale, e valutare l'efficacia di tali processi.Profiling has two major goals: first, to guide you through data quality processes and support your decisions, and second, to assess the effectiveness of the processes. Il profiling DQS offre i vantaggi seguenti:The DQS profiling process has the following benefits:

  • Il profiling fornisce informazioni dettagliate sulla qualità dei dati di origine e consente di identificare problemi relativi a tale qualità.Profiling provides insight into the quality of your source data, and helps you identify data quality issues.

  • Il profiling consente di valutare l'efficacia dei processi relativi alla qualità dei dati, guidando l'utente nelle procedure di individuazione delle informazioni, pulizia dei dati, creazione di criteri e altre operazioni relative all'individuazione delle corrispondenze.Profiling assesses the effectiveness of data quality processes, guiding you in your knowledge discovery, data cleansing, matching policy, and matching work.

  • Il profiling consente di ottenere le informazioni più significative nel momento più rilevante.Profiling presents you with the most relevant information at the most relevant time.

  • Il processo di profiling genera notifiche che evidenziano statistiche o eventi importanti che possono richiedere un intervento.The profiling process generates notifications that emphasize important statistics or events that may warrant action. In molti casi le notifiche di DQS indicheranno una condizione e consiglieranno l'azione che è possibile intraprendere per rimediare a tale condizione.In many cases, DQS notifications will indicate a condition and recommend the action that you can take to remedy that condition.

    Il profiling consente di utilizzare Data Quality Services non solo per l'individuazione delle informazioni, la pulizia e l'individuazione delle corrispondenze, ma anche come strumento di analisi.Profiling enables you to use Data Quality Services not only for knowledge discovery, cleansing, and matching, but also as an analysis tool. È consigliabile creare una Knowledge Base per l'analisi, quindi eseguire l'individuazione delle informazioni utilizzandola per determinare, mediante le statistiche di profiling, se soddisfa le esigenze di individuazione, di pulizia e di corrispondenza.You may want to create one knowledge base for analysis, and run knowledge discovery using that knowledge base to determine from the profiling statistics whether the knowledge base satisfies your discovery, cleansing, and matching needs.

Funzionamento del profilingHow Profiling Works

Il profiling non consente di misurare la qualità della Knowledge Base,Profiling does not measure the quality of the knowledge base. ma viene utilizzato per la misurazione della qualità dei dati di origine.It measures the quality of the source data. Il profiling fornisce statistiche che indicano l'effetto dell'operazione specifica che si esegue nell'ambito della gestione delle informazioni o di un progetto Data Quality sui dati di origine.Profiling provides you with statistics that indicate the effect of the specific operation that you are doing in knowledge management or a data quality project on your source data. Il profiling ha sempre luogo nel contesto dell'attività specifica che si sta eseguendo.Profiling is always in the context of the specific activity that you are performing. È possibile fare clic sulla scheda relativa al profiling in una schermata per visualizzare i dati di profiling senza uscire dalla fase dell'attività che si sta eseguendo.You can click the profiling tab in a screen to display profiling data without leaving the stage of the activity that you are performing. La tabella relativa al profiling viene popolata in tempo reale durante l'esecuzione del processo, consentendo la valutazione delle attività relative alla qualità dei dati nel corso della loro esecuzione.The profiling table is populated in real time as the process is performed, enabling you to assess data quality tasks as you are performing them. Dopo la pulizia o deduplicazione, è possibile determinare se la qualità dei dati di origine è migliorata e in quale misura.You can determine whether source data is better after cleansing or de-duplication, and by how much.

Tutti i numeri di profiling si riferiscono al numero di occorrenze di un valore, e in molti casi alla percentuale del totale, fatta eccezione per la metrica relativa all'univocità.All profiling numbers refer to the number of appearances of a value, and in many cases the percent of the total, with the exception of uniqueness metrics. La metrica di unicità si riferisce al numero assoluto di valori, indipendentemente dal numero di occorrenze di tali valori.Uniqueness metrics refer to the absolute number of values, regardless of the number of appearances of those values.

Il profiling fa parte della soluzione DQS basata sulle informazioniProfiling is part of the DQS knowledge-driven solution. e fornisce informazioni su una Knowledge Base, su una corrispondenza o su un processo di pulizia dei dati in base al mapping tra i campi delle origini dati e domini della Knowledge Base.It provides information on a knowledge base, matching, or data cleansing process based upon the mapping between data source fields and knowledge base domains. Il profiling viene eseguito solo dopo il completamento dell'esecuzione del mapping. Durante la fase di mapping di qualsiasi attività, non verrà pertanto eseguita alcuna attività di profiling.Profiling is performed only after mapping is complete; no profiling is performed during the mapping stage of any activity. Il profiling è sempre collegato a un'attività.Profiling is always attached to an activity. Il processo di profiling viene eseguito sui dati di cui è stato eseguito il mapping ai domini e non sui dati nei domini stessi.The profiling process is performed on the data that is mapped to domains, not on the data in the domains. Il profiling è integrato nei seguenti passaggi delle attività:Profiling is integrated into the following steps of activities:

  • Passaggi Individua e Gestisci valori di dominio dell'attività di individuazione delle informazioniThe Discover and Manage domain values steps of the Knowledge discovery activity

  • Passaggi Pulisci e Gestisci e visualizza risultati dell'attività di puliziaThe Cleanse and Manage and view results steps of the Cleansing activity

  • Passaggi Criteri di corrispondenza e Risultati corrispondenza dell'attività relativa ai criteri di corrispondenzaThe Matching policy and Matching results steps of the Matching policy activity

  • Passaggi Corrispondenza e Esporta dell'attività relativa all'individuazione delle corrispondenzeThe Matching and Export steps of the Matching activity

    DQS non fornisce statistiche di profiling per l'attività di gestione del dominio.DQS does not provide profiling statistics for the Domain Management activity.

Profiling dei dati in base all'attivitàProfiling Data by Activity

Per il profiling DQS vengono utilizzate dimensioni standard per rappresentare la qualità dei dati: completezza (l'entità della presenza dei dati), accuratezza (la misura entro cui i dati possono essere utilizzati per gli scopi previsti) e univocità (la misura entro cui valori diversi rappresentano entità diverse).DQS profiling uses standard data quality dimensions to represent the quality of the data: completeness (the extent to which data is present), accuracy (the extent to which data can be used for its intended use), and uniqueness (the extent to which different values represent different entities). Per impostazione predefinita, i valori NULL e vuoti sono considerati mancanti, o abbassano la percentuale di completezza. È tuttavia possibile definire altri valori come equivalenti a NULL, in qual caso verranno anch'essi considerati come mancanti.By default, NULL and empty values are considered to be missing, or lower the completeness percentage; however, you can also define other values to be NULL-equivalent, in which case they will also be considered to be missing.

Il profiling fornisce le statistiche necessarie per valutare i processi, ma è necessario interpretare tali statistiche.Profiling provides you with the statistics you need to assess your processes, but you must interpret the statistics. È possibile decifrare i suggerimenti del profiling analizzando le statistiche colonna per colonna.Make sense of what profiling is telling you by looking at the statistics column by column.

Le attività DQS offrono diversi set di statistiche di profiling, come descritto di seguito:The DQS activities have different sets of profiling statistics, as follows:

  • Solo l'attività di pulizia presenta statistiche di profiling relative all'accuratezza (in percentuale e per dominio).Only the Cleansing activity has profiling statistics for accuracy (in percent by domain). L'accuratezza è interessata da regole relative a validità, coerenza, errori di sintassi e dominio.Accuracy is affecting by validity, consistency, syntax errors, and domain rules.

  • Solo l'attività di pulizia presenta statistiche di profiling per i valori Corretti, Con correzione e Suggeriti nell'origine e Con correzione e Suggeriti per dominio (con entrambi numero e percentuale).Only the Cleansing activity has profiling statistics for correct, corrected, and suggested in the source, and corrected and suggested values by domain (both number of percent).

  • Le attività Pulizia e Individuazione informazioni presentano statistiche di profiling per la validità (Pulizia per record, Individuazione informazioni per record e dominio).The Cleansing and Knowledge Discovery activities have profiling statistics for validity (Cleansing by record, Knowledge Discovery by record and domain). Le attività Criteri di corrispondenza e Corrispondenza non presentano statistiche per la validità.The Matching Policy and Matching activities do not have statistics for validity.

  • L'attività Pulizia non presenta statistiche di profiling per l'univocità.The Cleansing activity does not have profiling statistics for uniqueness. Le attività Individuazione informazioni, Criteri di corrispondenza e Corrispondenza presentano statistiche di profiling per l'unicità in numero e percentuale per l'origine e per dominio.The Knowledge Discovery, Matching Policy, and Matching activities have profiling statistics for uniqueness in number and percent for the source and by domain.

    Per ulteriori informazioni sulle statistiche di profiling specifiche correlate a un'attività, vedere le sezioni Profiling negli argomenti seguenti:For more information about the specific profiling statistics related to an activity, see the Profiling sections in the following topics:

  • Eseguire l'individuazione di informazioniPerform Knowledge Discovery

  • Pulire i dati mediante DQS (informazioni interne)Cleanse Data Using DQS (Internal) Knowledge

  • Creare criteri di corrispondenzaCreate a Matching Policy

  • Eseguire un progetto corrispondenteRun a Matching Project

Profiling dei dati nel monitoraggio delle attivitàProfiling Data in Activity Monitoring

Il profiling delle informazioni per le attività Individuazione informazioni, Criteri di corrispondenza, Corrispondenza e Pulizia sono disponibili non solo nelle pagine delle attività del client Data Quality, ma anche nel monitoraggio delle attività.Profiling information for the Knowledge Discovery, Matching Policy, Matching, and Cleansing activities is available not only in the activity pages in the Data Quality client, but also in activity monitoring. Il monitoraggio delle attività fornisce una panoramica sulle attività correnti e precedenti.Activity monitoring provides you with an overview of current and past activities. Oltre alle proprietà e ai processi di calcolo correlati delle attività, è possibile visualizzare le informazioni di profiling generate per ogni attività in una data posizione.In addition to the properties and related computational processes of activities, you can view the profiling information generated for each activity in one location. Selezionare un'attività nella tabella delle attività per visualizzare i risultati del profiling in una tabella sottostante.You select an activity in the activity table to display profiling results in a table below. È inoltre possibile esportare i risultati del profiling.You can also export the profiling results. Per altre informazioni, vedere DQS Administration.For more information, see DQS Administration.

NotificheNotifications

Oltre ad effettuare la raccolta e la visualizzazione di importanti statistiche e metriche tramite il profiling, DQS genererà notifiche (se abilitate) per indicare quando potrebbe essere necessario intraprendere azioni in base alle statistiche di profiling visualizzate.In addition to collecting and displaying important statistics and metrics through profiling, DQS will generate notifications (if enabled) to indicate when you may want to take an action based on the displayed profiling statistics. DQS utilizza le notifiche per evidenziare informazioni importanti sull'origine dati e mostrare l'efficacia dell'attività corrente in relazione allo scopo per il quale è stata eseguita.DQS uses notifications to emphasize important facts about the data source, and to show the effectiveness of the current activity relative to the purpose for which it was executed. Le notifiche forniscono suggerimenti e raccomandazioni che indicano una condizione e forniscono consigli su come migliorare un'attività di individuazione di informazioni, di pulizia dei dati o di individuazione di corrispondenze.Notifications provide tips and recommendations that indicate a condition and recommend how you could improve a knowledge discovery, data cleansing, or data matching activity.

Le notifiche di DQS vengono utilizzate per generare avvisi che potrebbero interessare l'operatore o indicare la soluzione a un potenziale problema.A DQS notification is used to raise an issue that may interest you, or to address a potential problem. Se è o meno necessario intraprendere azioni in seguito alla notifica dipenderà dalla rilevanza di tale azione per gli scopi previsti.Whether you act upon the notification depends upon whether it is relevant to your purposes. Si supponga ad esempio che DQS generi una notifica quando la pulizia dei dati non produce valori corretti o suggeriti, mentre la completezza e l'accuratezza sono entrambe del 100%.For example, suppose DQS posts a notification when data cleansing produces no corrected values or suggested values while completeness and accuracy are both 100%. Questa notifica indicherebbe che potrebbe non essere necessario eseguire l'attività.This notification would indicate that the activity may not need to be run. L'esecuzione o meno dell'attività rimane tuttavia una decisione che prenderà l'utente.Whether you choose to run the activity, however, is your decision.

Una notifica viene indicata da una descrizione comando con un punto esclamativo nella scheda Profiling . Le statistiche associate alla notifica sono colorate in rosso per indicare la giustificazione statistica per la notifica.A notification is indicated by a tool tip with an exclamation point in the Profiling tab. Statistics associated with the notification are colored red to indicate the statistical justification for the notification.

È possibile abilitare (valore predefinito) o disabilitare le notifiche nella scheda Impostazioni generali della sezione Amministrazione della home page del client Data Quality.You can enable (the default) or disable notifications in the General Settings tab of the Administration section of the Data Quality Client home page. Quando le notifiche sono disabilitate, le descrizioni comandi non vengono visualizzate e le statistiche non verranno visualizzate in colore rosso.When notification is disabled, tool tips are not displayed and statistics are not colored red. La disabilitazione delle notifiche non comporta miglioramenti significativi delle prestazioni.There is no significant improvement in performance by disabling notifications. Il profiling resta operativo anche qualora si disabilitino le notifiche.Profiling will still be operational if you disable notifications.

Per condizioni specifiche associate alle notifiche per un'attività, vedere gli argomenti seguenti:For specific conditions associated with notifications for an activity, see the following:

Descrizione dell'attivitàTask Description ArgomentoTopic
Viene descritto come abilitare o disabilitare le notifiche in DQS.Describes how to enable or disable notifications in DQS. Abilitare o disabilitare le notifiche di profiling in DQSEnable or Disable Profiling Notifications in DQS