Esecuzione dell'individuazione delle informazioniPerform Knowledge Discovery

In questo argomento viene descritto come compilare una Knowledge Base tramite l'individuazione delle informazioni.This topic describes how to build a knowledge base through knowledge discovery. Durante il processo di individuazione in Data Quality ServicesData Quality Services (DQS) vengono analizzati i dati in un'origine dati di esempio tramite un processo computerizzato e vengono aggiunte le informazioni ottenute dalla Knowledge Base.In the discovery process, Data Quality ServicesData Quality Services (DQS) analyzes the data in a sample data source through a computer-assisted process, and adds the knowledge that it gains to the knowledge base. Tali informazioni possono essere modificate e migliorate nel passaggio Gestisci valori di dominio dell'attività di individuazione delle informazioni o nell'attività di gestione del dominio.This knowledge can be modified and enhanced in the Manage Domain Values step of the knowledge discovery activity, or in the domain management activity.

L'individuazione delle informazioni è un processo basato su procedure guidate che include tre passaggi, ognuno dei quali deve essere completato.Knowledge discovery is a wizard-driven process that includes three steps, each of which must be completed.

Prima di iniziareBefore You Begin

PrerequisitiPrerequisites

Se i dati di origine su cui viene eseguita l'individuazione si trovano in un file di Excel, è necessario che Microsoft Excel sia installato nel computer del Client Data QualityData Quality Client .Microsoft Excel must be installed on the Client Data QualityData Quality Client computer if the source data against which you are running the discovery is in an Excel file. In caso contrario, non sarà possibile selezionare il file di Excel nella fase di mapping.Otherwise, you will not be able to select the Excel file in the mapping stage. I file creati da Microsoft Excel potranno presentare l'estensione xlsx, xls o csv.The files created by Microsoft Excel can have an extension of .xlsx, .xls, or .csv. Se viene utilizzata la versione a 64 bit di Excel, sono supportati solo i file di Excel 2003 (xls), mentre non sono supportati file di Excel 2007 o 2010 (xlsx).If the 64-bit version of Excel is used, only Excel 2003 files (.xls) are supported; Excel 2007 or 2010 files (.xlsx) are not supported. Se si utilizza una versione a 64 bit di Excel 2007 o 2010, salvare il file come file xls o csv o installare una versione a 32 bit di Excel.If you are using 64-bit version of Excel 2007 or 2010, save the file as an .xls file or a .csv file, or install a 32-bit version of Excel instead.

SicurezzaSecurity

AutorizzazioniPermissions

È necessario disporre del ruolo dqs_kb_editor o dqs_administrator nel database DQS_MAIN per creare una Knowledge Base.You must have the dqs_kb_editor role or the dqs_administrator on the DQS_MAIN database to create a knowledge base.

Primo passaggio: Avviare l'individuazione delle informazioniFirst step: Start Knowledge Discovery

  1. Avviare client Data Quality.Start Data Quality Client. Per informazioni su questa operazione, vedereFor information about doing so, see Eseguire l'applicazione Data Quality Client. Run the Data Quality Client Application.

  2. Se si desidera eseguire l'individuazione delle informazioni in una nuova Knowledge Base, fare clic su Nuova Knowledge Base, immettere il nome e la descrizione e, se applicabile, specificare l'oggetto da cui si crea la Knowledge Base.If you want to perform knowledge discovery on a new knowledge base, click New knowledge base, enter the name and description, and specify what you are creating the knowledge base from, if applicable. Se si desidera eseguire l'individuazione delle informazioni in una Knowledge Base esistente, fare clic su Apri Knowledge Base, quindi seleziona una Knowledge Base.If you want to perform knowledge discovery on an existing knowledge base, click Open knowledge base, and then select a knowledge base.

  3. Selezionare Individuazione informazioni come attività, quindi fare clic su Crea per creare la nuova Knowledge Base, oppure Apri per aprirne una esistente.Select Knowledge Discovery as the activity, and then click Create to create the new knowledge base or Open to open an existing knowledge base.

Fase di mappingMapping Stage

  1. Nel campo Origine dati selezionare SQL Server (valore predefinito) o File di Excel.In the Data Source field, select SQL Server (the default) or Excel file.

    Nota

    In questa pagina è possibile creare una connessione a un'origine dati SQL Server o Excel, quindi viene eseguito il mapping tra le colonne nell'origine dati e un dominio nella Knowledge Base.In this page, you make a connection to either a SQL Server or Excel data source, and then map between columns in the data source and a domain in the knowledge base. Nella tabella Mapping vengono visualizzate tutte le colonne nel database di origine che verrà analizzato per aggiungere informazioni ai domini corrispondenti.The Mappings table displays all the columns in the source database that will be analyzed to add knowledge to the corresponding domains. Vengono eseguiti mapping tra le colonne nell'origine dati e un dominio nella Knowledge Base.Mappings are made between columns in the data source and a domain in the knowledge base.

  2. Se l'origine dati è SQL Server, procedere come segue:If the data source is SQL Server, proceed as follows:

    1. Nel campo Database selezionare il database di origine che si desidera analizzare per creare la Knowledge Base.In the Database field select the source database that you want to analyze to create the knowledge base. Nella casella di testo a discesa verranno elencati i database disponibili.The text box drop-down will list the databases that are available. Il database di origine deve trovarsi nella stessa istanza di SQL Server di Data Quality ServerData Quality Server,The source database must be present in the same SQL Server instance as Data Quality ServerData Quality Server. in caso contrario, non verrà visualizzato nell'elenco a discesa.Otherwise, it will not appear in the drop-down list.

    2. Nel campo Tabella/Vista selezionare la tabella o la vista che si desidera analizzare per creare la Knowledge Base.In the Table/View field select the table or view that you want to analyze to create the knowledge base. Questa tabella o vista deve essere costituita da dati di esempio, non da un intero database di origine su cui viene eseguita la pulizia o l'individuazione di corrispondenze dei dati.This table or view should be sample data, not an entire source database that you are performing data cleansing or matching on. Nella casella di testo a discesa verranno elencate le tabelle e le viste disponibili per il database selezionato.The text box drop-down will list the tables and views that are available for the selected database.

  3. Se l'origine dati è Excel, procedere come segue:If the data source is Excel, proceed as follows:

    1. Fare clic su Sfoglia e selezionare il file di Excel che si desidera analizzare per creare la Knowledge Base.Click Browse and select the Excel file that you want to analyze to create the knowledge base. Per selezionare un file di Excel, è necessario che Excel sia installato nel computer del Client Data QualityData Quality Client .Excel must be installed on the Client Data QualityData Quality Client computer to select an Excel file. Se Excel non è installato nel computer del Client Data QualityData Quality Client , il pulsante Sfoglia non sarà disponibile e verrà visualizzata una notifica sotto questa casella di testo in cui si avvisa che Excel non è installato.If Excel is not installed on the Client Data QualityData Quality Client computer, the Browse button will not be available, and you will be notified beneath this text box that Excel is not installed.

    2. Selezionare la casella di controllo Utilizza la prima riga come intestazione se la prima riga del file di Excel contiene dati di intestazione.Select the Use first row as header checkbox if the first row of the Excel file contains header data.

  4. Nella tabella Mapping eseguire il mapping di ogni colonna di origine su cui si desidera eseguire l'individuazione delle informazioni a un dominio nella Knowledge Base, come segue:In the Mappings table, map each source column that you want knowledge discovery to be performed on to a domain in the knowledge base, as follows:

    1. Creare un mapping selezionando una colonna di origine nell'elenco a discesa per la Colonna di origine di una riga vuota, quindi selezionando un dominio nell'elenco a discesa per la colonna Dominio nella stessa riga, se esiste un dominio.Create a mapping by selecting a source column from the drop-down list for the Source Column column of an empty row, and then selecting a domain from the drop-down list for the Domain column in the same row, if a domain exists. Se non esiste alcun dominio, fare clic su Crea un dominio o Crea un dominio composito per crearne uno.If no domain exists, click the Create a domain or Create a composite domain to create a domain. Per ulteriori informazioni, vedere Create a Domain Rule o Create a Composite Domain.For more information, see Create a Domain Rule or Create a Composite Domain.

    2. Ripetere il passaggio precedente per ogni mapping.Repeat the previous step for each mapping. Per modificare il numero di righe nella tabella, fare clic su Aggiungi un mapping colonneo selezionare una riga e fare clic su Rimuovi mapping colonne selezionate.To change the number of rows in the table, click Add a column mapping, or select a row and click the Remove selected column mapping. Se si fa clic su Rimuovi mapping colonne selezionate quando è selezionata una riga popolata, la riga selezionata verrà eliminata anche se è presente una riga non popolata.If you click Remove selected column mapping when a populated row is selected, the selected row will be deleted even if there is an unpopulated row.

      Nota

      È possibile eseguire il mapping dei dati di origine a un dominio DQS per eseguire l'individuazione di informazioni solo se il tipo di dati di origine è supportato in DQS e corrisponde al tipo di dati del dominio DQS.You can map your source data to a DQS domain for performing knowledge discovery only if the source data type is supported in DQS, and matches with the DQS domain data type. Per ulteriori informazioni sui tipi di dati supportati, vedere Supported SQL Server and SSIS Data Types for DQS Domains.For more information about supported data types, see Supported SQL Server and SSIS Data Types for DQS Domains.

    3. Fare clic su Visualizza/Seleziona domini compositi per visualizzare i domini compositi definiti.Click View/select composite domains to display the composite domains that have been defined. Se non è stato definito alcun dominio composito, il controllo non sarà disponibile.If no composite domains have been defined, the control will not be available.

    4. Fare clic su Anteprima origine dati per visualizzare in una finestra popup tutti i dati dell'origine dati selezionata nella casella di testo Tabella/Vista o File di Excel .Click Preview data source to display in a popup all data in the data source that you selected in the Table/View or Excel File text box.

  5. Fare clic su Avanti per passare alla pagina Individua della procedura guidata Individuazione informazioni.Click Next to proceed to the Discover page of the Knowledge Discovery wizard. È inoltre possibile selezionare le opzioni seguenti:You can also select the following:

    • Fare clic su Annulla per terminare l'attività di individuazione delle informazioni. Il lavoro verrà perso e sarà visualizzata di nuovo la home page di DQS.Click Cancel to terminate the Knowledge Discovery activity, losing your work, and return to the DQS home page.

    • Fare clic su Chiudi per salvare il lavoro e tornare alla home page di DQS.Click Close to return to the DQS home page while saving your work. La Knowledge Base verrà bloccata e lo stato della Knowledge Base nella relativa tabella della schermata Apri Knowledge Base sarà Individuazione - Mapping.The knowledge base will be locked to you, and the state of the knowledge base in the knowledge base table in the Open Knowledge Base screen will be Discovery - Mapping. Dopo avere fatto clic su Chiudiper eseguire l'attività Gestione dominio è necessario fare clic su Individuazione informazioni nella schermata Apri Knowledge Base , passare alla schermata Gestione Knowledge Base: Gestisci termini di dominio , fare clic su Fine, quindi fare clic su per pubblicare la Knowledge Base o su No per salvare il lavoro nella Knowledge Base e uscire.After clicking Close, to perform the Domain Management activity, you would have to click Knowledge Discovery from the Open knowledge base screen, proceed to the Knowledge Base Management: Manage Domain Terms screen, click Finish, and then click either Yes to publish the knowledge base or No to save the work on the knowledge base and exit.

Fase di individuazioneDiscover Stage

  1. Fare clic su Avvia per analizzare l'origine dati.Click Start to analyze the data source.

    Nota

    L'individuazione viene eseguita sulle colonne immesse nella tabella Mapping della pagina Mappa .Discovery is performed on the columns that were entered in the Mappings table on the Map page. Il dominio di cui è stato eseguito il mapping a ogni colonna verrà popolato con le informazioni ricavate dall'individuazione.The domain mapped to each column will be populated with knowledge drawn from discovery. Se il dominio è un dominio composito, le informazioni verranno aggiunte ai singoli domini singoli da cui è costituito il dominio composito.If the domain is a composite domain, the knowledge will be added to the individual domains that the composite domain consists of.

  2. Durante l'esecuzione del processo di individuazione, controllare lo stato di completamento visualizzato per ogni passaggio dell'individuazione: Pre-elaborazione record, Esecuzione regole di dominioed Esecuzione individuazione.As the discovery process is running, check the completion status that is displayed for each step of discovery: Preprocessing Records, Running Domain Rules, and Running Discovery. La percentuale e lo stato di completamento verranno visualizzati per ognuna di queste fasi.Percent complete and completion status will be shown for each of these stages.

  3. Al termine dell'analisi, verificare che la riga di stato sotto le statistiche di completamento indichi che l'operazione sia stata completata correttamente.When the analysis has completed, verify that the status line beneath the completion statistics indicates that it completed successfully.

    Nota

    Se si esce dalla schermata prima della fine del caricamento del file, il processo di caricamento verrà terminato.Leaving the screen before the file has been uploaded will terminate the file upload process.

  4. Dopo il completamento dell'analisi, verificare le statistiche nella scheda Profiler per controllare lo stato dei dati.After the analysis has completed, check the statistics in the Profiler tab to see the status of the data. Per ulteriori informazioni, vedere Profiling dei dati e notifiche in DQS.For more information, see Data Profiling and Notifications in DQS.

  5. Una volta completata l'analisi, il pulsante Avvia viene sostituito dal pulsante Riavvia .After the analysis has completed, the Start button turns into a Restart button. Fare clic su Riavvia per eseguire di nuovo il processo di analisi.Click Restart to run the analysis process again. Se i risultati dall'analisi precedente non sono stati ancora salvati, facendo clic su Riavvia si causerà la perdita di tali dati non salvati.However, the results from the previous analysis have not been saved as yet, so clicking Restart will cause that previous data to be lost. Per continuare, fare clic su nella finestra popup.To continue, click Yes in the popup. Durante l'esecuzione dell'analisi, non lasciare la pagina o il processo di analisi verrà interrotto.As the analysis is running, do not leave the page or the analysis process will be terminated.

  6. Fare clic su Avanti per passare alla pagina Gestisci valori di dominio della procedura guidata Individuazione informazioni.Click Next to proceed to the Manage Domain Values page of the Knowledge Discovery wizard. In questa pagina è possibile modificare le informazioni aggiunte ai domini della Knowledge Base.On this page you can modify the knowledge added to the domains of the knowledge base. È inoltre possibile selezionare le opzioni seguenti:You can also select the following:

    • Fare clic su Annulla per terminare l'attività di individuazione delle informazioni. Il lavoro verrà perso e sarà visualizzata di nuovo la home page di DQS.Click Cancel to terminate the Knowledge Discovery activity, losing your work, and return to the DQS home page.

    • Fare clic su Chiudi per salvare il lavoro e tornare alla home page di DQS.Click Close to return to the DQS home page while saving your work. La Knowledge Base verrà bloccata e lo stato della Knowledge Base nella relativa tabella della schermata Apri Knowledge Base sarà Individuazione informazioni - Individua.The knowledge base will be locked to you, and the state of the knowledge base in the knowledge base table in the Open Knowledge Base screen will be Discovery - Discover. Dopo avere fatto clic su Chiudiper eseguire l'attività Gestione dominio è necessario fare clic su Individuazione informazioni nella schermata Apri Knowledge Base , passare alla schermata Gestione Knowledge Base: Gestisci termini di dominio , fare clic su Fine, quindi fare clic su per pubblicare la Knowledge Base o su No per salvare il lavoro nella Knowledge Base e uscire.After clicking Close, to perform the Domain Management activity, you would have to click Knowledge Discovery from the Open knowledge base screen, proceed to the Knowledge Base Management: Manage Domain Terms screen, click Finish, and then click either Yes to publish the knowledge base or No to save the work on the knowledge base and exit.

    • Fare clic per tornare alla pagina Individua .Click to return to the Discover page.

Fase di gestione dei risultati di individuazione datiManage Data Discovery Results Stage

Dopo avere eseguito l'attività di individuazione delle informazioni, è possibile modificare i valori come segue:After you have performed the knowledge discovery activity, you can change values as follows:

  • Aggiungere un valore di dominio all'elenco di valori o selezionare un valore ed eliminarlo dall'elencoAdd a domain value to the value list, or select a value and delete it from the list

  • Modificare lo stato di un valore di dominio rispetto a come viene definito dal processo di individuazione DQS, impostandolo come corretto, in errore o non validoChange the status of a domain value from what the DQS discovery process designates it as, changing it to correct, in-error, or not valid

  • Immettere un valore di sostituzione per un valore in errore o non validoEnter a replacement value for a value that is in-error or not valid

  • Impostare due o più valori come sinonimi e modificare il valore iniziale rispetto a come è stato impostato dal processo di individuazione, in modo che il valore iniziale sostituisca il valore del sinonimo, se durante la creazione del dominio è stata impostata la proprietà Utilizza valori inizialiSet two or more values as synonyms and change the leading value as set by the discovery process, with the result that the leading value will replace the synonym value if the Use Leading Value property was set when you created the domain

  • Importare i valori di dominio da un file di ExcelImport domain values from an Excel file.

    Nella tabella Valore vengono visualizzate le informazioni aggiunte alla Knowledge Base per un singolo dominio.The Value table displays knowledge added to the knowledge base for a single domain. Selezionare tale dominio nell'elenco di domini del riquadro a sinistra.You select that domain in the domain list in the pane to the left. Le colonne del campo sono le seguenti:The columns in the field are the following:

  • Nella colonna Valore vengono visualizzati tutti i valori aggiunti dal processo di individuazione al dominio selezionato da un campo nei dati di esempio.The Value column displays all values that the discovery process added to the selected domain from a field in the data sample. Qualsiasi valore indicato come in errore verrà visualizzato come sinonimo di un valore indicato come corretto.Any value that is projected as an error will be shown as a synonym to a value that is projected as correct.

  • Nella colonna Frequenza viene visualizzato il numero di istanze del valore nel campo del database di esempio a cui è stato eseguito il mapping del dominio.The Frequency column displays the number of instances of the value in the sample database field that the domain is mapped to. Per un dominio composito, vengono visualizzati solo i valori con una frequenza maggiore o uguale a 20.For a composite domain, only those values with a frequency greater than or equal to 20 are displayed. I dati relativi alla frequenza sono disponibili in quanto il processo di individuazione delle informazioni dispone ancora di una connessione al database di esempio.The Frequency data is available because the knowledge discovery process still has a connection to the sample database. I dati relativi alla frequenza non sono disponibili nella tabella di dominio nella scheda Valori di dominio della schermata Gestione dominio in quanto il processo di gestione del dominio non dispone di una connessione al database di esempio.Frequency data is not available in the domain table on the Domain Values tab of the Domain Management screen because the domain management process does not have a connection to the sample database.

  • Nella colonna Tipo viene visualizzato lo stato del valore, come determinato dal processo di individuazione.The Type column displays the status of the value, as determined by the discovery process. Un segno di spunta verde indica che il valore è corretto o che sono state apportate correzioni, una croce rossa indica che il valore è in errore, mentre un triangolo arancione con un punto esclamativo indica che il valore non è valido.A green check indicates that the value is correct or corrected; a red cross indicates that the value is in error; and an orange triangle with an exclamation point indicates that the value is not valid. Un valore non valido non è conforme ai requisiti dei dati per il dominio.A value that is not valid does not conform to the data requirements for the domain. Un valore in errore può essere valido, ma non è il valore corretto per la finalità dei dati.A value that is in error can be valid, but is not the correct value for data reasons.

  • Nella colonna Correggi in viene visualizzato il valore corretto in cui verrà modificato il valore originale, contrassegnato come in errore o non valido.The Correct To column shows a correct value that the original value, marked as in error or not valid, will be changed to. Il valore corretto viene proposto da DQS come risultato del processo di individuazione.DQS can propose the correct value as a result of the discovery process.

    Gestire i risultati dell'individuazione come segue:Manage the discovery results as follows:

  1. Nel riquadro Elenco di domini a sinistra selezionare un dominio per cui impostare i valori di dominio.In the Domains List pane on the left, select a domain to set domain values for. Per modificare i valori visualizzati, è possibile effettuare le operazioni seguenti.You can do the following to modify the values displayed.

    • Visualizzare i risultati desiderati nella tabella, in base al relativo stato, selezionando lo stato nell'elenco Filtro .Display the results that you want in the table, based on their status, by selecting the status in the Filter list.

    • Trovare i dati che si desidera controllare o modificare immettendo una o più lettere da cercare nella casella di testo Trova.Find the data that you want to check or modify by entering one more letters to search for in the Find text box. Tali lettere verranno evidenziate in tutti i valori visualizzati.This will highlight have those letters wherever they occur in any value that is displayed.

    • Fare clic su Mostra solo nuovi per limitare i valori visualizzati nella tabella solo ai valori individuati nella sessione corrente, non nelle sessioni precedenti.Click Show Only New to restrict the values displayed in the table only to values that were discovered in the current session, not previous sessions.

    • Fare clic sul pulsante Espandi tutto per visualizzare tutti i valori in qualsiasi gruppo di sinonimi quando lo stato corrente è compresso o il pulsante Comprimi tutto per nascondere tutto tranne il valore iniziale in qualsiasi gruppo di sinonimi quando lo stato corrente è espanso.Click the Expand All button to display all values in any group of synonyms when the current state is collapsed, or the Collapse All button to hide all but the leading value in any group of synonyms when the current state is expanded.

    • Fare clic sul pulsante Mostra/Nascondi il pannello della cronologia delle modifiche dei valori di dominio per visualizzare un'anteprima popup nella parte inferiore della tabella dei valori in cui vengono mostrate le modifiche recenti alla raccolta dei valori di dominio.Click the Show/Hide the Domain Values Changes History Panel button to display a preview popup at the bottom of the values table that shows recent changes to the domain values collection.

  2. Trovare tutte le correzioni proposte da Data Quality Services impostando Filtro su Errori.Find any corrections that Data Quality Services has proposed by setting Filter to Error. Verificare che il valore sia effettivamente in errore e che il valore nella colonna Correggi in sia appropriato.Verify that the value is in fact in error, and that the value in the Correct To column is appropriate.

  3. Impostare Filtro su Tutti i valori e verificare che lo stato dei valori sia appropriato.Set Filter to All Values and verify that the state of the values is appropriate. Per modificare lo stato di un valore, selezionare il valore, quindi fare clic sul pulsante Imposta i valori di dominio selezionati come corretti (segno di spunta), sul pulsante Imposta i valori di dominio selezionati come errori (croce) o sul pulsante Imposta i valori di dominio selezionati come non validi (triangolo).To change a value’s state, select the value, and then click the Set selected domain values as corrected (check) button, the set selected domain values as errors (cross) button, or the set selected domain values as invalid (triangle) button.

  4. Per modificare lo stato di un valore, procedere come segue:To change a value’s state, proceed as follows:

    1. Imposta i valori di dominio selezionati come corretti: per modificare lo stato di un valore da Errori o Non validi in Corretti, selezionare il valore, quindi fare clic sull'icona Imposta i valori di dominio selezionati come corretti (segno di spunta) dalla freccia in giù nella barra delle icone o dall'elenco a discesa Tipo.Set selected domain values as corrected: To change a value’s state from Error or Invalid to Correct, select the value, and then click the Set selected domain values as corrected (check) from the down-arrow in the icon bar or from the Type drop-down list. Se il valore in errore o non valido viene raggruppato con un valore corretto, eliminare il valore dopo l'operazione.If the in-error or invalid value is grouped with a correct value, delete that value after the operation.

    2. Imposta i valori di dominio selezionati come errori: per modificare lo stato di un valore da Corretti o Non validi in Errori, selezionare il valore, quindi fare clic sull'icona Imposta i valori di dominio selezionati come errori (croce) dalla freccia in giù nella barra delle icone o dall'elenco a discesa Tipo.Set selected domain values as errors: To change a value’s state from Correct or Invalid to Error, select the value, and then click the Set selected domain values as errors (cross) icon from the down-arrow in the icon bar or from the Type drop-down list. È possibile immettere una correzione nella colonna Correggi in o lasciarla vuota.You can either enter a correction in the Correct to column, or leave it blank.

    3. Imposta i valori di dominio selezionati come non validi: per modificare lo stato di un valore da Corretti o Errori in Non validi, selezionare il valore, quindi fare clic sull'icona Imposta i valori di dominio selezionati come non validi (triangolo) dalla freccia in giù nella barra delle icone o dall'elenco a discesa Tipo.Set selected domain values as invalid: To change a value’s state from Correct or Error to Invalid, select the value, and then click the Set selected domain values as invalid (triangle) icon from the down-arrow in the icon bar or from the Type drop-down list. È possibile immettere una correzione nella colonna Correggi in o lasciarla vuota.You can either enter a correction in the Correct to column, or leave it blank.

    4. Correggi in: dopo avere impostato un valore come in errore o non invalido, immettere un nuovo valore nella colonna Correggi in .Correct to: After setting a value as in error or invalid, enter a new value in the Correct To column. In DQS verrà aggiunta una nuova riga per il valore sostitutivo che verrà designato come valore corretto, quindi verranno raggruppati i due valori.DQS will add a new row for the replacement value, designate it as correct, and then group the two values. Il nuovo valore verrà visualizzato come valore iniziale, con il valore iniziale in grassetto e il valore in errore o non valido rientrato.The new value will be shown as the leading value, with the leading value in bold and the in-error or invalid value indented.

  5. Per designare i valori come gruppo di sinonimi, selezionare più valori corretti, quindi procedere come segue:To designate values as a group of synonyms, select multiple values that are correct, and then proceed as follows:

    • Imposta i valori di dominio come sinonimi: fare clic per impostare i valori selezionati come sinonimi.Set selected domain values as synonyms: Click to set the selected values as synonyms. In DQS uno dei valori verrà definito come valore iniziale con cui verranno sostituiti gli altri valori.DQS will designate one of the values as the leading value that the others will be replaced with.

      Nota

      Se si selezionano due o più valori in un gruppo e un altro valore all'esterno del gruppo e quindi si impostano come sinonimi, verrà generato un messaggio di errore non corretto.If you select two or more values in a group and another value outside the group, and then set them as synonyms, you will get an incorrect error message. Dopo avere chiuso la finestra popup del messaggio di errore, i valori verranno impostati correttamente come sinonimi.After closing the error message popup, the values will be set correctly as synonyms.

    • Interrompi relazione tra sinonimi selezionati: fare clic per annullare la designazione di sinonimo.Break relation between selected synonyms: Click to undo the synonym designation.

    • Imposta il valore di dominio selezionato come valore iniziale del gruppo: modificare il valore iniziale del gruppo selezionando un valore nel gruppo non designato come valore iniziale, quindi facendo clic sul pulsante Imposta il valore di dominio selezionato come valore iniziale del gruppo .Set selected domain value as a leading value of its group: Change the leading value of the group by selecting a value in the group that is not designated as the leading value, and then clicking the Set selected domain value as a leading value of its group button.

  6. Correttore ortografico: se è stato abilitato il Correttore ortografico nella pagina Proprietà dominio, trovare tutti i valori con una sottolineatura rossa ondulata, l'indicazione che il Correttore ortografico sta suggerendo una correzione.Speller: If you have enabled the Speller in the Domain Properties page, find any values that have a wavy red underscore, the indication that the Speller is suggesting a correction. Fare clic con il pulsante destro del mouse sul valore con la sottolineatura e selezionare una correzione, se appropriata.Right-click the value with the underscore, and select a correction if one applies. Il tipo di valore diventa (o rimane) in errore e la correzione verrà aggiunta alla colonna Correggi in .The value type becomes (or stays as) error, and the correction will be added to the Correct to column. Fare clic sulla freccia in giù per visualizzare ulteriori correzioni proposte.Click the down arrow to see additional proposed corrections. Immettere una correzione manualmente per aggiungerla al dizionario del Correttore ortografico e poterla selezionare come correzione.Enter a correction manually to add it to the Speller dictionary, and be able to select it as a correction. Per ulteriori informazioni, vedere Use the DQS Speller e Set Domain Properties.For more information, see Use the DQS Speller and Set Domain Properties.

    Nota

    Per utilizzare il Correttore ortografico, è possibile abilitarlo nella pagina Proprietà dominio o, se è disabilitato nella pagina Proprietà dominio , è possibile fare clic sull'icona Abilita/Disabilita correttore ortografico nella pagina Gestisci risultati individuazione dati per abilitarlo in questa pagina.To use the Speller, you can either enable it in the Domain Properties page, or if it is disabled in the Domain Properties page, you can click the Enable/Disable Speller icon on the Manage Data Discovery Results page to enable it on this page.

  7. Aggiungi nuovo valore di dominio: aggiungere un nuovo valore al dominio facendo clic sul pulsante Aggiungi nuovo valore di dominio per aggiungere una riga alla fine della tabella.Add new domain value: Add a new value to the domain by clicking the Add new domain value button to add a row at the end of the table. Dopo avere immesso un valore, la riga verrà riposizionata in ordine alfabetico.After you enter a value, the row will be repositioned in alphabetical order.

  8. Importa valori di dominio da Excel: aggiungere nuovi valori da un foglio di calcolo di Excel facendo clic sulla freccia in giù per l'icona Importa valori , quindi selezionando Importa valori di dominio da Excel.Import domain values from Excel: Add new values from an Excel spreadsheet by clicking the down arrow for the Import Values icon, and then selecting Import domain values from Excel. Immettere il nome file, selezionare Utilizza la prima riga come intestazione se appropriato, quindi fare clic su OK.Enter the file name, select Use first row as header if appropriate, and then click OK. Per altre informazioni, vedere Import Values from an Excel File into a Domain.For more information, see Import Values from an Excel File into a Domain.

  9. Importa valori progetto: aggiungere nuovi valori da un progetto Data Quality facendo clic sulla freccia in giù per l'icona Importa valori , quindi selezionando Importa valori progetto.Import project values: Add new values from a Data Quality Project by clicking the down arrow for the Import Values icon, and selecting Import project values. Immettere il nome file, selezionare Utilizza la prima riga come intestazione se appropriato, quindi fare clic su OK.Enter the file name, select Use first row as header if appropriate, and then click OK. Selezionare il progetto da cui si desidera importare i valori, quindi fare clic su OK.Select the project that you want to import values from, and then click OK. Verranno visualizzati i valori importati.The imported values will be displayed. Fare clic su Fine.Click Finish. Per ulteriori informazioni, vedere Importare i valori di progetto in un dominio.For more information, see Import Project Values into a Domain.

  10. Elimina valori di dominio selezionati: rimuovere uno o più valori esistenti dal dominio selezionando i valori, quindi facendo clic sul pulsante Elimina valori di dominio selezionati .Delete selected domain value(s): Remove one or more existing values from the domain by selecting the values, and then clicking the Delete selected domain value(s) button. Non è possibile eliminare il valore DQS_NULL, pertanto se si scelgono più valori da eliminare e il valore DQS_NULL è tra questi, l'operazione non riuscirà.An entry of DQS_NULL cannot be deleted, so if you choose multiple values to delete, and an entry of DQS_NULL is one of them, the operation will fail.

  11. Fare clic su Fine per completare l'attività di individuazione delle informazioni.Click Finish to complete the knowledge discovery activity. Se non sono stati controllati tutti i domini, verrà visualizzata una finestra popup.A popup will be displayed if you have not reviewed each of the domains. Fare clic su per continuare il controllo o su No per procedere.Click Yes to continue reviewing or No to proceed. Se si fa clic su NO, verrà visualizzata un'altra finestra popup con le opzioni seguenti:If you click No, another popup will be displayed enabling you to do the following:

    1. Pubblica: la Knowledge Base verrà pubblicata per consentirne l'utilizzo da parte dell'utente corrente o di altri utenti.Publish: The knowledge base will be published for the current user or others to use. La Knowledge Base non verrà bloccata, lo stato della Knowledge Base nella relativa tabella verrà impostato come vuoto e saranno disponibili entrambe le attività, Gestione dominio e Individuazione informazioni.The knowledge base will not be locked, the state of the knowledge base (in the knowledge base table) will be set to empty, and both the Domain Management and Knowledge Discovery activities will be available. Verrà di nuovo visualizzata la home page.You will be returned to the home page. Per completare il processo, fare clic su nella finestra popup.To complete the process, click Yes in the popup.

    2. No: il lavoro verrà salvato, la Knowledge Base rimarrà bloccata e il relativo stato verrà impostato su In lavorazione.No: Your work will be saved, the knowledge base will remained locked, and the state of the knowledge base will be set to In work. Entrambe le attività Gestione dominio e Individuazione informazioni saranno disponibili.Both the Domain Management and Knowledge Discovery activities will be available. Verrà di nuovo visualizzata la home page.You will be returned to the home page.

    3. Annulla: verranno chiuse le finestre popup e si rimarrà nella pagina Gestisci valori di dominio .Cancel: The popup will be closed and you will be stay in the Manage Domain Value page.

  12. È inoltre possibile fare clic sulle opzioni seguenti:You can also click the following:

    • Annulla per terminare l'attività di individuazione delle informazioni. Il lavoro verrà perso e sarà visualizzata di nuovo la home page di DQS.Cancel to terminate the Knowledge Discovery activity, losing your work, and return to the DQS home page.

    • Chiudi per salvare il lavoro e tornare alla home page di DQS.Close to return to the DQS home page while saving your work. La Knowledge Base verrà bloccata e lo stato della Knowledge Base nella relativa tabella della schermata Apri Knowledge Base sarà Individuazione - Gestione valore.The knowledge base will be locked to you, and the state of the knowledge base in the knowledge base table in the Open Knowledge Base screen will be Discovery – Value Management.

    • Fare clic su Indietro per tornare alla pagina Individua .Click Back to return to the Discover page. Dopo avere fatto clic su Chiudiper eseguire l'attività Gestione dominio è necessario fare clic su Individuazione informazioni nella schermata Apri Knowledge Base , passare alla schermata Gestione Knowledge Base: Gestisci termini di dominio , fare clic su Fine, quindi fare clic su per pubblicare la Knowledge Base o su No per salvare il lavoro nella Knowledge Base e uscire.After clicking Close, to perform the Domain Management activity, you would have to click Knowledge Discovery from the Open knowledge base screen, proceed to the Knowledge Base Management: Manage Domain Terms screen, click Finish, and then click either Yes to publish the knowledge base or No to save the work on the knowledge base and exit.

Completamento: fasi successive all'esecuzione dell'individuazione delle informazioniFollow Up: After Performing Knowledge Discovery

Dopo avere aggiunto le informazioni alla Knowledge Base nel processo computerizzato di individuazione delle informazioni, è possibile utilizzare immediatamente la Knowledge Base per un progetto di pulizia o è possibile eseguire un'attività di gestione del dominio prima di eseguirne la pulizia.After you have adding knowledge to the knowledge case in the computer-assisted knowledge discovery process, you can either use the knowledge base for a cleansing project immediately, or you can perform domain management before performing cleansing. Per altre informazioni sulla pulizia dei dati o sulla gestione del dominio, vedere Pulizia dei dati o Gestione di un dominio.For more information about data cleansing or domain management, see Data Cleansing or Managing a Domain.

Significato dei valori Corretti, Errori e Non validiThe Meaning of Correct, Error, and Invalid Values

A ogni valore nella tabella Valore della pagina Valori di dominio è assegnata un'impostazione Tipo di Corretti, Errorio Non validi.Each value in the Value table of the Domain Values page is assigned a Type setting of Correct, Error, or Invalid. Il tipo del valore viene generato inizialmente dall'attività di individuazione delle informazioni ma è possibile modificarlo nel modo desiderato.The type of the value is generated initially by the knowledge discovery activity, and you can change it as you see fit. Il tipo finale, basato sia sulle modifiche di individuazione che su quelle interattive, viene generato dall'attività di pulizia.The final type, based upon both discovery and interactive changes, is generated by the cleansing activity. Le impostazioni hanno il significato seguente:These settings have the following meanings:

  • Corretti: si tratta di un valore che appartiene al dominio e non contiene errori di sintassi.Correct: This is a value that belongs to the domain and does not have any syntax errors. Ad esempio, "Chicago" in un dominio Città è corretto.For example, “Chicago” in a City domain is correct.

  • Errori: si tratta di un valore che appartiene al dominio, ma è un valore non corretto.Error: This is a value that belongs to the domain, but is an incorrect value. Ad esempio, "Shicago" anziché "Chicago" in un dominio Città è in errore.For example, “Shicago” instead of “Chicago” in a City domain is in error. In DQS un valore viene definito come in errore quando nel processo di individuazione vengono rilevati un errore di sintassi e una correzione associata.DQS designates a value as in error it detects a syntax error and an associated correction in the discovery process. Gli errori di sintassi includono gli errori di ortografia.Syntax errors include misspellings.

  • Non validi: si tratta di un valore che non appartiene al dominio e a cui non è associata una correzione.Invalid: This is a value that does not belong to the domain, and does not have a correction. Ad esempio, il valore "12345" in un dominio Città non è valido.For example, the value “12345” in a City domain is invalid. In DQS un valore viene definito come non valido quando non supera una regola di dominio.DQS designates a value as invalid when it fails a domain rule.

    È possibile modificare manualmente l'impostazione Tipo scegliendo uno degli altri due valori.You can manually change the Type of a value to either of the two other values. In DQS non viene applica la semantica della validità e dell'errore nelle operazioni manuali.DQS does not enforce validity and error semantics on manual operations. È possibile immettere una correzione per un valore Non validi senza modificarne lo stato.You can enter a correction for an Invalid value without changing its status. È possibile definire un valore come non valido anche se ha superato una regola di dominio.You can designate a value as invalid even if it did not fail a domain rule. È possibile definire un valore come in errore anche se il processo di individuazione non ha rilevato un errore di sintassi.You can designate a value as in error even if the discovery process did not indicate that it has a syntax error. È inoltre possibile rimuovere una correzione a un valore Errori, contrassegnato come Corretti, senza modificarne lo stato.You can also remove a correction to an Error value, which is marked as Correct, without changing its status.

    Quando si esegue la pulizia interattiva dei dati nella pagina Gestisci e visualizza risultati dell'attività Pulizia , nella scheda Non validi della pagina Gestisci e visualizza risultati vengono inclusi sia i valori in errore che quelli non validi.When you are performing interactive data cleansing in the Manage and View Results page of the Cleansing activity, both invalid and in-error values are included in the Invalid tab on the Manage and View Results page.

How to Display the Appropriate ValuesHow to Display the Appropriate Values

È possibile modificare la visualizzazione come segue:You can modify the display as follows:

  • Filtrare i risultati desiderati nella tabella, in base al relativo stato, selezionando lo stato nell'elenco a discesa Filtro .Filter the results that you want in the table, based on their status, by selecting the status in the Filter drop-down list.

  • Trovare i dati che si desidera controllare o modificare immettendo una o più lettere da cercare nella casella di testo Trova .Find the data that you want to check or modify by entering one more letters to search for in the Find text box. Tali lettere verranno evidenziate in tutti i valori visualizzati.This will highlight have those letters wherever they occur in any value that is displayed.

  • Fare clic su Mostra solo nuovi per limitare i valori visualizzati nella tabella solo ai valori individuati nella sessione corrente, non nelle sessioni precedenti.Click Show Only New to restrict the values displayed in the table only to values that were discovered in the current session, not previous sessions.

  • Fare clic sul pulsante Espandi tutto per visualizzare tutti i valori in qualsiasi gruppo di sinonimi quando lo stato corrente è compresso.Click the Expand All button to display all values in any group of synonyms when the current state is collapsed.

  • Fare clic sul pulsante Comprimi tutto per nascondere tutto tranne il valore iniziale in qualsiasi gruppo di sinonimi quando lo stato corrente è espanso.Click the Collapse All button to hide all but the leading value in any group of synonyms when the current state is expanded.

  • Fare clic sul pulsante Mostra/Nascondi il pannello della cronologia delle modifiche dei valori di dominio per visualizzare un'anteprima popup nella parte inferiore della tabella dei valori in cui vengono mostrate le modifiche recenti alla raccolta dei valori di dominio.Click the Show/Hide the Domain Values Changes History Panel button to display a preview popup at the bottom of the values table that shows recent changes to the domain values collection.

Statistiche del profilerProfiler Statistics

Nella scheda Profiler sono fornite statistiche tramite cui viene indicata la qualità dei dati di origine.The Profiler tab provides statistics that indicate the quality of the source data. Le statistiche non misurano la qualità della Knowledge Base.These statistics do not measure the quality of the knowledge base. Il profiling nell'individuazione informazioni fornisce informazioni essenziali quanto a completezza e univocitàProfiling in knowledge discovery gives insights on completeness and uniqueness. ma non misura l'accuratezza.Profiling in knowledge discovery is not measuring accuracy. Il profiling per la gestione delle informazioni consente di valutare l'importanza dell'origine dati per la compilazione e il miglioramento delle informazioni in una Knowledge Base.Profiling for knowledge management helps you assess the extent to which the data source is valuable for building and enhancing the knowledge in a knowledge base.

La scheda Profiler fornisce le statistiche seguenti per il processo di individuazione, per campo e dominio:The Profiler tab provides the following statistics for the discovery process, by field and domain:

  • Record: numero di record individuati nei dati di esempioRecords: How many records in the data sample were discovered

  • Valori totali: numero di valori totali trovati per ogni campo e in totaleTotal Values: How many total values were found for each field and in total

  • Nuovi valori: numero di valori totali nuovi dall'ultimo processo di individuazione per ogni campo e per tutti i campi di cui è stato eseguito il mapping e relativa percentuale di valori totaliNew Values: How many of the total values for each field and all mapped fields were new since the last discovery process, and their percentage of the total values

  • Nuovi valori: numero di valori totali univoci per ogni campo e per tutti i campi di cui è stato eseguito il mapping e relativa percentuale di valori totaliUnique Values: How many of the total values for each field and all mapped fields were unique, and their percentage of the total values

  • Nuovi valori univoci: numero di valori univoci nuovi dall'ultimo processo di individuazione per ogni campo e per tutti i campi di cui è stato eseguito il mapping e relativa percentuale di valori totaliNew Unique Values: How many of the unique values for each field and all mapped fields were new since the last discovery process, and their percentage of the total values

  • Validi nei valori di dominio: numero di valori totali validi per ogni campo e per tutti i campi di cui è stato eseguito il mapping e relativa percentuale di valori totaliValid in Domain Values: How many of the total values for each field and all mapped fields were valid, and their percentage of the total values

    Le statistiche relative ai campi includono:The field statistics include the following:

  • Campo: nome del campo nel database di origineField: Name of the field in the source database

  • Dominio: nome del dominio di cui è stato eseguito il mapping al campoDomain: Name of the domain that maps to the field

  • Nuovi: numero di valori nuovi e percentuale di valori nuovi rispetto ai valori esistenti nel campoNew: The number of new values and the percent of new values compared to existing values in the field

  • Univoco: numero di record univoci nel campo e relativa percentuale del totaleUnique: The number of unique records in the field and their percentaqe of the total

  • Valido nel dominio: numero di valori di dominio validi e relativa percentuale del totaleValid in Domain: The number of domain values that are valid and their percentage of the total

  • Completezza: completezza di ogni campo di origine di cui è stato eseguito il mapping per l'attività di individuazione delle corrispondenzeCompleteness: The completeness of each source field that is mapped for the matching exercise

    Il profiling nell'individuazione informazioni fornisce informazioni essenziali quanto a completezza.Profiling in knowledge discovery gives insights on completeness. Se il profiling suggerisce che un campo è relativamente incompleto, è necessario rimuoverlo dalla Knowledge Base di un progetto Data Quality.If profiling is telling you that a field is relatively incomplete, you might want to remove it from the knowledge base of a data quality project. È possibile che il profiling non fornisca statistiche di completezza affidabili per i domini compositi.Profiling may not provide reliable completeness statistics for composite domains. Se sono necessarie statistiche di completezza, utilizzare domini singoli anziché domini compositi.If you need completeness statistics, use single domains instead of composite domains. Se si desidera utilizzare domini compositi, è consigliabile creare una Knowledge Base con domini singoli di cui eseguire il profiling per determinare la completezza, quindi creare un altro dominio con un dominio composito per il processo di pulizia.If you want to use composite domains, you may want to create one knowledge base with single domains for profiling, to determine completeness, and create another domain with a composite domain for the cleansing process. Ad esempio, il profiling potrebbe mostrare una completezza del 95% per record relativi a indirizzi, utilizzando un dominio composito, ma potrebbe esservi un livello di incompletezza molto più alto per una delle colonne, ad esempio una colonna relativa al codice postale (CAP).For example, profiling could show 95% completeness for address records using a composite domain, but there could be a much higher level of incompleteness for one of the columns, for example, a postal (zip) code column. In questo esempio, è necessario misurare la completezza della colonna del CAP con un solo dominio.In this example, you might want to measure the completeness of the zip code column with a single domain. Il profiling fornirà probabilmente statistiche di accuratezza affidabili per i domini compositi perché è possibile misurare l'accuratezza di più colonne allo stesso tempo.Profiling will likely provide reliable accuracy statistics for composite domains because you can measure accuracy for multiple columns together. Il valore di questi dati sta nell'aggregazione composta, pertanto è consigliabile misurarne l'accuratezza con un dominio composito.The value of this data is in the composite aggregation, so you may want to measure the accuracy with a composite domain.

    Le statistiche vengono visualizzate nella scheda Profiler nelle fasi seguenti:Statistics are displayed in the Profiler tab in the following phases:

  • Nella fase Pre-elaborazione record in DQS vengono caricati i dati e indicizzati.In the Pre-processing Records phase, DQS loads the data and indexes it. Tale operazione viene eseguita un record alla volta o un batch alla volta, pertanto lo stato di avanzamento può essere visualizzato per record.This is done record by record or batch by batch, so progress can be displayed by records. Durante l'esecuzione di questo passaggio può essere generata la maggior parte dei dati di profiling, ad eccezione dei valori Valido nel dominio .During the execution of this step most of the profiling data can be generated, except for Valid in Domain values.

  • Nella fase Esecuzione regole di dominio la colonna Valido nel dominio viene popolata non appena le regole di dominio vengono tutte eseguite come unità atomica di ogni valore di dominio.In the Running Domain Rules phase, the Valid in Domain column is populated as domain rules are all executed as an atomic unit of each domain value.

  • Nella fase Esecuzione individuazione non viene eseguito l'aggiornamento di nuovi dati nella scheda Profiler. Tutti gli errori di sintassi rilevati possono essere visualizzati nel passaggio successivo della procedura guidata, la fase Gestisci valori di dominio.In the Running Discovery phase, no new data is updated in the Profiler tab. Any syntax errors encountered can be seen in the next step of the wizard, the Manage Domain Values phase.

    Per l'attività di individuazione delle informazioni, le condizioni seguenti generano notifiche:For the knowledge discovery activity, the following conditions result in notifications:

  • Non sono presenti nuovi valori in un campo. È consigliabile eliminarlo dal mapping.There are no new values in a field; it is recommended that you eliminate it from mapping.

  • Sono presenti alcuni valori nuovi in un campo. È possibile eliminarlo dal mapping.There are few new values in a field; you may want to eliminate it from mapping.

  • Un campo è vuoto. È consigliabile eliminarlo dal mapping.A field is empty; it is recommended that you eliminate it from mapping.

  • Il punteggio di completezza del campo è molto basso; è consigliabile eliminarlo dal mapping.The field completeness score is very low; you may want to eliminate it from mapping.

  • Un campo contiene solo valori non validi; è necessario verificare il mapping e la rilevanza delle regole di dominio sul contenuto del campo.All values in a field are invalid; you should verify the mapping and the relevancy of domain rules to the field contents.

  • Un campo contiene un basso livello di valori validi; è necessario verificare il mapping e la rilevanza delle regole di dominio sul contenuto del campo.There is a low level of valid values in the field; you should verify the mapping and the relevancy of domain rules to the field contents.

    Per ulteriori informazioni sul profiling, vedere Profiling di dati e notifiche in DQS.For more information about profiling, see Data Profiling and Notifications in DQS.