Impostare le proprietà di un dominio

In questo argomento viene descritto come impostare le proprietà di un dominio in Data Quality ServicesData Quality Services (DQS).

Prima di iniziare

Prerequisiti

Per impostare le proprietà per un dominio, è necessario avere creato una Knowledge Base e un dominio.

Sicurezza

Autorizzazioni

È necessario disporre del ruolo dqs_kb_editor o dqs_administrator nel database DQS_MAIN per impostare le proprietà in un dominio.

Impostare le proprietà di un dominio

  1. Impostare le proprietà in un dominio esistente aprendo una knowledge base nell'attività Gestione dominio (vedere aprire una Knowledge Base) e quindi selezionare il dominio appropriato nella dominio elenco. Per impostazione predefinita, verrà visualizzata la pagina Proprietà dominio.

  2. Impostare le proprietà in un nuovo dominio dopo averlo creato come descritto in creare un dominio.

  3. Fare clic su Fine per completare l'attività di gestione del dominio, come descritto in End the Domain Management Activity.

Completamento: fasi successive all'impostazione delle proprietà di un dominio

Dopo avere impostato le proprietà di un dominio, è possibile eseguire ulteriori attività di gestione del dominio, quali l'individuazione delle informazioni per aggiungere informazioni al dominio o l'aggiunta di criteri di corrispondenza al dominio. Per ulteriori informazioni, vedere eseguire l'individuazione delle informazioni, gestione di un dominio, o creare un criterio di corrispondenza.

Proprietà dominio

Nome e descrizione del dominio

Dopo la creazione di un dominio è possibile modificarne il nome o la descrizione. Il nome del dominio deve essere univoco per la Knowledge Base. La descrizione può contenere fino a 256 caratteri.

Tipo di dati

Quando si crea il dominio, selezionare uno dei seguenti tipi di dati per i valori nel dominio: stringa (impostazione predefinita), Data, intero, o decimale. Dopo avere creato il dominio, è possibile visualizzare il tipo di dati ma non modificarli. Tramite il tipo di dati selezionato per un dominio viene definito il tipo di dati di origine di cui è possibile eseguire il mapping al dominio. Per informazioni sui tipi di dati supportati per ognuno dei tipi di dati quattro dominio in DQS, vedere SQL Server supportate e i tipi di dati SSIS per i domini DQS.

Utilizza valori iniziali

Selezionare questa casella di controllo per specificare che venga restituito il valore iniziale in un gruppo di sinonimi anziché un valore di cui è sinonimo. Deselezionare utilizza valori iniziali per specificare che ogni valore di sinonimo verrà restituito nel formato corretto o e non viene sostituita dal valore iniziale per il gruppo.

Normalizza stringa

Se il tipo di dati è stringa, fare clic per ignorare i caratteri speciali nei dati di origine per l'elaborazione da parte di DQS qualità dei dati. In DQS vengono sostituiti internamente i caratteri speciali con un valore Null o uno spazio quando i dati vengono caricati nel dominio. I due punti, il trattino, il punto, le virgolette doppie o il punto e virgola vengono sostituiti da uno spazio. Le virgolette semplici vengono sostituite da un valore Null. L'utilizzo del valore Null raggruppa le due parti di una stringa.

Ignorando i caratteri speciali in un valore stringa è possibile aumentare la precisione della corrispondenza. Il punteggio di somiglianza tra due stringhe può essere aumentato sostituendo i caratteri speciali con un valore Null o uno spazio. I segni di punteggiatura o gli altri simboli possono essere facilmente diversi nelle varie stringhe. La sostituzione interna in DQS di caratteri speciali può consentire al punteggio di superare la soglia di corrispondenza minima, facendo sì che due stringhe vengano considerate corrispondenti laddove non lo fossero. Tuttavia, la scelta di ignorare i caratteri speciali può dipendere dal tipo di dati su cui viene eseguita la corrispondenza. Se ad esempio si utilizzano i dati nel sistema di misurazione anglosassone, ignorare le virgolette doppie e le virgolette semplici nei dati del prodotto può comportare falsi positivi se le virgolette doppie stanno per pollici e le virgolette semplici stanno per piedi.

La normalizzazione viene eseguita quando i dati vengono caricati e indicizzati nelle fasi di elaborazione dei dati delle attività di individuazione, criteri di corrispondenza, progetto corrispondente e progetto di pulizia. Se abilitate, la normalizzazione e la trasformazione delle relazioni basate su termini vengono entrambe eseguite in una fase di pre-elaborazione prima dell'analisi. Vengono eseguite su ogni dominio prima dell'applicazione di qualsiasi algoritmo che calcola la somiglianza tra stringhe. Se è richiesta l'analisi di un dominio composito, essa verrà eseguita prima della normalizzazione e della trasformazione delle relazioni basate su termini, perché l'analisi basata su delimitatore richiede l'utilizzo di simboli. Altre operazioni, quali le regole di dominio e le modifiche ai valori del dominio, verranno eseguite dopo le trasformazioni. I dati risultanti non vengono modificati dalla sostituzione interna in DQS dei caratteri speciali.

Formato output in

Selezionare la formattazione che verrà applicata alla restituzione dei valori dei dati nel dominio. La formattazione è specifica del tipo di dati selezionato, come mostrato nell'elenco seguente. Selezione Nessuno significa che verrà applicato alcun formato nell'elenco.

  • Per un valore stringa, è possibile specificare di restituire la stringa tutta in maiuscole, tutta in minuscole o solo con l'iniziale maiuscola.

  • Per un valore data, è possibile specificare il formato del giorno, del mese e dell'anno.

  • Per un valore intero, è possibile specificare il tipo di maschera del formato da applicare.

  • Per un valore decimale, è possibile specificare la precisione e il tipo di maschera del formato da applicare.

Linguaggio

Se il tipo di dati è stringa, selezionare la lingua che si desidera associare il dominio per il correttore ortografico. Questa selezione è valida solo per il correttore ortografico perché i relativi risultati dipendono dalla lingua utilizzata. La selezione è valida solo per un singolo dominio con un tipo di dati stringa. La proprietà lingua non riguarda i domini compositi. La lingua per ogni parte di un dominio composito è determinata dal singolo dominio relativo.

La lingua predefinita è l'inglese. L'impostazione di Language proprietà altri Disabilita il correttore ortografico per il dominio.

Suggerimento

Se la lingua non è elencata nel Language elenco a discesa, è necessario selezionare altri. Ciò garantisce che i duplicati vengano puliti ed eliminati da DQS per i dati della lingua non elencata in base alle informazioni disponibili (regole di dominio, valori di dominio, TBR, regola di corrispondenza) nel dominio.

Abilita correttore ortografico

Se il tipo di dati è stringa, fare clic per abilitare il correttore ortografico DQS per il dominio. Il correttore ortografico funziona solo sui domini con tipo di dati stringa. Il Abilita correttore ortografico casella di controllo Abilita il correttore ortografico solo per il singolo dominio associato alla casella di controllo. La casella di controllo non è valida per un dominio composito.

Il correttore ortografico propone le correzioni di sintassi e di convalida per i valori nel dominio. Per ulteriori informazioni, vedere utilizzare il correttore ortografico DQS.

Disabilita algoritmi di errore sintassi

Se il tipo di dati è stringa, selezionare questa opzione per specificare che gli errori di sintassi non verranno essere identificati da DQS nel dominio durante la pulizia. Selezionare questa casella di controllo quando non è importante identificare gli errori di sintassi per il dominio, ad esempio per un numero di serie. Questo controllo è disponibile solo per il tipo di dati stringa. Il controllo degli errori di sintassi non verrà eseguito nei tipi di dati non stringa.