Editor trasformazione Raggruppamento fuzzy (scheda Colonne)Fuzzy Grouping Transformation Editor (Columns Tab)

Utilizzare la scheda Colonne della finestra di dialogo Editor trasformazione Raggruppamento fuzzy per specificare le colonne utilizzate per raggruppare le righe contenenti valori duplicatiUse the Columns tab of the Fuzzy Grouping Transformation Editor dialog box to specify the columns used to group rows with duplicate values.

Per ulteriori informazioni sulla trasformazione Raggruppamento fuzzy, vedere Fuzzy Grouping Transformation.To learn more about the Fuzzy Grouping transformation, see Fuzzy Grouping Transformation.

OpzioniOptions

Colonne di input disponibiliAvailable Input Columns
Consente di selezionare le colonne di input utilizzate per raggruppare le righe contenenti valori duplicati.Select from this list the input columns used to group rows with duplicate values.

NomeName
Consente di visualizzare i nomi delle colonne di input disponibili.View the names of available input columns.

Pass-throughPass Through
Consente di includere la colonna di input nell'output della trasformazione.Select whether to include the input column in the output of the transformation. Tutte le colonne utilizzate per il raggruppamento vengono copiate automaticamente nell'output.All columns used for grouping are automatically copied to the output. Selezionando questa colonna è possibile includere colonne aggiuntive.You can include additional columns by checking this column.

Colonna di inputInput Column
Consente di selezionare una delle colonne di input selezionate precedentemente nell'elenco Colonne di input disponibili .Select one of the input columns selected earlier in the Available Input Columns list.

Alias di outputOutput Alias
Consente di immettere un nome descrittivo per la colonna di output corrispondente.Enter a descriptive name for the corresponding output column. Per impostazione predefinita, il nome della colonna di output corrisponde al nome della colonna di input.By default, the output column name is the same as the input column name.

Alias di output gruppoGroup Output Alias
Consente di immettere un nome descrittivo per la colonna che conterrà il valore canonico per i duplicati raggruppati.Enter a descriptive name for the column that will contain the canonical value for the grouped duplicates. Il nome predefinito di questa colonna di output è il nome della colonna di input con l'aggiunta di _clean.The default name of this output column is the input column name with _clean appended.

Tipo di corrispondenzaMatch Type
Consente di selezionare la corrispondenza fuzzy o esatta.Select fuzzy or exact matching. Le righe vengono considerate duplicati se sono sufficientemente simili in tutte le colonne della corrispondenza fuzzy.Rows are considered duplicates if they are sufficiently similar across all columns with a fuzzy match type. Se inoltre si specifica la corrispondenza esatta su determinate colonne, vengono considerati possibili duplicati solo le righe contenenti valori identici nelle colonne della corrispondenza esatta.If you also specify exact matching on certain columns, only rows that contain identical values in the exact matching columns are considered as possible duplicates. Se si sa pertanto che una determinata colonna non contiene errori o inconsistenze, è possibile specificare la corrispondenza esatta su tale colonna per aumentare la precisione della corrispondenza fuzzy su altre colonne.Therefore, if you know that a certain column contains no errors or inconsistencies, you can specify exact matching on that column to increase the accuracy of the fuzzy matching on other columns.

Somiglianza minimaMinimum Similarity
Consente di impostare la soglia di somiglianza minima a livello di join tramite un dispositivo di scorrimento.Set the similarity threshold at the join level by using the slider. Più il valore è vicino a 1, maggiore deve essere la somiglianza tra il valore di ricerca e il valore di origine per essere considerata una corrispondenza.The closer the value is to 1, the closer the resemblance of the lookup value to the source value must be to qualify as a match. L'aumento della soglia può migliorare la velocità di confronto, poiché verrà considerato un numero minore di record candidati.Increasing the threshold can improve the speed of matching since fewer candidate records need to be considered.

Alias di output somiglianzaSimilarity Output Alias
Consente di specificare il nome di una nuova colonna di output contenente i punteggi di somiglianza per il join selezionato.Specify the name for a new output column that contains the similarity scores for the selected join. Se non si specifica un valore, la colonna di output non viene creata.If you leave this value empty, the output column is not created.

NumeraliNumerals
Consente di specificare l'importanza dei numerali iniziali e finali nel confronto dei dati della colonna.Specify the significance of leading and trailing numerals in comparing the column data. Ad esempio, se i numerali iniziali sono significativi, "2005 Vendite" non verrà raggruppato con "2004 Vendite".For example, if leading numerals are significant, "123 Main Street" will not be grouped with "456 Main Street."

ValueValue DescriptionDescription
NessunoNeither I numerali iniziali e finali non sono significativi.Leading and trailing numerals are not significant.
InizialiLeading Sono significativi solo i numerali iniziali.Only leading numerals are significant.
FinaliTrailing Sono significativi solo i numerali finali.Only trailing numerals are significant.
Iniziali e finaliLeadingAndTrailing Sono significativi i numerali sia iniziali che finali.Both leading and trailing numerals are significant.

Flag di confrontoComparison Flags
Per altre informazioni sulle opzioni per il confronto di stringhe, vedere Confronto di dati stringa.For information about the string comparison options, see Comparing String Data.

Vedere ancheSee Also

Errori di Integration Services e riferimento ai messaggi Integration Services Error and Message Reference
Identificare le righe di dati simili tramite la trasformazione Raggruppamento FuzzyIdentify Similar Data Rows by Using the Fuzzy Grouping Transformation