Editor de transformación Agrupación aproximada (ficha Columnas)
Use la ficha Columnas del cuadro de diálogo Editor de transformación Agrupación aproximada para especificar las columnas utilizadas para agrupar filas con valores duplicados.
Para obtener más información acerca de la transformación Agrupación aproximada, vea Transformación Agrupación aproximada.
Opciones
- Columnas de entrada disponibles
Seleccione en esta lista las columnas de entrada utilizadas para agrupar filas con valores duplicados.
- Nombre
Muestra los nombres de las columnas de entrada disponibles.
- Paso a través
Seleccione si la columna de entrada debe incluirse en la salida de la transformación. Todas las columnas utilizadas para la agrupación se copian automáticamente en la salida. Si activa esta columna, puede incluir columnas adicionales.
- Columna de entrada
Seleccione una de las columnas de entrada seleccionadas anteriormente en la lista Columnas de entrada disponibles.
- Alias de salida
Escriba un nombre descriptivo para la columna de salida correspondiente. De forma predeterminada, el nombre de la columna de salida es el mismo que el nombre de la columna de entrada.
- Alias de salida de grupo
Escriba un nombre descriptivo para la columna que contendrá el valor canónico de los valores duplicados agrupados. El nombre predeterminado de esta columna de salida es el nombre de la columna de entrada con _clean anexado.
- Tipo de coincidencia
Seleccione coincidencia exacta o aproximada. Las filas se consideran duplicadas si existe un parecido suficiente entre todas las columnas con un tipo de coincidencia aproximada. Si también especifica coincidencia exacta en determinadas columnas, sólo se consideran como posibles duplicados las filas que contienen valores idénticos en las columnas de coincidencia exacta. Por tanto, si sabe que una determinada columna no tiene errores o incoherencias, puede especificar coincidencia exacta en esa columna para aumentar la exactitud de la coincidencia aproximada en otras columnas.
- Similitud mínima
Establezca el umbral de similitud del nivel de combinación con el control deslizante. Cuanto más se acerque el valor a 1, más deberá parecerse el valor de búsqueda al valor de origen para que pueda calificarse como coincidencia. Al aumentar el umbral se puede mejorar la velocidad de la coincidencia ya que se tendrán en cuanta menos registros candidatos.
- Alias de salida de similitud
Especifique el nombre de una nueva columna de salida que contendrá los resultados de similitud de la combinación seleccionada. Si este valor se deja vacío, la columna de salida no se crea.
Números
Especifique la importancia de los números iniciales y finales en la comparación de los datos de la columna. Por ejemplo, si los números iniciales son significativos, "123 Main Street" no se agrupará con "456 Main Street."Valor Descripción Neither
Los números iniciales y finales no son significativos.
Leading
Sólo son significativos los números iniciales.
Trailing
Sólo son significativos los números finales.
LeadingAndTrailing
Tanto los números iniciales como los finales son significativos.
- Indicadores de comparación
Para obtener información sobre las opciones de comparación de cadenas, vea Comparar datos de cadena.
Vea también
Otros recursos
Integration Services Error and Message Reference
Cómo identificar filas de datos similares mediante la transformación Agrupación aproximada