Share via


Editor de transformación Agrupación aproximada (ficha Columnas)

Use la ficha Columnas del cuadro de diálogo Editor de transformación Agrupación aproximada para especificar las columnas utilizadas para agrupar filas con valores duplicados.

Para obtener más información acerca de la transformación Agrupación aproximada, vea Transformación Agrupación aproximada.

Opciones

  • Columnas de entrada disponibles
    Seleccione en esta lista las columnas de entrada utilizadas para agrupar filas con valores duplicados.
  • Nombre
    Muestra los nombres de las columnas de entrada disponibles.
  • Paso a través
    Seleccione si la columna de entrada debe incluirse en la salida de la transformación. Todas las columnas utilizadas para la agrupación se copian automáticamente en la salida. Si activa esta columna, puede incluir columnas adicionales.
  • Columna de entrada
    Seleccione una de las columnas de entrada seleccionadas anteriormente en la lista Columnas de entrada disponibles.
  • Alias de salida
    Escriba un nombre descriptivo para la columna de salida correspondiente. De forma predeterminada, el nombre de la columna de salida es el mismo que el nombre de la columna de entrada.
  • Alias de salida de grupo
    Escriba un nombre descriptivo para la columna que contendrá el valor canónico de los valores duplicados agrupados. El nombre predeterminado de esta columna de salida es el nombre de la columna de entrada con _clean anexado.
  • Tipo de coincidencia
    Seleccione coincidencia exacta o aproximada. Las filas se consideran duplicadas si existe un parecido suficiente entre todas las columnas con un tipo de coincidencia aproximada. Si también especifica coincidencia exacta en determinadas columnas, sólo se consideran como posibles duplicados las filas que contienen valores idénticos en las columnas de coincidencia exacta. Por tanto, si sabe que una determinada columna no tiene errores o incoherencias, puede especificar coincidencia exacta en esa columna para aumentar la exactitud de la coincidencia aproximada en otras columnas.
  • Similitud mínima
    Establezca el umbral de similitud del nivel de combinación con el control deslizante. Cuanto más se acerque el valor a 1, más deberá parecerse el valor de búsqueda al valor de origen para que pueda calificarse como coincidencia. Al aumentar el umbral se puede mejorar la velocidad de la coincidencia ya que se tendrán en cuanta menos registros candidatos.
  • Alias de salida de similitud
    Especifique el nombre de una nueva columna de salida que contendrá los resultados de similitud de la combinación seleccionada. Si este valor se deja vacío, la columna de salida no se crea.
  • Números
    Especifique la importancia de los números iniciales y finales en la comparación de los datos de la columna. Por ejemplo, si los números iniciales son significativos, "123 Main Street" no se agrupará con "456 Main Street."

    Valor Descripción

    Neither

    Los números iniciales y finales no son significativos.

    Leading

    Sólo son significativos los números iniciales.

    Trailing

    Sólo son significativos los números finales.

    LeadingAndTrailing

    Tanto los números iniciales como los finales son significativos.

  • Indicadores de comparación
    Para obtener información sobre las opciones de comparación de cadenas, vea Comparar datos de cadena.

Vea también

Otros recursos

Integration Services Error and Message Reference
Cómo identificar filas de datos similares mediante la transformación Agrupación aproximada

Ayuda e información

Obtener ayuda sobre SQL Server 2005