Columnas del modelo de minería de datos

Un modelo de minería de datos aplica un algoritmo de modelo de minería a los datos que se representan en una estructura de minería de datos. Al igual que la estructura, el modelo de minería de datos contiene columnas. La estructura de minería contiene el modelo de minería de datos y éste hereda todos los valores de las propiedades que define la estructura. El modelo puede utilizar todas las columnas que contiene la estructura de minería de datos o un subconjunto de las columnas.

En una columna de minería de datos puede definir dos elementos adicionales de información: uso e indicadores de modelado.

  • El uso es una propiedad que define cómo el modelo va a usar la columna. Las columnas se pueden usar como columnas de entrada, de clave o de predicción.

  • Los marcadores de modelado proporcionan al algoritmo información adicional sobre los datos que se definen en la tabla de casos, de forma que el algoritmo pueda generar un modelo más preciso. Puede definir indicadores de modelado mediante programación usando el lenguaje DMX (Extensiones de minería de datos) o en el Diseñador de minería de datos de Business Intelligence Development Studio.

La siguiente lista describe los indicadores de modelado que puede definir en una columna de modelo de minería de datos.

  • MODEL_EXISTENCE_ONLY
    Indica que la presencia del atributo es más importante que los valores que están en la columna de atributos. Por ejemplo, considere una tabla de casos que contenga una lista de elementos de pedido asociados con un cliente determinado. Los datos de la tabla incluyen el tipo de producto, el Id. y el costo de cada elemento. Para el modelado, el hecho de que el cliente haya adquirido un elemento de pedido concreto podría ser más importante que el costo del propio elemento. En este caso, la columna de costo debería marcarse como MODEL_EXISTENCE_ONLY.

  • REGRESSOR
    Indica que el algoritmo puede usar la columna especificada en la fórmula de regresión de algoritmos de regresión. Este indicador se admite en los algoritmos de árboles de decisión y de serie temporal de Microsoft.

Para obtener más información sobre la configuración de la propiedad de uso y la definición de indicadores de modelado mediante programación con DMX, vea CREATE MINING MODEL (DMX). Para obtener más información sobre la configuración de la propiedad de uso y la definición de indicadores en Business Intelligence Development Studio, vea Administrar modelos de minería de datos en el Diseñador de minería de datos.