Novedades (Analysis Services - Minería de datos)

La versión más reciente de MicrosoftSQL ServerAnalysis Services presenta características nuevas y mejoras.

Creación de conjuntos de pruebas de exclusión

Al crear una estructura de minería de datos, ahora puede dividir los datos de la estructura en conjuntos de prueba y de aprendizaje. La definición de la partición se almacena con la estructura, para que pueda reutilizar los conjuntos de pruebas y aprendizaje con cualquier modelo de minería que se base en esa estructura.

Los datos se dividen entre las particiones de prueba y aprendizaje, pero también puede especificar la inicialización que se usa para crear las particiones, si necesita volver a crear una.

Especifique el tamaño del conjunto de aprendizaje como un porcentaje del número total de filas, como un número máximo de filas, o como una combinación de estos requisitos. Para obtener más información sobre cómo utilizar los conjuntos de datos de aprendizaje y pruebas, vea Crear particiones de los datos en conjuntos de entrenamiento y de pruebas (Analysis Services - Minería de datos).

Para obtener más información acerca de todas las características de validación de modelos de SQL Server 2008, vea Validar modelos de minería de datos (Analysis Services - Minería de datos).

Filtrar según casos de modelos

Ahora puede asociar filtros a un modelo de minería y aplicar el filtro durante el aprendizaje y también en las pruebas. La aplicación de un filtro al modelo le permite controlar los datos que se utilizan para entrenar el modelo y evaluar más fácilmente su rendimiento en los subconjuntos de datos.

Por ejemplo, podría desear conocer la exactitud de un modelo de envío de correo directo sólo para los clientes con un determinado nivel de ingresos. Puede aplicar el filtro en la columna Ingreso del modelo de minería al crear el gráfico de elevación, y ver los resultados sólo para esos datos demográficos.

Business Intelligence Development Studio también proporciona nuevos editores de filtros para ayudarle a generar condiciones complejas que se pueden aplicar a tablas de casos y a tablas anidadas.

Para obtener información acerca de cómo crear filtros de modelos de minería de datos, vea Crear filtros para modelos de minería (Analysis Services - Minería de datos).

Para obtener información acerca cómo filtrar los datos para las pruebas del modelo de minería, vea Herramientas de gráficos de precisión de modelos (Analysis Services - Minería de datos).

Validación cruzada de varios modelos de minería

La validación cruzada es un método establecido para evaluar la exactitud de los modelos de minería de datos. En la validación cruzada, divide sucesivamente los datos de la estructura de minería en subconjuntos, genera modelos en los subconjuntos y, a continuación, mide la exactitud del modelo para cada partición. Revisando las estadísticas devueltas, puede determinar el grado de confiabilidad del modelo de minería y comparar más fácilmente los modelos que se basan en la misma estructura.

La validación cruzada está disponible en la vista Gráfico de precisión de minería de datos del Diseñador de minería de datos. También puede dividir una estructura de minería, probar varios modelos de minería y generar un análisis con los procedimientos almacenados de Analysis Services.

En SQL Server 2008, para generar un informe de validación cruzada, se especifica la estructura de minería y el atributo de predicción, y a continuación se especifica el número de divisiones en los que segmentar los datos del caso.

Analysis Services devuelve una tabla que notifica estadísticas como la probabilidad o el error de la raíz cuadrada de la media aritmética para las particiones individuales, y la media y desviación estándar de todas las medidas para los modelos agregados. Para obtener más información, vea Validación cruzada (Analysis Services - Minería de datos).

Compatibilidad con complementos de minería de datos para Office 2007

SQL Server 2008 admite la creación, administración y uso de modelos de minería de datos de Microsoft Excel al utilizar complementos de minería de datos de SQL Server 2008 para Office 2007. La versión más reciente de este popular complemento libre se ha mejorado agregando compatibilidad para particiones de aprendizaje y prueba del laso del servidor, validación cruzada y varias nuevas herramientas analíticas tales como el análisis de la cesta de la compra y una calculadora de predicción imprimible.

También puede utilizar el Asistente para documentar modelos para crear fácilmente la documentación para las estructuras y modelos almacenados en una instancia de SQL Server 2008. Para obtener más información sobre los complementos, vea Complementos de minería de datos de Office 2007.

Mejoras del algoritmo de serie temporal de Microsoft

Para mejorar la exactitud y estabilidad de algunas predicciones de los modelos de serie temporal, se ha agregado un algoritmo nuevo al algoritmo de serie temporal de Microsoft. El nuevo algoritmo, que se basa en el algoritmo ARIMA conocido, permite realizar mejores predicciones a largo plazo que el algoritmo ARTxp que Analysis Services usa. (ARTXP es un algoritmo de árbol con regresión automática que está optimizado para predicciones a corto plazo o en un período único).

De forma predeterminada, la nueva implementación del algoritmo de serie temporal de Microsoft utiliza el algoritmo ARTxp para entrenar una versión del modelo y el algoritmo ARIMA para entrenar otra versión. A continuación, el algoritmo pondera los resultados de estos dos modelos para proporcionar las características de la predicción que el usuario prefiera. Si no desea utilizar esta implementación predeterminada, puede especificar que el uso del algoritmo de serie temporal de Microsoft sólo use el algoritmo ARTXP o ARIMA. En SQL Server 2008 Enterprise, puede especificar una ponderación personalizada de los algoritmos para proporcionar la mejor predicción a través de un intervalo de tiempo variable.

El algoritmo de serie temporal de Microsoft ahora también acepta datos durante la predicción para tener en cuenta los nuevos escenarios empresariales. Por ejemplo, puede crear un modelo de predicción de ingresos que se base en los promedios de los productos, agregados regionales o algún otro conjunto de datos amplio. A continuación, puede aplicar ese modelo a la serie temporal que muestre las ventas de un producto individual. Aplicando el modelo general, puede aprovechar la ventaja de la estabilidad y disponibilidad de los datos agregados y personalizar la predicción para el producto individual.

También podría entrenar modelos con varias series y, a continuación, aplicarlos a los nuevos datos para predecir escenarios con diferentes posibilidades.

Para obtener más información acerca de los modelos de minería de datos de series temporales, vea Algoritmo de serie temporal de Microsoft y PredictTimeSeries (DMX).

Obtención de detalles para casos y columnas de estructura

En SQL Server 2008, si habilita la obtención de detalles en una estructura de minería, puede consultar los detalles devueltos y la estructura de minería de datos acerca de los casos que se usan en el aprendizaje y en las pruebas. Puede crear consultas de obtención de detalles en una estructura con Extensiones de minería de datos (DMX).

Es más, si la obtención de detalles se habilita en un modelo de minería y la estructura de minería de datos relacionada, puede crear consultas que recuperen columnas de datos de la estructura de minería subyacente. Esto es útil si desea obtener información detallada sobre los casos en un nodo determinado. Por ejemplo, podría recuperar información de contacto para los clientes en un clúster determinado.

Para obtener más información, vea Usar la obtención de detalles en los modelos y estructuras de minería (Analysis Services - Minería de datos).

Para obtener ejemplos de consultas DMX en una estructura de minería de datos, vea SELECT FROM <estructura>.CASES.

Para obtener ejemplos de obtención de detalles de un modelo de estructura de datos, vea SELECT FROM <model>.CASES (DMX).

Uso de alias en columnas de un modelo de minería de datos

Ahora puede agregar alias a las columnas de un modelo de minería para facilitar la comprensión del contenido de las columnas y la referencia a la columna en las instrucciones DMX.

Por ejemplo, si genera una estructura de minería de datos que contiene versiones continuas y discretas de los mismos datos, puede dar a ambas columnas el mismo nombre para facilitar la comparación.

Para obtener más información sobre cómo administrar y ver los alias, vea Establecer propiedades en un modelo de minería de datos o Cómo crear un alias para una columna de modelo.

Para obtener información sobre cómo crear un alias de columna con DMX, vea ALTER MINING STRUCTURE (DMX).

Consultar los conjuntos de filas de esquema de minería de datos

En SQL Server 2008,muchos de los conjuntos de filas de esquema de minería de datos de OLE DB existentes se han expuesto como un conjunto de tablas del sistema que puede consultar con facilidad utilizando las instrucciones DMX. Esto hace fácil recuperar metadatos relacionados con modelos y estructuras, extraer detalles del contenido del modelo de minería, o supervisar una instancia o un servicio de Servicios de análisis.

Para obtener más información, vea Consultar los conjuntos de filas de esquema de minería de datos (Analysis Services - Minería de datos).

Nueva ubicación de los ejemplos

Los Libros en pantalla ya no incluyen bases de datos ni aplicaciones de ejemplo de SQL Server. Estas bases de datos y aplicaciones de ejemplo están ahora disponibles en el sitio web de ejemplos de SQL Server. Este sitio web facilita a los usuarios la búsqueda de estos ejemplos y proporciona otros ejemplos adicionales relacionados con MicrosoftSQL Server y Business Intelligence. En el sitio web de ejemplos de SQL Server, puede llevar a cabo las acciones siguientes:

  • Examinar los ejemplos enviados por programadores, usuarios y la comunidad de profesionales más valorados (MVP) de Microsoft.

  • Descargar bases de datos de ejemplo y proyectos de código.

  • Ver o participar en un área de discusión donde puede notificar problemas y hacer preguntas sobre los ejemplos de cada área de tecnología.

Instalación simultánea con SQL Server 2005 Analysis Services

SQL Server 2008Analysis Services se puede instalar a partir de ahora junto con SQL Server 2005 Analysis Services (SSAS). Para obtener más información, vea Trabajar con varias versiones e instancias de SQL Server.

Para obtener información sobre problemas de la instalación simultánea que afectan a Analysis Services, vea el archivo Léame de esta versión.

Realizar una copia de seguridad y restaurar las bases de datos de Analysis Services

Se ha mejorado la capacidad que permite realizar una copia de seguridad y restaurar una base de datos de Analysis Services. Hay menos restricciones en el tamaño de la base de datos y se ha reducido en gran medida el tiempo que se requiere para las operaciones de copia de seguridad y restauración.

Para obtener más información, vea Novedades (Analysis Services - Base de datos multidimensional).

Otras mejoras de Analysis Services

Si utiliza Analysis Services para crear cubos OLAP que también utilice en minería de datos, podría encontrar mucho más fácil diseñar las dimensiones y sus jerarquías y atributos relacionados. El Diseñador de dimensiones incluye un nuevo diseñador de relaciones de atributos que ayuda a diseñar las relaciones de los atributos y a asegurarse de que siguen las prácticas recomendadas.

Para obtener más información, vea Novedades (Analysis Services - Base de datos multidimensional).