Transformación de datos: escala y reducción
En este artículo se describen los módulos de Azure Machine Learning Studio (clásico) que pueden ayudarle a trabajar con datos numéricos. Para el aprendizaje automático, las tareas de datos comunes incluyen recorte, discretización y normalización de valores numéricos. Otros módulos admiten la reducción de dimensionalidad.
Nota
Se aplica a: machine learning Studio (clásico)
Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.
Modelado de datos numéricos
Tareas como normalizar, discretización o redistribuir variables numéricas son una parte importante de la preparación de datos para el aprendizaje automático. Los módulos de este grupo admiten las siguientes tareas de preparación de datos:
- Agrupación de datos en contenedores de tamaños o distribuciones variables.
- Quitar valores atípicos o cambiar sus valores.
- Normalizar un conjunto de valores numéricos en un intervalo específico.
- Crear un conjunto compacto de columnas de características a partir de un conjunto de los conjuntos de una dimensión alta.
Tareas relacionadas
- Seleccione las características relevantes y útiles que se usarán para crear el modelo: Use la selección de características o los módulos de análisis lineal de discriminante de Fisher .
- Seleccione características en función de los recuentos de los valores: Use el módulo de aprendizaje con recuentos .
- Quitar o reemplazar los valores que faltan: Use el módulo limpiar datos que faltan .
- Reemplace los valores de categorías por valores numéricos que se derivan de los cálculos: Use el módulo reemplazar valores discretos .
- Calcular una distribución de probabilidad para columnas discretas o numéricas: Use el módulo evaluar la función de probabilidad .
- Filtre y transforme señales digitales y de forma de onda: Use el módulo de filtro .
Lista de módulos
Esta categoría transformación de datos: escala y reducción incluye los siguientes módulos:
- Valores de clip: detecta valores atípicos y, a continuación, recorta o reemplaza sus valores.
- Agrupar datos en ubicaciones: coloca los datos numéricos en ubicaciones.
- Normalizar datos: cambia el tamaño de los datos numéricos para restringir los valores del conjunto de datos a un intervalo estándar.
- Análisis de componentes principales: calcula un conjunto de características que tienen una dimensionalidad reducida para un aprendizaje más eficaz.