Transformación de datos: escalado y reducción

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

En este artículo se describen los módulos de Machine Learning Studio (clásico) que pueden ayudarle a trabajar con datos numéricos. En el caso del aprendizaje automático, las tareas de datos comunes incluyen el recorte, la binning y la normalización de valores numéricos. Otros módulos admiten la reducción de dimensionalidad.

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Modelado de datos numéricos

Tareas como normalizar, binning o redistribuir variables numéricas son una parte importante de la preparación de los datos para el aprendizaje automático. Los módulos de este grupo admiten las siguientes tareas de preparación de datos:

  • Agrupación de datos en cubos de diferentes tamaños o distribuciones.
  • Quitar valores atípicos o cambiar sus valores.
  • Normalizar un conjunto de valores numéricos en un intervalo específico.
  • Crear un conjunto compacto de columnas de características a partir de un conjunto de datos de gran dimensión.

Lista de módulos

Esta categoría Transformación de datos: escala y reducción incluye los módulos siguientes:

  • Valores de recorte: detecta valores atípicos y, a continuación, recorta o reemplaza sus valores.
  • Agrupar datos en cubos: coloca datos numéricos en cubos.
  • Normalizar datos: vuelve a escalar los datos numéricos para restringir los valores del conjunto de datos a un intervalo estándar.
  • Análisis de componentes principales: calcula un conjunto de características que tienen una dimensionalidad reducida para un aprendizaje más eficaz.

Consulte también