Transformación de datos

En este artículo se enumeran los módulos que se proporcionan en Azure Machine Learning Studio (clásico) para la transformación de datos. En machine learning, la transformación de datos implica algunas tareas muy generales, como combinar conjuntos de datos o cambiar nombres de columna. Sin embargo, también incluye muchas tareas específicas del aprendizaje automático, como normalización, discretización y agrupación, e inferencia de valores que faltan.

Nota

Se aplica a: machine learning Studio (clásico)

Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.

Importante

Generalmente se espera que los datos que se usan en Machine Learning Studio (clásico) estén "ordenados" antes de importarlos a Machine Learning Studio (clásico). La preparación de datos puede incluir, por ejemplo, la garantía de que los datos usan la codificación correcta y la comprobación de que los datos tienen un esquema coherente.

Puede usar Azure Machine Learning Workbench para transformar y preparar todos los tipos de datos. Para obtener ejemplos, vea transformaciones de datos "por ejemplo" en machine learning Workbench.

Los módulos para la transformación de datos se agrupan en las siguientes categorías basadas en tareas:

  • Crear filtros para el procesamiento de señales digitales: los filtros de señal digital se pueden aplicar a los datos numéricos para admitir tareas de aprendizaje automático, como el reconocimiento de imágenes, el reconocimiento de voz y el análisis de la forma de onda.
  • Generación y uso de características basadas en recuentos: los módulos características basados en recuentos le ayudan a desarrollar características compactas para usarlas en machine learning.
  • Manipulación y preparación de los datos generales: combinar conjuntos de datos, limpiar los valores que faltan, agrupar y resumir los datos, cambiar los nombres de columna y los tipos de datos, o indicar qué columna es una etiqueta o una característica.
  • Muestreo y división de conjuntosde datos: Divida los datos en conjuntos de entrenamiento y de prueba, divida los conjuntos de datos por porcentaje o por una condición de filtro o realice el muestreo.
  • Escalado y reducción de datos: Prepare datos numéricos para el análisis aplicando la normalización o mediante el escalado. Los datos de la ubicación en grupos, quitar o reemplazar valores atípicos o realizar análisis de componentes principales (PCA).

Lista de módulos

En la categoría transformación de datos se incluyen las siguientes categorías de módulo:

Consulte también