Tabla de datos

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Clase de tabla de datos

Un conjunto de datos son los datos que se han cargado en Machine Learning Studio (clásico) para utilizarse en el proceso de modelado. Aunque cargue los datos en otro formato, o especifique un formato de almacenamiento como CSV, ARFF o TSV, los datos se convierten implícitamente en un objeto DataTable cada vez que los utiliza un módulo en un experimento.

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

El conjunto de datos se basa en la tabla de datos de .NET

Tipos de columna

Un DataTable está formado por una colección de columnas con metadatos asociados. Estas columnas implementan la interfaz IArray. Las columnas de datos de Machine Learning Studio (clásico) se entienden como matrices unidimensionales, es decir, vectores.

La clase .NET Array implementa estas interfaces genéricas: System.Collections.Generic.IList<T>, System.Collections.Generic.ICollection<T>y System.Collections.Generic.IEnumerable<T>.

Las columnas de tipos int, doubley se Boolean representan normalmente como matrices numéricas densas. Si una columna densa contiene valores que faltan, se controlará como una matriz de valores que faltan o como una matriz densa de objetos que acepta valores NULL.

Las columnas que contienen cadenas se administran como matrices densas de objetos. Si faltan valores, los valores que faltan se representan como valores NULL o como el tipo MissingValuesObjectArray<string>.

Para obtener más información, vea Array Class (MSDN Library).

Obtención de columnas en datatable

Puede obtener una columna llamando al método GetColumn en DataTable. El GetColumn método tiene dos sobrecargas:

  • GetColumn(<Int64>) obtiene una columna por su índice.

  • GetColumn(<string>) obtiene una columna por su nombre.

Otras interfaces en Studio (clásico)

En esta sección también se describen las siguientes interfaces para Machine Learning Studio (clásico):

Tipo Descripción
Interfaz ICluster La interfaz ICluster define la estructura de los modelos de agrupación en clústeres.
Interfaz IFilter La interfaz IFilter define la estructura de los filtros de procesamiento de señales digitales aplicados a una serie completa de valores numéricos. Los filtros se pueden crear y, a continuación, guardar y aplicar a una nueva serie.
Interfaz ILearner La interfaz ILearner proporciona una estructura genérica para definir y guardar modelos analíticos, excepto algunos tipos especiales, como los modelos de agrupación en clústeres.
Interfaz ITransform La interfaz ITransform proporciona una estructura genérica para definir y guardar transformaciones. Puede crear un iTransform mediante Machine Learning Studio (clásico) y, a continuación, aplicar la transformación a nuevos conjuntos de datos.

Consulte también

Tipos de datos del módulo