Таблица данных

Класс таблицы данных

Набор данных — это данные, которые были переданы в Машинное обучение Azure Studio (классическая модель), чтобы их можно было использовать в процессе моделирования. Даже если вы загрузите данные в другом формате или зададите формат хранения, такой как CSV, ARFF или TSV, при каждом использовании модулем в эксперименте данные будут неявно преобразовываться в объект DataTable.

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Набор данных основан на таблице данных .NET

Типы столбцов

DataTable состоит из набора столбцов с соответствующими метаданными. Эти столбцы реализуют интерфейс IArray. Столбцы данных в Машинное обучение Studio (классическая модель) понятны как одномерные массивы, то есть векторы.

Класс массива .NET реализует эти универсальные интерфейсы: System.Collections.Generic.IList<T> , System.Collections.Generic.ICollection<T> и System.Collections.Generic.IEnumerable<T> .

Столбцы типов int , double и Boolean обычно представляются как числовые сжатые массивы. Если в сжатом столбце содержатся отсутствующие значения, он будет обрабатывать либо как отсутствующий массив значений, либо как неограниченный массив объектов, допускающий значение null.

Столбцы, содержащие строки, обрабатываются как плотные массивы объектов. Если отсутствуют значения, отсутствующие значения представляются либо как значения NULL, либо как тип MissingValuesObjectArray<string> .

Дополнительные сведения см. в разделе класс Array (Библиотека MSDN).

Получение столбцов в DataTable

Столбец можно получить, вызвав GetColumn метод для DataTable. GetColumnМетод имеет две перегрузки:

  • GetColumn(<Int64>) получает столбец по его индексу.

  • GetColumn(<string>) получает столбец по его имени. 

Другие интерфейсы в студии (классическая модель)

Кроме того, в этом разделе описываются следующие интерфейсы для машинного обучения Azure:

Type Описание
Интерфейс ICluster Интерфейс Иклустер определяет структуру моделей кластеризации.
Интерфейс IFilter Интерфейс IFilter определяет структуру фильтров обработки цифровых сигналов, применяемых ко всему ряду числовых значений. Фильтры можно создать, а затем сохранить и применить к новому ряду.
Интерфейс ILearner Интерфейс ILearner предоставляет универсальную структуру для определения и сохранения аналитических моделей, исключая некоторые специальные типы, такие как модели кластеризации.
Интерфейс ITransform Интерфейс Итрансформ предоставляет универсальную структуру для определения и сохранения преобразований. Вы можете создать Итрансформ с помощью Машинное обучение Studio (классическая модель), а затем применить преобразование к новым наборам данных.

См. также

Типы данных модуля