Преобразование "Выбор столбцов"

Создает преобразование, которое выбирает то же подмножество столбцов, что и в заданном наборе данных

Категория: Преобразование или управление данными

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

В этой статье описывается использование модуля преобразования Select Columns в машинное обучение Azure Studio (классическая модель). Целью модуля преобразования Select Columns является обеспечение того, что в последующих операциях машинного обучения всегда используется прогнозируемый, последовательный набор столбцов.

Этот модуль особенно полезен для таких задач, как оценка, для которой требуются определенные столбцы. Изменения в доступных столбцах могут привести к нарушению эксперимента или изменению результатов.

Используйте Преобразование выбор столбцов для создания и сохранения набора столбцов. Затем используйте модуль Применить преобразование , чтобы применить эти параметры к новым данным.

Использование преобразования «выбор столбцов»

В этом сценарии предполагается, что вы планируете использовать выбор компонентов для создания динамического набора столбцов, который будет использоваться для обучения модели. Чтобы убедиться, что выбранные столбцы одинаковы для процесса оценки, используйте модуль Преобразование выбор столбцов , чтобы записать выбор столбцов и применить их в любом расположении эксперимента.

  1. Добавьте входной набор данных в эксперимент в студии (классическая модель).

  2. Добавление экземпляра компонента на основе фильтра.

  3. Подключите модули и настройте модуль выбора компонентов, чтобы автоматически найти некоторое количество лучших функций во входном наборе данных.

  4. Добавьте экземпляр обучения модели и используйте выходные данные выбора компонентов на основе фильтра в качестве входных данных для обучения.

    Важно!

    Поскольку важность признаков зависит от значений в столбце, невозможно заранее выяснить, какие столбцы могут быть доступны для обучения модели.

  5. Теперь присоедините экземпляр модуля преобразования Select Columns .

    При этом в качестве преобразования выбирается столбец, который можно сохранить или применить к другим наборам данных. Этот шаг гарантирует, что столбцы, идентифицируемые выбором компонентов, будут сохранены для повторного использования другими модулями.

  6. Добавьте модуль Оценка модели .

    Не подключайте входной набор данных.

    Вместо этого добавьте модуль « Применить преобразование » и Соедините выходные данные преобразования «выбор компонентов».

    Важно!

    Невозможно применить Выбор компонентов на основе фильтра к набору данных оценки и получить те же результаты. Поскольку выбор компонентов основан на значениях, он может выбрать другой набор столбцов, что приведет к сбою операции оценки.

  7. Запустите эксперимент.

Этот процесс сохранения и применения выбора столбцов гарантирует, что одна и та же схема данных будет доступна для обучения и оценки.

Примеры

Примеры использования этого модуля см. в Коллекция решений ии Azure:

Ожидаемые входные данные

Имя Type Описание
Набор данных с нужными столбцами Таблица данных Набор данных, содержащий нужный набор столбцов

Выходные данные

Имя Type Описание
Преобразование «выбор столбцов» Интерфейс ITransform Преобразование, которое выбирает то же подмножество столбцов, что и в заданном наборе данных.

Исключения

Исключение Описание
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.

См. также раздел

Управлять
Выбор столбцов в наборе данных