Значение функции перестановки

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Вычисляет оценки важности признака перестановки для переменных признака при заданной обученной модели и заданном проверочном наборе данных

Категория: модули выбора компонентов

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается использование модуля " важность функции перестановки " в Машинное обучение Studio (классическая модель) для вычисления набора показателей важности признаков для набора данных. Используйте эти показатели при определении наиболее подходящих функций для модели.

В этом модуле значения компонентов случайным образом перемещаются, по одному столбцу за раз, а производительность модели измеряется до и после. Можно выбрать одну из стандартных метрик, предоставляемых для измерения производительности.

Результаты, возвращаемые модулем, представляют изменение производительности обученной модели после перестановки. Важные функции, как правило, более чувствительны к процессу перетасовывание и, таким образом, получат более высокие показатели важности.

В этой статье приводятся общие сведения о важности функций перестановки, его теоретической основе и приложениях в машинном обучении. важность перестановки функций

Использование важности функции перестановки

Для создания набора оценок функций требуется уже обученная модель, а также тестовый набор данных.

  1. Добавьте в эксперимент модуль " важность функции перестановки ". Этот модуль можно найти в категории Выбор компонентов.

  2. Подключите обученную модель к левому входу. Модель должна быть моделью регрессии или моделью классификации.

  3. На правом входе Подключите набор данных, желательно, чтобы он отличался от набора данных, используемого для обучения модели. Этот набор данных используется для оценки на основе обученной модели и для оценки модели после изменения значений компонентов.

  4. Для случайного начальногозначения введите значение, которое будет использоваться в качестве начального значения для случайного заполнения. Если указать значение "0" (по умолчанию), то число будет сгенерировано на основе системных часов.

    Начальное значение является необязательным, но необходимо указать значение, если нужно, чтобы воспроизводимость в ходе выполнения одного и того же эксперимента.

  5. Для метрики измерения производительностивыберите одну метрику, которая будет использоваться при вычислении качества модели после перестановки.

    Машинное обучение Studio (классическая модель) поддерживает следующие метрики в зависимости от того, выполняется ли оценка модели классификации или регрессии:

    • Классификация

      Точность, точность, отзыв, средняя утрата журнала

    • Регрессия

      Точность, отзыв, среднее абсолютное сообщение об ошибке, корневое среднее значение ошибки, относительная абсолютная ошибка, относительная квадратная ошибка, коэффициент определения

    Более подробное описание этих метрик оценки и их вычисление см. в разделе Evaluate.

  6. Запустите эксперимент.

  7. Модуль выводит список столбцов функций и связанные с ними оценки, упорядоченные в порядке убывания оценок.

Примеры

Примеры экспериментов см. в Коллекция решений ии Azure:

Технические примечания

В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.

Как это сравнивается с другими методами выбора компонентов?

Важность функции перестановки влияет на случайное изменение значений каждого столбца компонента, по одному столбцу за раз и последующей оценки модели.

Ранжирование, предоставляемое по важности функций перестановки, часто отличается от выбора компонентов на основе фильтра, который вычисляет оценки перед созданием модели.

Это обусловлено тем, что важность функции перестановки не измеряет взаимосвязь между функцией и целевым значением, а захватывает, насколько сильно влияет на прогнозы от модели.

Ожидаемые входные данные

Имя Тип Описание
Обученная модель Интерфейс ILearner Обученная модель классификации или регрессии
Тестирование данных Таблица данных Проверка набора данных для оценки и оценка модели после перестановки значений функций

Параметры модуля

Имя Type Диапазон Необязательно Значение по умолчанию Описание
Случайное начальное значение Целое число >=0 Обязательно 0 Начальное значение генератора случайных чисел
Метрика для измерения производительности евалуатионметриктипе выбрать из списка Обязательно Классификация — точность Выберите метрику, которая будет использоваться при оценке вариативности модели после перестановок

Выходные данные

Имя Тип Описание
Важность компонентов Таблица данных Набор данных, содержащий результаты важности компонента на основе выбранной метрики

Исключения

Исключение Описание
Ошибка 0062 Исключение возникает при попытке сравнить две модели с различными типами учеников.
Ошибка 0024 Исключение возникает, если набор данных не содержит столбец метки.
Ошибка 0105 Возникает, когда файл определения модуля задает неподдерживаемый тип параметра
Ошибка 0021 Исключение возникает, если количество строк в некоторых наборах данных, переданных модулю, слишком мало.

См. также раздел

Выбор компонентов
Выбор признаков с помощью фильтра
Анализ главных компонентов