Значение функции перестановки

Вычисляет оценки важности признака перестановки для переменных признака при заданной обученной модели и заданном проверочном наборе данных

Категория: модули выбора компонентов

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Обзор модуля

В этой статье описывается использование модуля " важность функции перестановки " в машинное обучение Azure Studio (классическая модель) для вычисления набора показателей важности признаков для набора данных. Эти показатели используются для определения лучших функций, используемых в модели.

В этом модуле значения компонентов случайным образом перемещаются, по одному столбцу за раз, а производительность модели измеряется до и после. Можно выбрать одну из стандартных метрик, предоставляемых для измерения производительности.

Результаты, возвращаемые модулем, представляют изменение производительности обученной модели после перестановки. Важные функции, как правило, более чувствительны к процессу перетасовывание и, таким образом, получат более высокие показатели важности.

В этой статье приводятся общие сведения о важности функций перестановки, его теоретической основе и приложениях в машинном обучении. важность перестановки функций

Как использовать важность функции перестановки

Для создания набора оценок функций требуется уже обученная модель, а также тестовый набор данных.

  1. Добавьте в эксперимент модуль " важность функции перестановки ". Этот модуль можно найти в категории Выбор компонентов .

  2. Подключите обученную модель к левому входному элементу. Модель должна быть моделью регрессии или моделью классификации.

  3. На правом входе Подключите набор данных, желательно, чтобы он отличался от набора данных, используемого для обучения модели. Этот набор данных используется для оценки на основе обученной модели и для оценки модели после изменения значений компонентов.

  4. Для случайного начального значения введите значение, которое будет использоваться в качестве начального значения для случайного заполнения. Если указать значение 0 (значение по умолчанию), то на основе системных часов будет создано число.

    Начальное значение является необязательным, но необходимо указать значение, если нужно, чтобы воспроизводимость в ходе выполнения одного и того же эксперимента.

  5. Для метрики измерения производительности выберите одну метрику, которая будет использоваться при вычислении качества модели после перестановки.

    Машинное обучение Azure Studio (классическая модель) поддерживает следующие метрики в зависимости от того, выполняется ли оценка модели классификации или регрессии:

    • Классификация

      Точность, точность, отзыв, средняя утрата журнала

    • Регрессия

      Точность, отзыв, среднее абсолютное сообщение об ошибке, корневое среднее значение ошибки, относительная абсолютная ошибка, относительная квадратная ошибка, коэффициент определения

    Более подробное описание этих метрик оценки и их вычисление см. в разделе Evaluate.

  6. Запустите эксперимент.

  7. Модуль выводит список столбцов функций и связанные с ними оценки, упорядоченные в порядке убывания оценок.

Примеры

Примеры экспериментов см. в Коллекция решений ии Azure:

Технические примечания

В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.

Как это сравнивается с другими методами выбора компонентов?

Важность функции перестановки влияет на случайное изменение значений каждого столбца компонента, по одному столбцу за раз и последующей оценки модели.

Ранжирование, предоставляемое по важности функций перестановки, часто отличается от выбора компонентов на основе фильтра, который вычисляет оценки перед созданием модели.

Это обусловлено тем, что важность функции перестановки не измеряет взаимосвязь между функцией и целевым значением, а захватывает, насколько сильно влияет на прогнозы от модели.

Ожидаемые входные данные

Имя Type Описание
Обученная модель Интерфейс ILearner Обученная модель классификации или регрессии
Тестирование данных Таблица данных Проверка набора данных для оценки и оценка модели после перестановки значений функций

Параметры модуля

Имя Type Диапазон Необязательно По умолчанию Описание
Случайное начальное значение Целое число >= 0 Обязательно 0 Начальное значение генератора случайных чисел
Метрика для измерения производительности евалуатионметриктипе выбрать из списка Обязательно Классификация — точность Выберите метрику, которая будет использоваться при оценке вариативности модели после перестановок

Выходные данные

Имя Type Описание
Важность компонентов Таблица данных Набор данных, содержащий результаты важности компонента на основе выбранной метрики

Исключения

Исключение Описание
Ошибка 0062 Исключение возникает при попытке сравнить две модели с различными типами учеников.
Ошибка 0024 Исключение возникает, если набор данных не содержит столбец метки.
Ошибка 0105 Возникает, когда файл определения модуля задает неподдерживаемый тип параметра
Ошибка 0021 Исключение возникает, если количество строк в некоторых наборах данных, переданных модулю, слишком мало.

См. также раздел

Выбор компонентов
Выбор компонентов на основе фильтра
Анализ главных компонентов