Одноклассовый метод опорных векторов

Статья
05/06/2019

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
См. дополнительные сведения о Машинном обучении Azure.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Создает одноклассовую модель опорных векторов для обнаружения аномалий

Категория: обнаружение аномалий

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается, как использовать модуль модели векторной поддержки одного класса в Машинное обучение Studio (классическая модель) для создания модели обнаружения аномалий.

Этот модуль особенно полезен в сценариях, где имеется много «обычных» данных и не много вариантов аномалий, которые вы пытаетесь обнаружить. Например, если необходимо обнаружить мошеннические транзакции, может отсутствовать много примеров мошенничества, которые можно использовать для обучения типовой модели классификации, но у вас может быть много примеров хороших транзакций.

Для создания модели можно использовать модуль модели векторной поддержки с одним классом , а затем обучить модель с помощью модели обнаружения аномалий. Набор данных, используемый для обучения, может содержать все или, в основном, обычные варианты.

Затем можно применить различные метрики, чтобы выявить потенциальные аномалии. Например, можно использовать большой набор данных о хороших транзакциях для определения вариантов, которые могут представлять мошеннические транзакции.

Дополнительные сведения о SVMе одного класса

Метод опорных векторов (SVMs) — это защищенные модели обучения, анализирующие данные и распознают шаблоны, которые можно использовать для задач классификации и регрессии.

Как правило, алгоритму SVM присваивается набор обучающих примеров, помеченных как принадлежащий одному из двух классов. Модель SVM основана на разделении учебных образцов в отдельные категории по мере возможности как можно больше пропуска, а пенализинг обучающие примеры, которые попадают на неправильную сторону разрыва. Затем модель SVM выполняет прогнозы, присваивая точки одной стороне разрыва или другой.

Иногда избыточная выборка используется для репликации существующих образцов, чтобы можно было создать модель с двумя классами, но невозможно спрогнозировать все новые закономерности мошенничества или системных сбоев из ограниченных примеров. Кроме того, даже набор из ограниченного числа образцов может оказаться затратным.

Таким образом, в одном классе SVM модель вектора поддержки обучена для данных, имеющих только один класс, который является "нормальным" классом. Он выводит свойства обычных вариантов, и из этих свойств можно предсказать, какие примеры в отличие от обычных примеров. Это полезно для обнаружения аномалий, поскольку нехватке примеров обучения — это то, что определяет аномалии: это, как правило, несколько примеров проникновения в сеть, мошенничества или другого аномального поведения.

Дополнительные сведения, включая ссылки на основные исследования, см. в разделе Технические примечания .

Примечание

Модуль Одноклассовая модель опорных векторов создает модель ядерного метода опорных векторов, то есть он не обладает значительными возможностями масштабирования. Если время обучения ограничено или слишком много данных, можно использовать другие методы для обнаружения аномалий, такие как обнаружение аномалий на основе PCA.

Настройка One-Class SVM

Добавьте модуль модели векторной поддержки с одним классом в эксперимент в студии (классическая модель). модуль можно найти в разделе Машинное обучение-Initializeв категории обнаружение аномалий .
Дважды щелкните модуль модели векторной поддержки с одним классом , чтобы открыть панель свойств .
В качестве режима создания инструкторавыберите параметр, который указывает, как должна быть обучена модель:
- Одиночный параметр. Используйте этот вариант, если вы знаете, как хотите настроить модель, и предоставьте определенный ряд значений в качестве аргументов.
- Диапазон параметров. Используйте этот параметр, если вы не знаете наилучших параметров и хотите выполнить параметр очистки для поиска оптимальной конфигурации.
η: введите значение, представляющее верхнюю границу доли выбросов. Этот параметр соответствует свойству ню-Property, описанному в этом документе. Свойство ню-Property позволяет контролировать компромиссы между выбросами и обычными случаями.
ε (Эпсилон): введите значение, которое будет использоваться в качестве допуска остановки. Допуск останавливается, влияет на количество итераций, используемых при оптимизации модели, и зависит от значения критерия остановки. Когда значение превышено, преподаватель прекращает итерацию решения.
Подключение набор данных для обучения и один из обучающих модулей:
- Если для параметра создать режим инструктора задано значение Single, используйте модуль " обучение модели обнаружения аномалий ".
- Если для параметра Создать режим учителя задано значение Диапазон параметров, используйте модуль Настройка гиперпараметров модели.
Примечание

Если вы передали диапазон параметров для обучения модели обнаружения аномалий, он будет использовать только первое значение из списка диапазонов параметров.

Если передать один набор значений параметров в модуль Настройка гиперпараметров модели, когда он ожидает диапазон параметров для каждого параметра, он пропускает значения и использует значения по умолчанию для ученика.

Если выбрать параметр диапазон параметров и ввести одно значение для любого параметра, это единственное значение будет использоваться во время очистки, даже если другие параметры меняются в диапазоне значений.
Запустите эксперимент.

Результаты

Модуль возвращает обученную модель обнаружения аномалий. Можно либо сохранить модель в рабочей области, либо подключить модуль Оценка модели и использовать обученную модель для обнаружения возможных аномалий.

Если вы обучили модель с помощью очистки параметров, запишите оптимальные параметры параметров, которые будут использоваться при настройке модели для использования в рабочей среде.

Примеры

Примеры использования этого модуля в обнаружении аномалий см. в Коллекция решений ии Azure:

Обнаружение аномалий: кредитный риск. в этом примере показано, как находить выбросы в данных с помощью очистки параметров для поиска оптимальной модели. Затем она применяет эту модель к новым данным для определения рискованных транзакций, которые могут представлять мошенничество, сравнивая две различные модели обнаружения аномалий.

Технические примечания

Прогнозы из одного класса SVM — это некалиброванные оценки, которые могут быть неограниченными. как показано в примере в Cortana Intelligence Gallery, необходимо нормализовать оценки при сравнении моделей на основе различных алгоритмов.

Исследования

Эта реализация упаковывает библиотеку для поддержки векторных компьютеров с именем либсвм. Общая теория, на которой libsvm основано, и подход к одноклассовой векторной системе поддержки, описывается в этих документах на B. счӧлкопф et al.

Параметры модуля

Имя	Type	Диапазон	Необязательно	Описание	Значение по умолчанию
Создание режима учителя	Создание режима учителя	List:единственный параметр\|диапазон параметров	Обязательно	Единственный параметр	Укажите параметры ученика. Параметр Единственный параметр позволяет задать все значения вручную. Параметр Диапазон параметров позволяет пройтись по всем настраиваемым параметрам.
nu	Float	>= double.Epsilon	mode:единственный параметр	0,1	Этот параметр (представленный греческой буквой ню) определяет компромисс между долей выбросов и числом векторов поддержки.
epsilon	Float	>= double.Epsilon	mode:единственный параметр	0,001	Определяет допуск остановки.
psnu	ParameterRangeSettings	[0,001; 1.0]	mode:диапазон параметров	0,001; 0,01; 0,1	Определяет диапазон для компромисса между долей изолированных значений и количеством опорных векторов.
psEpsilon	ParameterRangeSettings	[1e-6; 1,0]	mode:диапазон параметров	0,001; 0,01; 0,1	Определяет диапазон допуска остановки.

Выходные данные

Имя	Тип	Описание
Необученная модель	Интерфейс ILearner	Необученная модель обнаружения аномалий

См. также раздел

Классификация
Обучение модели обнаружения аномалий