Одноклассовый метод опорных векторов

Создает одноклассовую модель опорных векторов для обнаружения аномалий

Категория: обнаружение аномалий

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Обзор модуля

В этой статье описывается, как использовать модуль модели векторной поддержки одного класса в машинное обучение Azure для создания модели обнаружения аномалий.

Этот модуль особенно полезен в сценариях, где имеется много «обычных» данных и не много вариантов аномалий, которые вы пытаетесь обнаружить. Например, если необходимо обнаружить мошеннические транзакции, может отсутствовать много примеров мошенничества, которые можно использовать для обучения типовой модели классификации, но у вас может быть много примеров хороших транзакций.

Для создания модели можно использовать модуль модели векторной поддержки с одним классом , а затем обучить модель с помощью модели обнаружения аномалий. Набор данных, используемый для обучения, может содержать все или, в основном, обычные варианты.

Затем можно применить различные метрики, чтобы выявить потенциальные аномалии. Например, можно использовать большой набор данных о хороших транзакциях для определения вариантов, которые могут представлять мошеннические транзакции.

Дополнительные сведения о SVMе одного класса

Метод опорных векторов (SVMs) — это защищенные модели обучения, анализирующие данные и распознают шаблоны, которые можно использовать для задач классификации и регрессии.

Как правило, алгоритму SVM присваивается набор обучающих примеров, помеченных как принадлежащий одному из двух классов. Модель SVM основана на разделении учебных образцов в отдельные категории по мере возможности как можно больше пропуска, а пенализинг обучающие примеры, которые попадают на неправильную сторону разрыва. Затем модель SVM выполняет прогнозы, присваивая точки одной стороне разрыва или другой.

Иногда избыточная выборка используется для репликации существующих образцов, чтобы можно было создать модель с двумя классами, но невозможно спрогнозировать все новые закономерности мошенничества или системных сбоев из ограниченных примеров. Кроме того, даже набор из ограниченного числа образцов может оказаться затратным.

Таким образом, в одном классе SVM модель вектора поддержки обучена для данных, имеющих только один класс, который является "нормальным" классом. Он выводит свойства обычных вариантов, и из этих свойств можно предсказать, какие примеры в отличие от обычных примеров. Это полезно для обнаружения аномалий, поскольку нехватке примеров обучения — это то, что определяет аномалии: это, как правило, несколько примеров проникновения в сеть, мошенничества или другого аномального поведения.

Дополнительные сведения, включая ссылки на основные исследования, см. в разделе Технические примечания .

Примечание

Модуль Одноклассовая модель опорных векторов создает модель ядерного метода опорных векторов, то есть он не обладает значительными возможностями масштабирования. Если время обучения ограничено или слишком много данных, можно использовать другие методы для обнаружения аномалий, такие как обнаружение аномалий на основе PCA.

Настройка One-Class SVM

  1. Добавьте модуль модели векторной поддержки с одним классом в эксперимент в студии (классическая модель). Модуль можно найти в разделе машинное обучение-Initialize в категории обнаружение аномалий .

  2. Дважды щелкните модуль модели векторной поддержки с одним классом , чтобы открыть панель свойств .

  3. В качестве режима создания инструктора выберите параметр, который указывает, как должна быть обучена модель:

    • Один параметр: Используйте этот параметр, если вы умеете настраивать модель и предоставляете конкретный набор значений в качестве аргументов.

    • Диапазон параметров. Используйте этот параметр, если вы не знаете наилучших параметров и хотите выполнить параметр очистки для поиска оптимальной конфигурации.

  4. η: введите значение, представляющее верхнюю границу доли выбросов. Этот параметр соответствует свойству ню-Property, описанному в этом документе. Свойство ню-Property позволяет контролировать компромиссы между выбросами и обычными случаями.

  5. ε (Эпсилон): введите значение, которое будет использоваться в качестве допуска остановки. Допуск останавливается, влияет на количество итераций, используемых при оптимизации модели, и зависит от значения критерия остановки. Когда значение превышено, преподаватель прекращает итерацию решения.

  6. Подключение набора данных для обучения и одного из обучающих модулей:

    Примечание

    Если вы передали диапазон параметров для обучения модели обнаружения аномалий, он будет использовать только первое значение из списка диапазонов параметров.

    Если передать один набор значений параметров в модуль настройки модели Настройка , когда он ожидает диапазон параметров для каждого параметра, он пропускает значения и использует значения по умолчанию для этого.

    Если выбрать параметр диапазон параметров и ввести одно значение для любого параметра, это единственное значение будет использоваться во время очистки, даже если другие параметры меняются в диапазоне значений.

  7. Запустите эксперимент.

Результаты

Модуль возвращает обученную модель обнаружения аномалий. Можно либо сохранить модель в рабочей области, либо подключить модуль Оценка модели и использовать обученную модель для обнаружения возможных аномалий.

Если вы обучили модель с помощью очистки параметров, запишите оптимальные параметры параметров, которые будут использоваться при настройке модели для использования в рабочей среде.

Примеры

Примеры использования этого модуля в обнаружении аномалий см. в Коллекция решений ии Azure:

  • Обнаружение аномалий: кредитный риск. в этом примере показано, как находить выбросы в данных с помощью очистки параметров для поиска оптимальной модели. Затем она применяет эту модель к новым данным для определения рискованных транзакций, которые могут представлять мошенничество, сравнивая две различные модели обнаружения аномалий.

Технические примечания

Прогнозы из одного класса SVM — это некалиброванные оценки, которые могут быть неограниченными. Как показано в примере в Cortana Intelligence Gallery, необходимо нормализовать оценки при сравнении моделей на основе различных алгоритмов.

Исследования

Эта реализация упаковывает библиотеку для поддержки векторных компьютеров с именем либсвм. Общая теория, на которой libsvm основано, и подход к одноклассовой векторной системе поддержки, описывается в этих документах на B. счӧлкопф et al.

Параметры модуля

Имя Type Диапазон Необязательно Описание По умолчанию
Создание режима учителя Создание режима учителя Список: один параметр|диапазон параметров Обязательно Единственный параметр Укажите параметры ученика.

Параметр Единственный параметр позволяет задать все значения вручную.

Параметр Диапазон параметров позволяет пройтись по всем настраиваемым параметрам.
nu Float >= double.Epsilon mode:единственный параметр 0.1 Этот параметр (представленный греческой буквой ню) определяет компромисс между долей выбросов и числом векторов поддержки.
epsilon Float >= double.Epsilon mode:единственный параметр 0,001 Определяет допуск остановки.
psnu ParameterRangeSettings [0,001; 1.0] mode:диапазон параметров 0,001; 0,01; 0,1 Определяет диапазон для компромисса между долей изолированных значений и количеством опорных векторов.
psEpsilon ParameterRangeSettings [1e-6; 1,0] mode:диапазон параметров 0,001; 0,01; 0,1 Определяет диапазон допуска остановки.

Выходные данные

Имя Type Описание
Необученная модель Интерфейс ILearner Необученная модель обнаружения аномалий

См. также раздел

Обновлений
Обучение модели обнаружения аномалий