Обучение модели кластеризации

В этой статье описывается компонент в конструкторе Машинного обучения Azure.

Используйте этот компонент для обучения модели кластеризации.

Этот компонент принимает несмоделированную модель кластеризации, которая уже настроена с помощью компонента кластеризации методом k-средних, и обучает модель с помощью помеченного или непомеченного набора данных. Компонент создает как обученную модель, которую можно использовать для прогнозирования, так и набор назначений кластеров для каждого варианта в обучающих данных.

Примечание

Модель кластеризации не может быть обучена с помощью компонента Обучение модели, который является универсальным компонентом для обучающих моделей машинного обучения. Это связано с тем, что Обучение модели работает только с защищенными алгоритмами обучения. K-средние и другие алгоритмы кластеризации допускают неконтролируемое обучение. Это означает, что алгоритм может изучать непомеченные данные.

Как использовать Обучение модели кластеризации

  1. Добавьте компонент Обучение модели кластеризации в конвейер в конструкторе. Этот компонент можно найти в разделе Компоненты машинного обучения в категории Обучение.

  2. Добавьте компонент Кластеризация методом k-средних или другой настраиваемый компонент, который создает совместимую модель кластеризации, и задайте параметры модели кластеризации.

  3. Прикрепите набор данных для обучения к правому вводу параметра Обучение модели кластеризации (Train Clustering Model) .

  4. В наборе столбцов (Column Set) выберите столбцы из набора данных для использования при построении кластеров. Не забудьте выбрать столбцы, которые являются хорошими компонентами: например, не используйте идентификаторы или другие столбцы, имеющие уникальные значения, или столбцы с одинаковыми значениями.

    Если метка доступна, можно использовать ее как компонент или оставить ее.

  5. Выберите параметр Проверять только добавление или снять флажок только для результатов (Check for append or uncheck for result only) , если требуется выводить обучающие данные вместе с новой меткой кластера.

    Если отменить выбор этого параметра, будут выводиться только назначения кластера.

  6. Отправьте конвейер или щелкните компонент Обучение модели кластеризации и выберите Выполнить выбранное.

Результаты

После завершения обучения:

  • Чтобы сохранить моментальный снимок обученной модели, выберите вкладку Выходные данные на правой панели компонента Обучение модели. Щелкните значок Зарегистрировать набор данных, чтобы сохранить модель как компонент для повторного использования.

  • Чтобы создать оценки на основе модели, используйте назначение данных кластерам (Assign Data to Clusters).

Примечание

Если необходимо развернуть обученную модель в конструкторе, убедитесь, что Назначение данных кластерам вместо Модели оценки подключено к Входному компоненту вывода веб-службы в конвейере вывода.

Следующие шаги

Ознакомьтесь с набором доступных компонентов для Машинного обучения Azure.