Машинное обучение-оценка

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

в этом разделе перечислены модули, предоставляемые в Машинное обучение Studio (классическая модель) для оценки.

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Оценка также называется прогнозом и представляет собой процесс создания значений на основе обученной модели машинного обучения с учетом новых входных данных. Создаваемые значения или показатели могут представлять прогнозы будущих значений, но они также могут представлять вероятную категорию или результат. Значение оценки зависит от типа предоставляемых данных и от типа созданной модели.

создание и использование моделей в Машинное обучение Studio (классическая модель)

Типичный рабочий процесс для машинного обучения включает следующие этапы.

  • Выбор подходящего алгоритма и Установка начальных параметров.
  • Обучение модели на совместимость данных.
  • Создание прогнозов с использованием новых данных на основе закономерностей в модели.
  • Оценка модели для определения точности прогнозов, количества ошибок и наличия чрезмерного перегонки.

Машинное обучение Studio (классическая модель) поддерживает гибкую настраиваемую платформу для машинного обучения. Каждая задача в этом процессе выполняется модулем определенного типа, который можно изменить, добавить или удалить, не нарушая остальную часть эксперимента.

Модули в этом разделе включают средства для оценки. На этом этапе машинного обучения к новым данным применяется обученная модель для создания прогнозов. Можно либо отправить эти прогнозы в приложение, которое использует результаты машинного обучения, либо воспользоваться результатами оценки для оценки точности и полезности модели.

Дополнительные сведения о оценке

Оценка широко используется в машинном обучении, что означает процесс создания новых значений с учетом модели и некоторых новых входных данных. Используется универсальный термин "Оценка", а не "прогноз", поскольку процесс оценки может создавать так много различных типов значений:

  • Список рекомендуемых элементов и показатель подобия.
  • Числовые значения для моделей временных рядов и моделей регрессии.
  • Значение вероятности, указывающее вероятность того, что новые входные данные принадлежат к некоторой существующей категории.
  • Имя категории или кластера, в котором наиболее похож новый элемент.
  • Прогнозируемый класс или результат для моделей классификации.

Примечание

Возможно, вы также слышали слово Оценка , используемая для обозначения веса или значения, назначенного в результате анализа данных. однако в Машинное обучение Studio (классическая модель) оценка обычно обозначает процесс создания прогнозируемых значений из новых данных.

При добавлении одного из этих модулей в эксперимент необходимо присоединить уже обученную модель машинного обучения и некоторые новые данные. При запуске эксперимента или выбранного модуля модуль оценки принимает новые данные, вычисляет оценки на основе модели и возвращает результаты в виде таблицы.

Данные, используемые для оценки

Новые данные, указываемые в качестве входных данных, обычно должны иметь те же столбцы, которые использовались для обучения модели, за исключением столбца метки или результата.

Столбцы, используемые исключительно как идентификаторы, обычно исключаются при обучении модели и поэтому должны быть исключены при оценке. Однако идентификаторы, такие как первичные ключи, можно легко объединить с набором данных для оценки позже, используя модуль Добавление столбцов . Этот модуль работает без указания ключа подключения, если размер набора данных не изменился.

Перед выполнением оценки для набора данных всегда проверяйте отсутствующие значения и значение null. Если данные, используемые в качестве входных данных для оценки, не имеют значений, отсутствующие значения используются в качестве входных. Поскольку значения NULL распространяются, результатом обычно является отсутствующее значение.

Список модулей оценки

Машинное обучение Studio (классическая модель) предоставляет множество различных модулей оценки. Выберите один из них в зависимости от типа используемой модели или типа выполняемой задачи оценки.

  • Применить преобразование: применяет хорошо заданное преобразование данных к набору данных.

    Используйте этот модуль, чтобы применить сохраненный процесс к набору данных.

  • Назначение данных кластерам. назначение данных кластерам с помощью существующей обученной модели кластеризации.

    Используйте этот модуль, если требуется кластеризация новых данных на основе существующей модели кластеризации с K-средних.

    Этот модуль заменяет модуль Assign To Clusters (не рекомендуется), который является устаревшим, но по-прежнему доступен для использования в существующих экспериментах.

  • Matchbox рекомендация: Оценкапрогнозов для набора данных с помощью рекомендации Matchbox.

    Используйте этот модуль, если вы хотите создать рекомендации, найти связанные элементы или пользователей или спрогнозировать рейтинги.

  • Модель оценки: прогнозы оценок для обученной модели классификации или регрессии.

    Этот модуль используется для всех других моделей регрессии и классификации, а также для некоторых моделей обнаружения аномалий.

Примеры

Эти примеры в Коллекция решений ии Azure демонстрируют процесс оценки, от базовых до сложных сценариев:

В следующих статьях приведены реальные примеры использования модели машинного обучения для оценки.

См. также раздел