Машинное обучение-Оценка

В этом разделе перечислены модули, предоставляемые в Машинное обучение Azure Studio (классическая модель) для оценки.

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Оценка также называется прогнозом и представляет собой процесс создания значений на основе обученной модели машинного обучения с учетом новых входных данных. Создаваемые значения или показатели могут представлять прогнозы будущих значений, но они также могут представлять вероятную категорию или результат. Значение оценки зависит от типа предоставляемых данных и от типа созданной модели.

Создание и использование моделей в Машинное обучение Studio (классическая модель)

Типичный рабочий процесс для машинного обучения включает следующие этапы.

  • Выбор подходящего алгоритма и Установка начальных параметров.
  • Обучение модели на совместимость данных.
  • Создание прогнозов с использованием новых данных на основе закономерностей в модели.
  • Оценка модели для определения точности прогнозов, количества ошибок и наличия чрезмерного перегонки.

Машинное обучение Studio (классическая модель) поддерживает гибкую настраиваемую платформу для машинного обучения. Каждая задача в этом процессе выполняется модулем определенного типа, который можно изменить, добавить или удалить, не нарушая остальную часть эксперимента.

Модули в этом разделе включают средства для оценки. На этом этапе машинного обучения к новым данным применяется обученная модель для создания прогнозов. Можно либо отправить эти прогнозы в приложение, которое использует результаты машинного обучения, либо воспользоваться результатами оценки для оценки точности и полезности модели.

Дополнительные сведения о оценке

Оценка широко используется в машинном обучении, что означает процесс создания новых значений с учетом модели и некоторых новых входных данных. Используется универсальный термин "Оценка", а не "прогноз", поскольку процесс оценки может создавать так много различных типов значений:

  • Список рекомендуемых элементов и показатель подобия.
  • Числовые значения для моделей временных рядов и моделей регрессии.
  • Значение вероятности, указывающее вероятность того, что новые входные данные принадлежат к некоторой существующей категории.
  • Имя категории или кластера, в котором наиболее похож новый элемент.
  • Прогнозируемый класс или результат для моделей классификации.

Примечание

Возможно, вы также слышали слово Оценка , используемая для обозначения веса или значения, назначенного в результате анализа данных. Однако в Машинное обучение Studio (классическая модель) Оценка обычно обозначает процесс создания прогнозируемых значений из новых данных.

При добавлении одного из этих модулей в эксперимент необходимо присоединить уже обученную модель машинного обучения и некоторые новые данные. При запуске эксперимента или выбранного модуля модуль оценки принимает новые данные, вычисляет оценки на основе модели и возвращает результаты в виде таблицы.

Данные, используемые для оценки

Новые данные, указываемые в качестве входных данных, обычно должны иметь те же столбцы, которые использовались для обучения модели, за исключением столбца метки или результата.

Столбцы, используемые исключительно как идентификаторы, обычно исключаются при обучении модели и поэтому должны быть исключены при оценке. Однако идентификаторы, такие как первичные ключи, можно легко объединить с набором данных для оценки позже, используя модуль Добавление столбцов . Этот модуль работает без указания ключа подключения, если размер набора данных не изменился.

Перед выполнением оценки для набора данных всегда проверяйте отсутствующие значения и значение null. Если данные, используемые в качестве входных данных для оценки, не имеют значений, отсутствующие значения используются в качестве входных. Поскольку значения NULL распространяются, результатом обычно является отсутствующее значение.

Список модулей оценки

Машинное обучение Studio (классическая модель) предоставляет множество различных модулей оценки. Выберите один из них в зависимости от типа используемой модели или типа выполняемой задачи оценки.

  • Применить преобразование: применяет хорошо заданное преобразование данных к набору данных.

    Используйте этот модуль, чтобы применить сохраненный процесс к набору данных.

  • Назначение данных кластерам. назначение данных кластерам с помощью существующей обученной модели кластеризации.

    Используйте этот модуль, если требуется кластеризация новых данных на основе существующей модели кластеризации с K-средних.

    Этот модуль заменяет модуль Assign To Clusters (не рекомендуется), который является устаревшим, но по-прежнему доступен для использования в существующих экспериментах.

  • Matchbox рекомендация: Оценкапрогнозов для набора данных с помощью рекомендации Matchbox.

    Используйте этот модуль, если вы хотите создать рекомендации, найти связанные элементы или пользователей или спрогнозировать рейтинги.

  • Модель оценки: прогнозы оценок для обученной модели классификации или регрессии.

    Этот модуль используется для всех других моделей регрессии и классификации, а также для некоторых моделей обнаружения аномалий.

Примеры

Эти примеры в Коллекция решений ии Azure демонстрируют процесс оценки, от базовых до сложных сценариев:

В следующих статьях приведены реальные примеры использования модели машинного обучения для оценки.

См. также раздел