Объединение преобразования счетчиков

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Создает набор признаков на основе таблицы счетчиков.

категория: Обучение с количеством

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается использование модуля преобразования числа слиянием в Машинное обучение Studio (классическая модель) для объединения двух наборов функций на основе количества. Объединяя два набора связанных счетчиков и функций, вы потенциально можете улучшить покрытие и распределение функций.

Обучение от счетчиков особенно удобно использовать в больших наборах данных с функциями высокой кратности. Возможность объединения нескольких наборов данных в наборы функций на основе счетчиков без необходимости повторной обработки наборов данных упрощает сбор статистики по очень большим наборам данных и их применение к новым наборам данных. Например, таблицы подсчета можно использовать для получения информации за терабайтами данных. Эти статистические данные можно повторно использовать для повышения точности прогнозных моделей на небольших наборах данных.

Чтобы объединить два набора функций на основе счетчика, эти функции должны быть созданы с помощью таблиц, имеющих одну и ту же схему: то есть оба набора должны использовать одни и те же столбцы и иметь одинаковые имена и типы данных.

Настройка преобразования числа слиянием

  1. Чтобы использовать Преобразование «Подсчет числа слияний», необходимо создать по крайней мере одно преобразование на основе количества, которое должно присутствовать в рабочей области. Если вы сохранили преобразование на основе количества из другого эксперимента, Просмотрите группу преобразования . Если преобразование было создано в текущем эксперименте, подключите выходные данные следующих модулей:

  2. Добавьте модуль преобразования «подсчет слияния » в эксперимент и Соедините преобразование с каждым входом.

    Совет

    Второе преобразование — необязательный ввод. Вы можете подключать одно и то же преобразование дважды или не подключать ничего ко второму порту ввода.

  3. Если вы не хотите, чтобы второй набор данных был одинаково взвешен с первым, укажите значение фактора Decay. Введенное значение указывает, как должен быть взвешен набор компонентов второго преобразования.

    Например, значение по умолчанию 1 веса одинаково определяет оба набора функций. Значение 0,5 означает, что функции во втором наборе будут иметь половину веса в первом наборе.

  4. При необходимости добавьте экземпляр модуля Apply преобразование и примените преобразование к набору данных.

Примеры

Примеры использования этого модуля см. в Коллекция решений ии Azure:

Ожидаемые входные данные

Имя Тип Описание
Предыдущее преобразование подсчета Интерфейс ITransform Изменяемое преобразование
Новое преобразование подсчета Интерфейс ITransform Добавляемое преобразование подсчета (необязательно)

Параметры модуля

Имя Type Диапазон Необязательно Описание Значение по умолчанию
Коэффициент Decay Float Обязательно Коэффициент Decay, который умножается на преобразование подсчета по правому порту ввода

Выходные данные

Имя Тип Описание
Объединенное преобразование подсчета Интерфейс ITransform Объединенное преобразование

Исключения

Исключение Описание
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0086 Возникает исключение при недопустимом преобразовании подсчета.

См. также раздел

Обучение с учетом количества