Изменение параметров таблицы счетчиков

Изменяет параметры, используемые для создания компонентов из счетчиков

Категория: обучение с подсчетами

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Обзор модуля

В этой статье описывается, как использовать модуль параметров таблицы изменения числа в машинное обучение Azure Studio (классическая модель) для изменения способа создания функций из таблицы подсчета.

Как правило, для создания функций на основе счетчиков используется Преобразование подсчета сборок для обработки набора данных и создания таблицы счетчиков, а из этой таблицы счетчиков — создание нового набора функций.

Однако если таблица счетчиков уже создана, можно использовать модуль изменение параметров таблицы счетчиков , чтобы изменить определение способа обработки данных счетчика. Это позволяет создать другой набор статистики на основе количества на основе существующих данных без необходимости повторного анализа набора данных.

Настройка параметров счетчика изменений

  1. Выберите преобразование, которое необходимо изменить, в группе преобразования и добавьте его в свой эксперимент.

    Необходимо предварительно запустить эксперимент, в котором было создано преобразование «подсчет».

    • Чтобы изменить сохраненное преобразование, выберите преобразование в группе преобразования и добавьте его в свой эксперимент.

    • Изменение преобразования Count, созданного в рамках одного эксперимента: если преобразование не было сохранено, но доступно в качестве выходных данных в текущем эксперименте (например, проверьте выходные данные модуля преобразования подсчета сборки ), можно использовать его напрямую, подключив модули.

  2. Добавьте модуль " изменение параметров таблицы подсчетов " и Соедините преобразование в качестве входных данных.

  3. В области Свойства модуля Параметры изменения таблицы счетчиков введите значение, которое будет использоваться в качестве порогового значения для ячейки мусора.

    Это значение указывает минимальное количество вхождений, которое должно быть найдено для каждого значения компонента, чтобы использовать счетчики. Если частота значения меньше порога в ячейке сборщика мусора, то пара «значение-метка» не учитывается как дискретный элемент. Вместо этого все элементы с количеством, меньшим, чем пороговое значение, помещаются в одну «мусорную корзину».

    Если вы используете небольшой набор данных и подсчитываете и обучение одни и те же данные, хорошее начальное значение равно 1.

  4. Для дополнительных предыдущих примеров введите число, указывающее количество дополнительных примеров для включения. Вам не нужно указывать эти примеры. псевдокод создается на основе прежнего распределения.

  5. Для параметра лапласовского шумов Scale (шкала шума) введите положительное значение с плавающей запятой, которое представляет масштаб, используемый для введения шума из лапласовского распределения. При установке значения шкалы в модель включается некоторый приемлемый уровень шума, поэтому на модель, скорее всего, будут затронуты невидимые значения в данных.

  6. В поле выходные функции выберите метод, который будет использоваться при создании функций на основе счетчика для включения в преобразование.

    • Каунтсонли: Создание функций с помощью счетчиков.

    • Логоддсонли: Создайте функции, используя журнал вероятного соотношения.

    • Боскаунтсандлогоддс: Создавайте функции, используя как счетчики, так и журналы.

  7. Выберите параметр пропустить столбец , если требуется переопределить IsBackOff флаг в выходных данных при создании компонентов. Если выбран этот параметр, функции на основе счетчиков создаются, даже если столбец не имеет значимых значений счетчика.

  8. Запустите эксперимент. При необходимости можно сохранить выходные данные параметров таблицы изменить число в новом преобразовании.

Примеры

Примеры того, как этот модуль, см. в Коллекция решений ии Azure:

Технические примечания

В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.

Подсчет и обучение на основе одного и того же набора является статистическим надежным, если задан параметр шкалы шума Лапласа.

Ожидаемые входные данные

Имя Type Описание
Преобразование подсчета Интерфейс ITransform Применяемое преобразование подсчета

Параметры модуля

Имя Type Диапазон Необязательно По умолчанию Описание
Пороговое значение контейнера для сбора мусора Float >=0,0f Обязательно 10.0 f Порог, при достижении которого значение столбца будет признаками для корзины мусора
Дополнительные априорные псевдопримеры Float >=0,0f Обязательно 42,0f Дополнительные псевдокоды, следующие за ранее распространяемыми распределениями
Шкала шума Лапласа Float >=0,0f Обязательно указано Масштаб распределения Лапласовского, из которого выдается выборка шума
Состав выходных признаков OutputFeatureType Обязательно BothCountsAndLogOdds Выводимые функции
Игнорировать столбец отхода Логическое Обязательно false Следует ли игнорировать столбец Исбаккофф в выходных данных

Выходные данные

Имя Type Описание
Измененное преобразование Интерфейс ITransform Измененное преобразование

Исключения

Исключение Описание
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0086 Возникает исключение при недопустимом преобразовании подсчета.

Список ошибок, относящихся к модулям студии (классическая версия), см. в разделе машинное обучение коды ошибок.

Список исключений API см. в разделе Машинное обучение REST API коды ошибок.

См. также раздел

Обучение с учетом количества