Изменение параметров таблицы счетчиков
Изменяет параметры, используемые для создания компонентов из счетчиков
Категория: обучение с подсчетами
Примечание
Применимо к: машинное обучение Studio (классическая модель)
Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.
Обзор модуля
В этой статье описывается, как использовать модуль параметров таблицы изменения числа в машинное обучение Azure Studio (классическая модель) для изменения способа создания функций из таблицы подсчета.
Как правило, для создания функций на основе счетчиков используется Преобразование подсчета сборок для обработки набора данных и создания таблицы счетчиков, а из этой таблицы счетчиков — создание нового набора функций.
Однако если таблица счетчиков уже создана, можно использовать модуль изменение параметров таблицы счетчиков , чтобы изменить определение способа обработки данных счетчика. Это позволяет создать другой набор статистики на основе количества на основе существующих данных без необходимости повторного анализа набора данных.
Настройка параметров счетчика изменений
Выберите преобразование, которое необходимо изменить, в группе преобразования и добавьте его в свой эксперимент.
Необходимо предварительно запустить эксперимент, в котором было создано преобразование «подсчет».
Чтобы изменить сохраненное преобразование, выберите преобразование в группе преобразования и добавьте его в свой эксперимент.
Изменение преобразования Count, созданного в рамках одного эксперимента: если преобразование не было сохранено, но доступно в качестве выходных данных в текущем эксперименте (например, проверьте выходные данные модуля преобразования подсчета сборки ), можно использовать его напрямую, подключив модули.
Добавьте модуль " изменение параметров таблицы подсчетов " и Соедините преобразование в качестве входных данных.
В области Свойства модуля Параметры изменения таблицы счетчиков введите значение, которое будет использоваться в качестве порогового значения для ячейки мусора.
Это значение указывает минимальное количество вхождений, которое должно быть найдено для каждого значения компонента, чтобы использовать счетчики. Если частота значения меньше порога в ячейке сборщика мусора, то пара «значение-метка» не учитывается как дискретный элемент. Вместо этого все элементы с количеством, меньшим, чем пороговое значение, помещаются в одну «мусорную корзину».
Если вы используете небольшой набор данных и подсчитываете и обучение одни и те же данные, хорошее начальное значение равно 1.
Для дополнительных предыдущих примеров введите число, указывающее количество дополнительных примеров для включения. Вам не нужно указывать эти примеры. псевдокод создается на основе прежнего распределения.
Для параметра лапласовского шумов Scale (шкала шума) введите положительное значение с плавающей запятой, которое представляет масштаб, используемый для введения шума из лапласовского распределения. При установке значения шкалы в модель включается некоторый приемлемый уровень шума, поэтому на модель, скорее всего, будут затронуты невидимые значения в данных.
В поле выходные функции выберите метод, который будет использоваться при создании функций на основе счетчика для включения в преобразование.
Каунтсонли: Создание функций с помощью счетчиков.
Логоддсонли: Создайте функции, используя журнал вероятного соотношения.
Боскаунтсандлогоддс: Создавайте функции, используя как счетчики, так и журналы.
Выберите параметр пропустить столбец , если требуется переопределить
IsBackOff
флаг в выходных данных при создании компонентов. Если выбран этот параметр, функции на основе счетчиков создаются, даже если столбец не имеет значимых значений счетчика.Запустите эксперимент. При необходимости можно сохранить выходные данные параметров таблицы изменить число в новом преобразовании.
Примеры
Примеры того, как этот модуль, см. в Коллекция решений ии Azure:
Обучение с помощью счетчиков: двоичная классификация: демонстрируется использование модулей обучения с подсчетами для создания функций из столбцов значений категорий для модели двоичной классификации.
Обучение с помощью счетчиков: многоклассовая классификация с данными Нью такси: образец демонстрирует использование модулей Learning с счетчиками для выполнения многоклассовой классификации в общедоступном наборе данных Нью такси. В примере используется Многоклассовый источник логистической регрессии для моделирования этой проблемы.
Обучение с помощью счетчиков: двоичная классификация с данными Нью такси: демонстрируется использование модулей Learning с счетчиками для выполнения двоичной классификации в общедоступном наборе данных Нью такси. Для моделирования этой проблемы в образце используется пошаговое изучение логистической регрессии с двумя классами.
Технические примечания
В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.
Подсчет и обучение на основе одного и того же набора является статистическим надежным, если задан параметр шкалы шума Лапласа.
Ожидаемые входные данные
Имя | Type | Описание |
---|---|---|
Преобразование подсчета | Интерфейс ITransform | Применяемое преобразование подсчета |
Параметры модуля
Имя | Type | Диапазон | Необязательно | По умолчанию | Описание |
---|---|---|---|---|---|
Пороговое значение контейнера для сбора мусора | Float | >=0,0f | Обязательно | 10.0 f | Порог, при достижении которого значение столбца будет признаками для корзины мусора |
Дополнительные априорные псевдопримеры | Float | >=0,0f | Обязательно | 42,0f | Дополнительные псевдокоды, следующие за ранее распространяемыми распределениями |
Шкала шума Лапласа | Float | >=0,0f | Обязательно | указано | Масштаб распределения Лапласовского, из которого выдается выборка шума |
Состав выходных признаков | OutputFeatureType | Обязательно | BothCountsAndLogOdds | Выводимые функции | |
Игнорировать столбец отхода | Логическое | Обязательно | false | Следует ли игнорировать столбец Исбаккофф в выходных данных |
Выходные данные
Имя | Type | Описание |
---|---|---|
Измененное преобразование | Интерфейс ITransform | Измененное преобразование |
Исключения
Исключение | Описание |
---|---|
Ошибка 0003 | Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты. |
Ошибка 0086 | Возникает исключение при недопустимом преобразовании подсчета. |
Список ошибок, относящихся к модулям студии (классическая версия), см. в разделе машинное обучение коды ошибок.
Список исключений API см. в разделе Машинное обучение REST API коды ошибок.