A-Z список модулей Машинное обучение Studio (классические)

В этой статье представлен алфавитный список модулей, доступных в Машинное обучение Azure Studio (классическая модель).

Совет

Клиентам, которые сейчас используют или оценивают Студию машинного обучения (классическую), рекомендуется опробовать конструктор Машинного обучения Azure, который предоставляет перетаскиваемые модули Машинного обучения и обеспечивает масштабируемость, управление версиями и корпоративную безопасность.

Модули охватывают широкий спектр функций и функций, необходимых для задач машинного обучения:

  • Функции преобразования данных
  • Функции преобразования данных
  • Модули для выполнения скрипта R или Python
  • Алгоритмы, включая:
    • Деревья принятия решений
    • Леса принятия решений
    • Кластеризация
    • Временной ряд
    • Модели рекомендаций
    • Обнаружение аномалий

Чтобы найти модуль, выполните следующие действия.

Алфавитная таблица модулей

Имя модуля Описание
Добавление столбцов Добавляет набор столбцов из одного набора данных в другой.
Добавление строк Добавляет набор строк из входного набора данных в конец другого набора данных.
Применение фильтра Применяет фильтр к указанным столбцам набора данных.
Применение математической операции Применяет математическую операцию к значениям столбца.
Применение преобразования SQL Выполняет запрос SQLite для входных наборов данных, чтобы преобразовать данные.
Применение преобразования Применяет хорошо заданное преобразование данных к набору данных.
Назначение данных в кластеры Назначает данные кластерам с помощью существующей обученной модели кластеризации.
Байесовская линейная регрессия Создает модель линейной регрессии Байеса.
Регрессия с помощью увеличивающегося дерева принятия решений Создает модель регрессии с помощью алгоритма повышенного дерева принятия решений.
Создание преобразования счетчиков Создает счетчики для использования при сборке функций.
Очистка недостающих данных Указывает, как следует выполнять обработку значений, отсутствующих в наборе данных.
Обрезка значений Обнаруживает выбросы, а затем вырезает или заменяет их значения.
Элементарная статистика вычислений Вычисляет указанную сводную статистику для выбранных столбцов набора данных.
Распознавание языков Определяет язык каждой строки во входном файле.
Линейная корреляция вычислений Вычисляет линейную корреляцию между значениями столбцов в наборе данных.
Преобразование в ARFF Преобразует входные данные в формат файла связи атрибутов, используемый набором инструментов weka.
Преобразование в CSV-файл Преобразует входные данные в формат значений с разделителями-запятыми.
Преобразование в набор данных Преобразует входные данные в формат внутреннего набора данных, используемый Машинное обучение Azure.
Преобразование в значения индикатора Преобразует значения категорий в столбцы в значения индикаторов.
Преобразование в SVMLight Преобразует входные данные в формат, используемый платформой SVMlight.
Преобразование в TSV Преобразует входные данные в формат с разделителями-символами табуляции.
Создание R-модели Создает модель R с помощью настраиваемых ресурсов.
Модель перекрестной проверки Перекрестно проверяет оценку параметров для моделей классификации или регрессии путем секционирования данных.
Регрессия с использованием модели леса принятия решений Создает модель регрессии с помощью алгоритма леса принятия решений.
Распознавание языков Определяет язык каждой строки во входном файле.
Изменение метаданных Изменяет метаданные, связанные со столбцами в наборе данных.
Ввод данных вручную Позволяет вводить и редактировать небольшие наборы данных, вводя значения.
Анализ модели Вычисляет оцененную классификацию или регрессионную модель с помощью стандартных метрик.
Оценка функции вероятности Соответствует указанной функции распределения вероятности в наборе данных.
Оценка рекомендателя Оценивает точность прогнозов модели рекомендаций.
Выполнение скриптов Python Выполняет скрипт Python из Машинное обучение Azure эксперимента.
Выполнение скрипта R Выполняет скрипт R из Машинное обучение Azure эксперимента.
Экспорт таблицы счетчиков Экспортирует счетчики из преобразования подсчета.
Экспорт данных Записывает набор данных в URL-адреса в Интернете или в различные формы облачного хранилища в Azure, такие как таблицы, большие двоичные объекты и базы данных SQL Azure.

Этот модуль ранее назывался Writer.
Извлечение ключевых фраз из текста Извлекает ключевые слова и фразы из текстового столбца.
Извлечение N-грамм из текста Создает словарные функции N-грамм, а затем выдает на них выбор компонентов.
Быстрая квантильная регрессия леса Создает модель регрессии квантилей.
Хэширование признаков Преобразует текстовые данные в функции с целочисленным кодированием с помощью библиотеки Vowpal Wabbit.
Выбор признаков с помощью фильтра Определяет функции в наборе данных с наибольшей прогнозируемой мощностью.
FIR-фильтр Создает фильтр конечного отклика для обработки сигнала.
Линейный дискриминантный анализ Фишера Определяет линейное сочетание переменных функций, которые лучше сгруппировать данные в отдельные классы.
Группировка категориальных значений Группирует данные из нескольких категорий в новую категорию.
Группирование данных в ячейки Помещает числовые данные в ячейки.
IIR-фильтр Создает фильтр бесконечного ответа для обработки сигнала.
Импорт таблицы счетчиков Импортирует счетчики из существующей таблицы счетчиков.
Импорт данных Загружает данные из внешних источников в Интернете или из различных форм облачного хранилища в Azure, таких как таблицы, большие двоичные объекты, базы данных SQL и Azure Cosmos DB. Может загружать данные из локальной базы данных SQL Server, если шлюз настроен.

Этот модуль ранее назывался Reader.
Импорт образов Загружает изображения из хранилища BLOB-объектов Azure в набор данных.
Объединение данных Соединяет два набора данных.
Кластеризация методом K-средних Настраивает и инициализирует модель кластеризации с K-средних.
Латентное распределение Дирихле (LDA) Выполняет моделирование разделов с помощью библиотеки Wabbit Vowpal для скрытого выделения Дирихле метода (LDA).
Линейная регрессия Создает модель линейной регрессии.
Загрузка обученной модели Возвращает обученную модель, которую можно использовать для оценки в эксперименте.
Медианный фильтр Создает обычный фильтр, который используется для сглаживания данных для анализа тенденций.
Объединение преобразования счетчиков Объединяет два набора таблиц счетчиков.
Изменение параметров таблицы счетчиков Создает компактный набор функций на основе счетчиков из таблиц счетчиков.
Фильтр скользящего среднего Создает фильтр скользящего среднего, который сглаживает данные для анализа тенденций.
Мультиклассовый лес принятия решений Создает модель многоклассовой классификации с помощью алгоритма леса принятия решений.
Многоклассовые джунгли принятия решений Создает модель многоклассовой классификации с помощью алгоритма джунглях принятия решений.
Мультиклассовая регрессионная логистическая модель Создает модель классификации логистической регрессии с многоклассовой моделью.
Мультиклассовая нейронная сеть Создает модель многоклассовой классификации с помощью алгоритма нейронной сети.
Распознавание именованных сущностей Распознает именованные сущности в текстовом столбце.
Регрессия нейронной сети Создает модель регрессии с помощью алгоритма нейронной сети.
Нормализация данных Масштабирует числовые данные, чтобы ограничить значения набора данных стандартным диапазоном.
Одноклассовый метод опорных векторов Создает модель одноклассового машинного вектора поддержки для обнаружения аномалий.
Многоклассовая классификация "один-все" Создает модель многоклассовой классификации из ансамблей моделей двоичной классификации.
Порядковая регрессия Создает попорядковую модель регрессии.
Секционирование и выборка Создает несколько секций набора данных на основе выборки.
Значение функции перестановки Вычисляет показатели важности функций перестановки для переменных функций в обученной модели и тестовом наборе данных.
Обнаружение аномалий на основе анализа первичных компонентов Создает модель обнаружения аномалий с помощью анализа основных компонентов (PCA).
Регрессия Пуассона Создает регрессионную модель, которая предполагает, что данные имеют распределение Пуассона.
Предварительная обработка текста Выполняет операции очистки текста.
Предварительно обученная каскадная модель классификации изображений Создает предварительно обученную модель классификации изображений для интерфейсных лиц с помощью библиотеки OpenCV.
Анализ главных компонентов Выдает набор функций с уменьшенной размерностью для более эффективного обучения.
Удаление дублирующихся строк Удаляет дублирующиеся строки из набора данных.
Замена дискретных значений Заменяет дискретные значения из одного столбца на числовые значения, основанные на другом столбце.
Подсистема Score Matchbox Оценка прогнозов для набора данных с помощью рекомендации Matchbox.
Оценка модели Оценки прогнозов для обученной модели классификации или регрессии.
Оценка модели Vowpal Wabbit 7-4 Данные оценки с помощью системы машинного обучения Vowpal Wabbit.

Требуется обученная модель, построенная с помощью Vowpal Wabbit версий 7-4 и 7-6.
Оценка модели Vowpal Wabbit 7-10 Данные оценки с помощью системы машинного обучения Vowpal Wabbit.

Требуется обученная модель, построенная с помощью Vowpal Wabbit версии 7-10.
Оценка модели Vowpal Wabbit 8 Данные оценки с помощью системы машинного обучения Vowpal Wabbit из интерфейса командной строки.

Требует обученной модели, построенной с помощью Vowpal Wabbit версии 8.
Выбор столбцов в наборе данных Выбирает столбцы для включения или исключения из набора данных в операции.
SMOTE Увеличивает число примеров с низкими недостатками в наборе данных с использованием искусственной избыточной доли миноритария.
Split Data (Разделение данных); Разделяет строки набора данных на два разных набора.
Сведение данных Формирует базовый описательный Статистический отчет для столбцов в наборе данных.
Кластеризация очистки Выполняет параметр очистки в модели кластеризации для определения оптимальных параметров параметров.
Проверка гипотезы с помощью T-Test Сравнивает средства из двух наборов данных с помощью t-test.
Фильтр порогового значения Создает фильтр пороговых значений, ограничивающий значения.
Time Series Anomaly Detection (Обнаружение аномалий во временных рядах) Изучите тенденции в данных временных рядов, а затем использует тенденцию для обнаружения аномалий.
Обучение модели обнаружения аномалий Обучение модели детектора аномалий, а затем пометка данных из обучающего набора.
Обучение модели кластеризации Обучение модели кластеризации, а затем назначение данных из обучающего набора кластерам.
Обучение модели рекомендаций Matchbox Обучение Байеса рекомендуется с помощью алгоритма Matchbox.
Train Model (Обучение модели); Обучение модели классификации или регрессии с контролируемым способом.
Обучение модели Vowpal Wabbit 7-4 Обучение модели из системы машинного обучения Vowpal Wabbit.

Этот модуль предназначен для совместимости с Vowpal Wabbit версий 7-4 и 7-6.
Обучение модели Vowpal Wabbit 7-10 Обучение модели из системы машинного обучения Vowpal Wabbit.

Этот модуль предназначен для Vowpal Wabbit версии 7-10.
Обучение модели Vowpal Wabbit 8 Обучение модели с помощью версии 8 системы машинного обучения Vowpal Wabbit.

Этот модуль предназначен для Vowpal Wabbit версии 8.
Настройка гиперпараметров модели Выполняет параметр очистки модели регрессии или классификации для определения оптимальных параметров параметров.
Двухклассовое усредненное восприятие Создает среднюю перцептронаую модель двоичной классификации.
Двухклассовая байесовская точечная машина Создает модель двоичной классификации на компьютере с точкой алгоритма Байеса.
Two-Class Boosted Decision Tree (Двухклассовое увеличивающееся дерево принятия решений); Создает двоичный классификатор с помощью алгоритма повышенного дерева принятия решений.
Двухклассовый лес принятия решений Создает модель классификации с двумя классами с помощью алгоритма леса принятия решений.
Двухклассовый Decision Jungle Создает модель классификации с двумя классами с помощью алгоритма джунглях решений.
Двухклассовая машина опорных векторов с локальной глубиной Создает модель двоичной классификации с помощью локально глубокого алгоритма машинного вектора поддержки.
Двухклассовая регрессионная логистическая модель Создает модель логистической регрессии с двумя классами.
Двухклассовая нейронная сеть Создает двоичный классификатор с помощью алгоритма нейронной сети.
Two-Class Support Vector Machine (Двухклассовый метод опорных векторов); Создает модель двоичной классификации с помощью алгоритма поддержки машинного вектора.
Распаковка сжатых наборов данных Распаковать наборы данных из ZIP-пакета в хранилище пользователя.
Определяемый пользователем фильтр Создает настраиваемый фильтр ответа с конечным или бесконечным числом.

См. также