Описания модулей Машинное обучение

В этом разделе представлен обзор всех модулей , включенных в машинное обучение Azure Studio (классическая модель), которая является интерактивной визуальной рабочей областью, позволяющей легко создавать и тестировать прогнозные модели.

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Что такое модуль?

В Машинное обучение Studio (классическая модель) модуль — это стандартный блок для создания экспериментов. Каждый модуль инкапсулирует конкретный алгоритм машинного обучения, функцию или библиотеку кода, которые могут работать с данными в рабочей области. Модули предназначены для приема подключений из других модулей для совместного использования и изменения данных.

Код, выполняемый в каждом модуле, имеет множество источников. К ним относятся библиотеки с открытым исходным кодом и языки, алгоритмы, разработанные Microsoft Research, и средства для работы с Azure и другими облачными службами.

Совет

Ищете алгоритмы машинного обучения? См. категорию машинное обучение , которая содержит модули для деревьев принятия решений, кластеризации, нейронные сети и т. д. Категории обучение и Оценка включают модули, помогающие обучить и тестировать модели.

Подключив и настроив модули, можно создать рабочий процесс, который считывает данные из внешних источников, подготавливает их для анализа, применяет алгоритмы машинного обучения и создает результаты.

Если эксперимент открыт в машинное обучение Studio (классическая модель), можно просмотреть полный список текущих модулей в области навигации слева. Вы перетаскивайте эти стандартные блоки в свой эксперимент, а затем подключаете их для создания полного рабочего процесса машинного обучения, который называется экспериментом.

Иногда модули обновляются для добавления новых функций или для удаления старого кода. В этом случае все эксперименты, которые используют этот модуль, продолжают работать. Но при следующем запуске эксперимента вам будет предложено обновить модуль или использовать другой модуль.

Примеры

Пример создания полного эксперимента машинного обучения см. в следующих руководствах:

Категории модулей

Чтобы упростить поиск связанных модулей, средства машинного обучения в Машинное обучение Studio (классическая модель) группируются по этим категориям.

Преобразования форматов данных

Используйте эти модули для преобразования данных в один из форматов, используемый другими средствами или форматами машинного обучения.

  • Входные и выходные данные

    Используйте эти модули для чтения данных и моделей из облачных источников данных, включая кластеры Hadoop, хранилище таблиц Azure и URL-адреса в Интернете. Эти модули также можно использовать для записи результатов в хранилище или в базу данных.

  • Преобразование данных

    Используйте эти модули подготовки данных для анализа. Можно изменять типы данных, помечать столбцы как компоненты или метки, создавать функции, а также масштабировать или нормализовать данные.

  • Фильтр

    Преобразование числовых данных, полученных из обработки цифровых сигналов.

  • Обучение с помощью счетчиков

    Используйте совместное распределение вероятностей для создания функций, которые сжимаются для больших наборов данных.

  • Оперирование

    Эта группа предоставляет разнообразные средства для обработки и анализа данных. Например, можно удалить или заменить отсутствующие значения, выбрать подмножество столбцов, добавить столбец или объединить два набора данных.

  • Выборка и разбиение

    Разделение набора данных по критериям или по размеру, создание обучающих и проверочных наборов, а также изоляция определенных строк.

  • Масштабирование и сокращение

    Преобразование числовых данных.

Выбор компонентов

Используйте эти модули для определения оптимальных признаков в данных с помощью хорошо исследованных статистических методов.

Машинное обучение

Эта группа содержит большинство алгоритмов машинного обучения, поддерживаемых Машинное обучение.

Он также содержит модули, предназначенные для поддержки алгоритмов с помощью учебных моделей, создания оценок и оценки производительности модели.

Модули библиотеки OpenCV

Эти модули предоставляют простой доступ к популярной библиотеке с открытым исходным кодом для обработки и классификации образов.

Модули языка R

Используйте эти модули для добавления настраиваемого кода R в свой эксперимент или реализуйте модель машинного обучения на базе пакета R.

Модули языка Python

Используйте эти модули для добавления настраиваемого кода Python в свой эксперимент.

Статистические функции

Используйте эти модули для вычисления распределения вероятностей, создания пользовательских вычислений и выполнения множества других задач, связанных с числовыми переменными.

Анализ текста

Используйте эти модули для создания хэш-функций и распознавания именованных сущностей или для предварительной обработки текста с помощью средств обработки естественного языка.

Временной ряд

Используйте эти модули для оценки аномалий в тенденциях с помощью алгоритмов, специально предназначенных для данных временных рядов.

Модули Машинное обучение Studio (классические) не пытаются дублировать средства интеграции данных, поддерживаемые в других средствах, таких как фабрика данных Azure. Вместо этого модули предоставляют функциональные возможности, характерные для машинного обучения.

  • Нормализация, группирование и масштабирование данных
  • Вычисление статистического распределения данных
  • Преобразование в другие форматы машинного обучения
  • Импорт данных, используемых для экспериментов машинного обучения и экспорта результатов
  • Анализ текста, выбор компонентов и уменьшение размерности

Если вам нужны более сложные средства для обработки и хранения данных, см. следующие сведения:

  • Фабрика данных Azure: готовые к работе и облачные конвейеры обработки данных.
  • База данных SQL Azure: масштабируемое хранилище с интегрированным доступом к машинному обучению.
  • CosmosDB: хранилище данных NoSQL; Импорт данных в Машинное обучение Studio (классическая модель).
  • Azure Data Lake Analytics: распределенная аналитика больших данных.
  • Stream Analytics: обработка событий для Интернет вещей.
  • Анализ текста Azure. несколько вариантов обработки текста и связанных с ними функций для распознавания речи, изображений и лиц.
  • Azure Databricks: платформа аналитики на основе Spark.

См. также раздел