Запуск кода Python в конструкторе Машинного обучения Azure

Из этой статьи вы узнаете, как использовать компонент Выполнение сценария Python для добавления настраиваемой логики в конструктор Машинного обучения Azure. В следующем примере используется библиотека Pandas для простого проектирования признаков.

Можно использовать встроенный редактор кода для быстрого добавления простой логики Python. Если требуется добавить более сложный код или загрузить дополнительные библиотеки Python, следует использовать ZIP-файл.

Среда выполнения по умолчанию использует дистрибутив Python от Anaconda. Полный список предварительно установленных пакетов см. на странице Справочник по компоненту "Выполнение сценария Python".

Схема ввода для выполнения сценария Python

Важно!

Если вы не видите графические элементы, упомянутые в этом документе, такие как кнопки в студии или конструкторе, возможно, у вас нет соответствующих разрешений для рабочей области. Обратитесь к администратору подписки Azure, чтобы убедиться, что вам предоставлен правильный уровень доступа. Дополнительные сведения см. в статье Управление доступом к рабочей области Машинного обучения Azure.

Выполнение Python, написанного в конструкторе

Добавление компонента выполнения скрипта Python

  1. Найдите компонент Выполнение сценария Python в палитре конструктора. Он находится в разделе Язык Python.

  2. Перетащите компонент на холст конвейера.

Подключение входных наборов данных

В этой статье используется образец набора данных Цены на автомобили (необработанные данные) .

  1. Перетащите набор данных на холст конвейера.

  2. Подключите выходной порт набора данных к верхнему левому порту ввода компонента Выполнение сценария Python. Конструктор предоставляет входные данные в качестве параметра для сценария точки входа.

    Порт ввода справа зарезервирован для библиотек Python в формате ZIP.

    Подключение наборов данных

  3. Запишите используемый порт ввода. Конструктор назначает для переменной dataset1 входной порт слева, а для dataset2 — средний входной порт.

Входные компоненты являются необязательными, поскольку вы можете создавать или импортировать данные непосредственно в компонент Выполнение сценария Python.

Написание кода Python

Конструктор предоставляет сценарий начальной точки входа для редактирования и ввода собственного кода Python.

В этом примере используется Pandas для объединения двух столбцов в наборе данных об автомобилях, Price и Horsepower, для создания нового столбца Dollars per horsepower. В этом столбце представлены сведения о стоимости в зависимости от мощности, что может быть полезным для принятия решения о том, стоит ли приобретать автомобиль.

  1. Выберите компонент Выполнение сценария Python.

  2. В области, расположенной справа от холста, выберите текстовое поле Сценарий Python.

  3. Скопируйте следующий код и вставьте его в текстовое поле.

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower
        return dataframe1
    

    Конвейер должен выглядеть следующим образом:

    Выполнение конвейера Python

    Сценарий точки входа должен содержать функцию azureml_main. Существует два параметра функции, которые сопоставляются с двумя входными портами для компонента Выполнение сценария Python.

    Возвращаемое значение должно быть кадром данных Pandas. В выходных данных компонента можно вернуть до двух кадров данных.

  4. Отправьте конвейер.

Теперь у вас есть набор данных с новой функцией Dollars/HP, который может быть полезен при обучении средства рекомендации автомобиля. Это пример извлечения признаков и уменьшения размерности.

Дальнейшие действия

Узнайте, как импортировать собственные данные в конструктор Машинного обучения Azure.