Запуск кода Python в конструкторе Машинного обучения Azure

Из этой статьи вы узнаете, как использовать компонент "Выполнение скрипта Python" для добавления пользовательской логики в конструктор Машинного обучения Azure. В этом руководстве вы используете библиотеку Pandas для простого проектирования признаков.

Можно использовать встроенный редактор кода для быстрого добавления простой логики Python. Для добавления более сложного кода или отправки дополнительных библиотек Python следует использовать метод ZIP-файла.

Среда выполнения по умолчанию использует дистрибутив Python от Anaconda. Полный список предварительно установленных пакетов см. на странице справочника по компоненту выполнения скрипта Python .

Схема ввода для выполнения сценария Python

Важно!

Если вы не видите графические элементы, упомянутые в этом документе, такие как кнопки в студии или конструкторе, возможно, у вас нет соответствующих разрешений для рабочей области. Обратитесь к администратору подписки Azure, чтобы убедиться, что вам предоставлен правильный уровень доступа. Дополнительные сведения см. в статье Управление доступом к рабочей области Машинного обучения Azure.

Выполнение Python, написанного в конструкторе

Добавление компонента выполнения скрипта Python

  1. Найдите компонент Выполнение сценария Python в палитре конструктора. Он находится в разделе Язык Python.

  2. Перетащите компонент на холст конвейера.

Подключение входных наборов данных

В этой статье используется пример набора данных о ценах на автомобили (необработанные).

  1. Перетащите набор данных на холст конвейера.

  2. Подключите выходной порт набора данных к верхнему левому порту ввода компонента Выполнение сценария Python. Конструктор предоставляет входные данные в качестве параметра для сценария точки входа.

    Порт ввода справа зарезервирован для библиотек Python в формате ZIP.

    Подключение наборов данных

  3. Обратите внимание на конкретный порт ввода, который вы используете. Конструктор назначает левый входной порт переменной dataset1, а средний входной порт — dataset2.

Входные компоненты являются необязательными, так как вы можете создавать или импортировать данные непосредственно в компоненте Выполнение скрипта Python .

Написание кода Python

Конструктор предоставляет сценарий начальной точки входа для редактирования и ввода собственного кода Python.

В этом примере Pandas используется для объединения двух столбцов набора данных об автомобиле — Price и Horsepower — для создания нового столбца Долларов за лошадиную силу. Этот столбец представляет, сколько вы платите за каждую лошадиную единицу, которая может стать полезной информационной точкой, чтобы решить, является ли конкретный автомобиль хорошей сделкой по его цене.

  1. Выберите компонент Выполнение сценария Python.

  2. В области, расположенной справа от холста, выберите текстовое поле Сценарий Python.

  3. Скопируйте и вставьте следующий код в текстовое поле:

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower
        return dataframe1
    

    Конвейер должен выглядеть следующим образом:

    Выполнение конвейера Python

    Сценарий точки входа должен содержать функцию azureml_main. Функция имеет два параметра функции, которые сопоставляют два входных порта для компонента Выполнение скрипта Python .

    Возвращаемое значение должно быть кадром данных Pandas. В качестве выходных данных компонента можно возвращать не более двух кадров данных.

  4. Отправьте конвейер.

Теперь у вас есть набор данных с новой функцией "Доллары/HP ". Эта новая функция может помочь обучить автомобильный рекомендатель. В этом примере показано извлечение признаков и уменьшение размерности.

Дальнейшие действия

Узнайте, как импортировать собственные данные в конструктор Машинного обучения Azure.