Руководство по обучению модели TensorFlow классификации изображений с помощью расширения Visual Studio Code Машинное обучение Azure (предварительная версия)

Статья
01/25/2024

ОБЛАСТЬ ПРИМЕНЕНИЯ:расширение Машинного обучения для Azure CLI версии 2 (текущая версия)

Узнайте о том, как обучить модель классификации изображений для распознавания рукописных чисел с использованием TensorFlow и расширения Visual Studio Code для Машинного обучения Azure

Важно!

Эта функция сейчас доступна в виде общедоступной предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания. Ее не следует использовать для производственных рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены.

Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

В этом руководстве вы выполнили следующие задачи.

Изучение кода
Создание рабочей области
Обучение модели

Необходимые компоненты

Подписка Azure. Если у вас ее нет, зарегистрируйтесь для использования бесплатной или платной версии службы "Машинное обучение Azure" При использовании бесплатной подписки поддерживаются только кластеры ЦП.
Установите простой кроссплатформенный редактор кода Visual Studio Code.
Студия машинного обучения Azure расширение Visual Studio Code. Инструкции по установке см. в руководстве по установке Машинное обучение Azure расширения Visual Studio Code
CLI (версия 2). Инструкции по установке см. в разделе Установка, настройка и использование CLI (версия 2).
Клонирование репозитория на основе сообщества
```
    git clone https://github.com/Azure/azureml-examples.git
```

Изучение кода

Код в этом руководстве с помощью TensorFlow обучает модель машинного обучения для классификации изображений, которая определяет рукописные цифры от 0 до 9. Это достигается путем создания нейронной сети, которая принимает в качестве входных данных значения пикселей от изображения размером 28 x 28 пикселей и выводит список из 10 оценок вероятности, по одной для каждой классифицируемой цифры. Это пример того, как выглядят данные.

MNIST Digits

Создание рабочей области

Первое, что нужно сделать для создания приложения в Машинном обучении Azure, — это создать рабочую область. Рабочая область содержит ресурсы для обучения моделей и обученных моделей. См. сведения о рабочих областях.

Откройте каталог azureml-examples/cli/jobs/single-step/tensorflow/mnist из репозитория, поддерживаемого сообществом, в Visual Studio Code.
На панели действий Visual Studio Code щелкните значок Azure, чтобы открыть представление Машинного обучения Azure.
В представлении Машинного обучения Azure щелкните правой кнопкой мыши узел подписки и выберите Создать рабочую область.
Появится файл спецификации. Настройте файл спецификации, указав следующие параметры.
```
$schema: https://azuremlschemas.azureedge.net/latest/workspace.schema.json
name: TeamWorkspace
location: WestUS2
display_name: team-ml-workspace
description: A workspace for training machine learning models
tags:
  purpose: training
  team: ml-team
```
Файл спецификации создает рабочую область TeamWorkspace в регионе WestUS2. Остальные параметры в файле спецификации задают понятные имена, описания и теги для рабочей области.
Щелкните правой кнопкой мыши файл спецификации и выберите AzureML: Выполнить YAML. При создании ресурса используются параметры конфигурации, определенные в файле спецификации YAML, а задание отправляется с помощью CLI версии 2. На этом этапе выполняется запрос к Azure для создания новой рабочей области и зависимых ресурсов в учетной записи. Через несколько минут в узле подписки появится новая рабочая область.
Выберите рабочую область по умолчанию TeamWorkspace. При этом в ней размещаются созданные ресурсы и задания. Нажмите кнопку "Задать Машинное обучение Azure рабочую область" в строке состояния Visual Studio Code и следуйте инструкциям, чтобы задать TeamWorkspace рабочую область по умолчанию.

Дополнительные сведения о рабочих областях см. в статье об управлении ресурсами в VS Code.

Обучение модели

В процессе обучения создается модель TensorFlow путем обработки внедренных в нее обучающих данных и шаблонов обучения для каждой из классифицируемых цифр.

Как и рабочие области и целевые объекты вычислений, задания обучения определяются с помощью шаблонов ресурсов. В этом примере спецификация определена в файле job.yml , который выглядит следующим образом:

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
code: src
command: >
    python train.py
environment: azureml:AzureML-tensorflow-2.4-ubuntu18.04-py37-cuda11-gpu:48
resources:
   instance_type: Standard_NC12
   instance_count: 3
experiment_name: tensorflow-mnist-example
description: Train a basic neural network with TensorFlow on the MNIST dataset.

Этот файл спецификации отправляет задание обучения tensorflow-mnist-example в недавно созданный целевой объект вычислений gpu-cluster, на котором выполняется код скрипта Python train.py. При этом используется одна из курируемых сред Машинного обучения Azure, которая содержит TensorFlow и другие программные зависимости, необходимые для запуска скрипта обучения. Дополнительные сведения о курируемых средах Машинного обучения Azure см. в этой статье.

Чтобы отправить задание обучения, выполните следующие действия:

Откройте файл job.yml.
Щелкните правой кнопкой мыши файл в текстовом редакторе и выберите AzureML: Выполнить YAML.

На этом этапе в Azure отправляется запрос на запуск эксперимента на выбранном целевом объекте вычислений в вашей рабочей области. Этот процесс занимает несколько минут. Время выполнения задания обучения зависит от нескольких факторов, таких как тип вычислительной среды и объем данных для обучения. Чтобы отслеживать ход выполнения эксперимента, щелкните правой кнопкой мыши узел текущий запуск и выберите Просмотреть задание на портале Azure.

Когда откроется диалоговое окно с запросом на открытие внешнего веб-сайта, щелкните Открыть.

Track experiment progress

Когда модель закончит обучение, рядом с узлом выполнения появится метка состояния "Завершено".

Следующие шаги

Запуск Visual Studio Code, интегрированный с Машинное обучение Azure (предварительная версия)
См. инструкции по редактированию, запуску и отладке кода Python на локальном компьютере.
Запуск записных книжек Jupyter Notebooks в Visual Studio Code с помощью удаленного сервера Jupyter.
См. инструкции по обучению с помощью Машинного обучения Azure без использования Visual Studio Code в руководстве по обучению и развертывании модели классификации изображений с помощью Машинного обучения Azure.