Tutoriel : Entraîner un modèle de détection d’objet avec AutoML et Python

Article
11/07/2023

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)Kit de développement logiciel (SDK) Python azure-ai-ml v2 (préversion)

Dans ce tutoriel, vous allez découvrir comment entraîner un modèle de détection d’objet à l’aide du ML automatisé d’Azure Machine Learning avec l’extension Azure Machine Learning CLI v2 ou le Kit de développement logiciel (SDK) Python Azure Machine Learning v2. Ce modèle de détection d’objet détermine si l’image contient des objets, tels qu’une canette, un carton, une bouteille de lait ou une bouteille d’eau.

Le ML automatisé accepte des données d’entraînement et des paramètres de configuration, et itère automatiquement des combinaisons de différentes méthodes de normalisation/standardisation des fonctionnalités, de modèles et de paramètres hyperparamètres afin d’obtenir le meilleur modèle.

Dans ce tutoriel, vous allez écrire du code à l’aide du kit de développement logiciel (SDK) Python et découvrir comment effectuer les tâches suivantes :

Télécharger et transformer des données
Entraîner un modèle de détection d’objet Machine Learning automatisé
Spécifier des valeurs d’hyperparamètres pour votre modèle
Effectuer un balayage hyperparamétrique
Déployer votre modèle
Visualiser les détections

Prérequis

Pour utiliser Azure Machine Learning, vous avez d’abord besoin d’un espace de travail. Si vous n’en avez pas, suivez la procédure Créer les ressources nécessaires pour commencer pour créer un espace de travail et en savoir plus sur son utilisation.
Python 3.6 ou 3.7 sont pris en charge pour cette fonctionnalité
Téléchargez et décompressez le fichier de données *odFridgeObjects.zip. Le jeu de données est annoté au format Pascal VOC, dans lequel chaque image correspond à un fichier XML. Chaque fichier XML contient des informations sur l’emplacement de son fichier image correspondant. Il contient également des informations sur les cadres englobants et les étiquettes d’objet. Pour pouvoir utiliser ces données, vous devez d’abord les convertir au format JSON, comme indiqué dans la section Convert the downloaded data to JSONL de ce notebook.
Utilisez une instance de calcul pour suivre ce tutoriel sans autre installation. (Découvrez comment créer une instance de calcul.) Vous pouvez également installer l’interface CLI/SDK pour utiliser votre propre environnement local.
- Azure CLI
- Kit de développement logiciel (SDK) Python
S’APPLIQUE À :Extension ml Azure CLI v2 (actuelle)

Ce didacticiel est également disponible dans le référentiel azureml-examples sur GitHub. Si vous souhaitez l’exécuter dans votre propre environnement local :
- Installez et configurez la CLI (v2), et assurez-vous que vous installez l’extension ml.
S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

Ce didacticiel est également disponible dans le référentiel azureml-examples sur GitHub. Si vous souhaitez l’exécuter dans votre propre environnement local :
- Utilisez les commandes suivantes pour installer le Kit de développement logiciel (SDK) Python Azure Machine Learning v2 :
  - Désinstallez la préversion précédente :
```
pip uninstall azure-ai-ml
```
  - Installez le kit SDK Python Azure Machine Learning v2 :
```
pip install azure-ai-ml azure-identity
```
  Notes
  
  Seuls Python 3.6 et 3.7 sont compatibles avec la prise en charge du ML automatisé pour les tâches de vision par ordinateur.

Configuration de la cible de calcul

Notes

Pour essayer le calcul serverless (préversion), ignorez cette étape et passez à Entraîner le modèle.

Vous devez d’abord configurer une cible de calcul à utiliser pour l’entraînement de votre modèle ML automatisé. Les modèles ML automatisé pour les tâches d’image requièrent des références (SKU) GPU.

Ce tutoriel utilise la série NCsv3 (avec des GPU V100), car ce type de cible de calcul utilise plusieurs GPU pour accélérer la formation. En outre, vous pouvez configurer plusieurs nœuds afin de tirer parti du parallélisme lors du réglage des hyperparamètres pour votre modèle.

Le code suivant crée un calcul GPU d’une taille de Standard_NC24s_v3 avec 4 nœuds.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension ml Azure CLI v2 (actuelle)

Créez un fichier yml avec la configuration suivante.

$schema: https://azuremlschemas.azureedge.net/latest/amlCompute.schema.json 
name: gpu-cluster
type: amlcompute
size: Standard_NC24s_v3
min_instances: 0
max_instances: 4
idle_time_before_scale_down: 120

Pour créer le calcul, vous exécutez la commande CLI v2 suivante avec le chemin d’accès à votre fichier .yml, le nom de l’espace de travail, le groupe de ressources et l’ID d’abonnement.

az ml compute create -f [PATH_TO_YML_FILE] --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

from azure.ai.ml.entities import AmlCompute
compute_name = "gpu-cluster"
cluster_basic = AmlCompute(
    name=compute_name,
    type="amlcompute",
    size="Standard_NC24s_v3",
    min_instances=0,
    max_instances=4,
    idle_time_before_scale_down=120,
)
ml_client.begin_create_or_update(cluster_basic)

Ce calcul est utilisé ultérieurement lors de la création du travail automl spécifique à la tâche.

Configuration de l’expérience

Vous pouvez utiliser une expérience pour suivre les travaux d’entraînement de votre modèle.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuel)

Le nom de l’essai peut être fourni à l’aide de la clé experiment_name comme suit :

experiment_name: dpv2-cli-automl-image-object-detection-experiment

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

Le nom de l’essai est utilisé ultérieurement lors de la création du travail automl spécifique à la tâche.

exp_name = "dpv2-image-object-detection-experiment"

Visualiser les données d’entrée

Une fois les données d’image d’entrée préparées au format JSONL (JSON Lines), vous pouvez visualiser les cadres englobants de vérité fondamentale pour une image. Pour cela, vérifiez que matplotlib est installé.

%pip install --upgrade matplotlib


%matplotlib inline
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import matplotlib.patches as patches
from PIL import Image as pil_image
import numpy as np
import json
import os

def plot_ground_truth_boxes(image_file, ground_truth_boxes):
    # Display the image
    plt.figure()
    img_np = mpimg.imread(image_file)
    img = pil_image.fromarray(img_np.astype("uint8"), "RGB")
    img_w, img_h = img.size

    fig,ax = plt.subplots(figsize=(12, 16))
    ax.imshow(img_np)
    ax.axis("off")

    label_to_color_mapping = {}

    for gt in ground_truth_boxes:
        label = gt["label"]

        xmin, ymin, xmax, ymax =  gt["topX"], gt["topY"], gt["bottomX"], gt["bottomY"]
        topleft_x, topleft_y = img_w * xmin, img_h * ymin
        width, height = img_w * (xmax - xmin), img_h * (ymax - ymin)

        if label in label_to_color_mapping:
            color = label_to_color_mapping[label]
        else:
            # Generate a random color. If you want to use a specific color, you can use something like "red".
            color = np.random.rand(3)
            label_to_color_mapping[label] = color

        # Display bounding box
        rect = patches.Rectangle((topleft_x, topleft_y), width, height,
                                 linewidth=2, edgecolor=color, facecolor="none")
        ax.add_patch(rect)

        # Display label
        ax.text(topleft_x, topleft_y - 10, label, color=color, fontsize=20)

    plt.show()

def plot_ground_truth_boxes_jsonl(image_file, jsonl_file):
    image_base_name = os.path.basename(image_file)
    ground_truth_data_found = False
    with open(jsonl_file) as fp:
        for line in fp.readlines():
            line_json = json.loads(line)
            filename = line_json["image_url"]
            if image_base_name in filename:
                ground_truth_data_found = True
                plot_ground_truth_boxes(image_file, line_json["label"])
                break
    if not ground_truth_data_found:
        print("Unable to find ground truth information for image: {}".format(image_file))

À l’aide des fonctions d’assistance ci-dessus, pour une image donnée, vous pouvez exécuter le code suivant pour afficher les cadres englobants.

image_file = "./odFridgeObjects/images/31.jpg"
jsonl_file = "./odFridgeObjects/train_annotations.jsonl"

plot_ground_truth_boxes_jsonl(image_file, jsonl_file)

Charger des données et créer MLTable

Pour utiliser les données pour la formation, chargez les données dans le Stockage Blob par défaut de votre espace de travail Azure Machine Learning et inscrivez-les en tant que ressources. Les avantages de l’inscription des données sont les suivants :

Partager facilement avec d’autres membres de l’équipe
Contrôle de version des métadonnées (emplacement, description, etc.)
Suivi de la traçabilité

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension ml Azure CLI v2 (actuelle)

Créez un fichier yml avec la configuration suivante.

$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: fridge-items-images-object-detection
description: Fridge-items images Object detection
path: ./data/odFridgeObjects
type: uri_folder

Pour charger des images comme ressource de données, vous exécutez la commande CLI v2 suivante avec le chemin de votre fichier .yml, le nom de l’espace de travail, le groupe de ressources et l’ID d’abonnement.

az ml data create -f [PATH_TO_YML_FILE] --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# Uploading image files by creating a 'data asset URI FOLDER':

from azure.ai.ml.entities import Data
from azure.ai.ml.constants import AssetTypes, InputOutputModes
from azure.ai.ml import Input

my_data = Data(
    path=dataset_dir,
    type=AssetTypes.URI_FOLDER,
    description="Fridge-items images Object detection",
    name="fridge-items-images-object-detection",
)

uri_folder_data_asset = ml_client.data.create_or_update(my_data)

print(uri_folder_data_asset)
print("")
print("Path to folder in Blob Storage:")
print(uri_folder_data_asset.path)

L’étape suivante consiste à créer MLTable à partir de vos données au format jsonl, comme indiqué ci-dessous. MLtable intègre vos données dans un objet consommable à des fins de formation.

paths:
  - file: ./train_annotations.jsonl
transformations:
  - read_json_lines:
        encoding: utf8
        invalid_lines: error
        include_path_column: false
  - convert_column_types:
      - columns: image_url
        column_type: stream_info

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuel)

La configuration suivante crée des données de formation et de validation à partir de MLTable.

target_column_name: label
training_data:
  path: data/training-mltable-folder
  type: mltable
validation_data:
  path: data/validation-mltable-folder
  type: mltable

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

Vous pouvez créer des entrées de données à partir de MLTable de formation et de validation avec le code suivant :

from azure.ai.ml import Input
from azure.ai.ml.constants import AssetTypes

# Training MLTable defined locally, with local data to be uploaded
my_training_data_input = Input(type=AssetTypes.MLTABLE, path=training_mltable_path)

# Validation MLTable defined locally, with local data to be uploaded
my_validation_data_input = Input(type=AssetTypes.MLTABLE, path=validation_mltable_path)

# WITH REMOTE PATH: If available already in the cloud/workspace-blob-store
# my_training_data_input = Input(type=AssetTypes.MLTABLE, path="azureml://datastores/workspaceblobstore/paths/vision-classification/train")
# my_validation_data_input = Input(type=AssetTypes.MLTABLE, path="azureml://datastores/workspaceblobstore/paths/vision-classification/valid")

Configurer votre expérience de détection d’objet

Afin de configurer des travaux de ML automatisé pour les tâches liées à une image, créez un travail AutoML propre à une tâche.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

Pour utiliser le calcul serverless (préversion), remplacez la ligne compute: azureml:gpu-cluster par ce code :
resources:
 instance_type: Standard_NC24s_v3
 instance_count: 4

task: image_object_detection
primary_metric: mean_average_precision
compute: azureml:gpu-cluster

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# Create the AutoML job with the related factory-function.

image_object_detection_job = automl.image_object_detection(
    compute=compute_name,
    experiment_name=exp_name,
    training_data=my_training_data_input,
    validation_data=my_validation_data_input,
    target_column_name="label",
    primary_metric=ObjectDetectionPrimaryMetrics.MEAN_AVERAGE_PRECISION,
    tags={"my_custom_tag": "My custom value"},
)

Notes

Pour utiliser le calcul serverless (préversion), remplacez la ligne compute="cpu-cluster" par ce code :

image_object_detection_job.resources = ResourceConfiguration(instance_type="Standard_NC24rs_v3",instance_count =4)

image_object_detection_job.set_limits(
    max_trials=10,
    max_concurrent_trials=2,
)

Balayage automatique des hyperparamètres pour les tâches d’image (Mode automatique)

Important

Cette fonctionnalité est actuellement disponible en préversion publique. Cette préversion est fournie sans contrat de niveau de service. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.

Dans votre travail AutoML, vous pouvez effectuer un balayage automatique des hyperparamètres afin de trouver le modèle optimal (nous appelons cette fonctionnalité AutoMode). Vous spécifiez uniquement le nombre d’essais ; l’espace de recherche des hyperparamètres, la méthode d’échantillonnage et la stratégie d’arrêt anticipé ne sont pas nécessaires. Le système détermine automatiquement la région de l’espace d’hyperparamètre à balayer en fonction du nombre d’essais. Une valeur comprise entre 10 et 20 fonctionnera probablement bien sur de nombreux jeux de données.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

limits:
  max_trials: 10
  max_concurrent_trials: 2

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# Trigger AutoMode
image_object_detection_job.set_limits(max_trials=10, max_concurrent_trials=2)

Vous pouvez ensuite envoyer le travail pour entraîner un modèle d’image.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

Pour soumettre votre travail AutoML, vous exécutez la commande CLI v2 suivante avec le chemin d’accès à votre fichier .yml, le nom de l’espace de travail, le groupe de ressources et l’ID d’abonnement.

az ml job create --file ./hello-automl-job-basic.yml --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

Une fois que vous avez configuré votre travail AutoML avec les paramètres souhaités, vous pouvez soumettre le travail.

# Submit the AutoML job
returned_job = ml_client.jobs.create_or_update(
    image_object_detection_job
)  # submit the job to the backend

print(f"Created job: {returned_job}")

Balayage manuel des hyperparamètres pour les tâches d’image

Dans votre travail AutoML, vous pouvez spécifier des architectures de modèle en utilisant le paramètre model_name et configurer les paramètres de façon à effectuer un balayage hyperparamétrique sur un espace de recherche défini afin de trouver le modèle optimal.

Dans cet exemple, nous allons effectuer l'apprentissage d’un modèle de détection d’objet avec yolov5 et fasterrcnn_resnet50_fpn, tous deux étant préformés sur COCO, un jeu de données de détection d’objet, de segmentation et de sous-titrage à grande échelle qui contient des milliers d’images étiquetées avec plus de 80 catégories d’étiquettes.

Vous pouvez effectuer un balayage hyperparamétrique sur un espace de recherche défini pour trouver le modèle optimal.

Limites du travail

Vous pouvez contrôler les ressources dépensées sur votre travail d’apprentissage d’image AutoML en spécifiant timeout_minutes, max_trials et max_concurrent_trials pour le travail dans les paramètres de limite. Consultez la description détaillée des paramètres de limites du travail.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

limits:
  timeout_minutes: 60
  max_trials: 10
  max_concurrent_trials: 2

# Set limits
image_object_detection_job.set_limits(
    timeout_minutes=60,
    max_trials=10,
    max_concurrent_trials=2,
)

Le code suivant définit l’espace de recherche en vue du balayage hyperparamétrique pour chaque architecture définie, yolov5 et fasterrcnn_resnet50_fpn. Dans l’espace de recherche, spécifiez la plage de valeurs pour learning_rate, optimizer, lr_scheduler, etc., parmi laquelle AutoML devra choisir lorsqu’il tentera de générer un modèle avec la métrique principale optimale. Si les valeurs des hyperparamètres ne sont pas spécifiées, les valeurs par défaut sont utilisées pour chaque architecture.

Pour les paramètres de réglage, utilisez l’échantillonnage aléatoire afin de choisir des échantillons à partir de cet espace de paramètres en utilisant le sampling_algorithm random. Les limites du travail configurées ci-dessus indiquent au ML automatisé qu’il doit effectuer en tout 10 essais avec ces différents échantillons, en exécutant deux essais à la fois sur notre cible de calcul, qui a été configurée à l’aide de quatre nœuds. Plus l’espace de recherche contient de paramètres, plus il faut d’essais pour trouver des modèles optimaux.

La stratégie d’arrêt anticipé Bandit est également utilisée. Cette stratégie met fin aux essais ayant des performances médiocres, autrement dit ceux qui ne sont pas dans une fourchette de 20 % par rapport à l’essai le plus performant, ce qui permet d’économiser de manière significative les ressources de calcul.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

sweep:
  sampling_algorithm: random
  early_termination:
    type: bandit
    evaluation_interval: 2
    slack_factor: 0.2
    delay_evaluation: 6

search_space:
  - model_name:
      type: choice
      values: [yolov5]
    learning_rate:
      type: uniform
      min_value: 0.0001
      max_value: 0.01
    model_size:
      type: choice
      values: [small, medium]

  - model_name:
      type: choice
      values: [fasterrcnn_resnet50_fpn]
    learning_rate:
      type: uniform
      min_value: 0.0001
      max_value: 0.001
    optimizer:
      type: choice
      values: [sgd, adam, adamw]
    min_size:
      type: choice
      values: [600, 800]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# Configure sweep settings
image_object_detection_job.set_sweep(
    sampling_algorithm="random",
    early_termination=BanditPolicy(
        evaluation_interval=2, slack_factor=0.2, delay_evaluation=6
    ),
)

# Define search space
image_object_detection_job.extend_search_space(
    [
        SearchSpace(
            model_name=Choice(["yolov5"]),
            learning_rate=Uniform(0.0001, 0.01),
            model_size=Choice(["small", "medium"]),  # model-specific
            # image_size=Choice([640, 704, 768]),  # model-specific; might need GPU with large memory
        ),
        SearchSpace(
            model_name=Choice(["fasterrcnn_resnet50_fpn"]),
            learning_rate=Uniform(0.0001, 0.001),
            optimizer=Choice(["sgd", "adam", "adamw"]),
            min_size=Choice([600, 800]),  # model-specific
            # warmup_cosine_lr_warmup_epochs=Choice([0, 3]),
        ),
    ]
)

Une fois les paramètres de l’espace de recherche et de balayage définis, vous pouvez soumettre le travail pour effectuer l'apprentissage d’un modèle d’image à l’aide de votre jeu de données de formation.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

az ml job create --file ./hello-automl-job-basic.yml --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

Une fois que vous avez configuré votre travail AutoML avec les paramètres souhaités, vous pouvez soumettre le travail.

# Submit the AutoML job
returned_job = ml_client.jobs.create_or_update(
    image_object_detection_job
)  # submit the job to the backend

print(f"Created job: {returned_job}")

Quand vous faites un balayage hyperparamétrique, vous pouvez visualiser les différents essais qui ont été tentés en utilisant l’interface utilisateur HyperDrive. Vous pouvez accéder à cette interface utilisateur à travers l’onglet « Travaux enfants » dans l’interface utilisateur de l’automl_image_job principal ci-dessus, qui est le travail parent HyperDrive. Vous pouvez ensuite accéder à l’onglet « Travaux enfants » correspondant.

Vous pouvez aussi voir ci-dessous le travail parent HyperDrive et accéder à son onglet « Travaux enfants » :

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

CLI example not available, please use Python SDK.

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

hd_job = ml_client.jobs.get(returned_job.name + '_HD')
hd_job

Inscrire et déployer un modèle

Une fois le travail terminé, vous pouvez inscrire le modèle qui a été créé à partir du meilleur essai (configuration qui a généré la meilleure métrique principale). Vous pouvez inscrire le modèle après le téléchargement ou en spécifiant le azureml chemin avec le jobid correspondant.

Obtenir le meilleur essai

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

CLI example not available, please use Python SDK.

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# Get the best model's child run

best_child_run_id = mlflow_parent_run.data.tags["automl_best_child_run_id"]
print(f"Found best child run id: {best_child_run_id}")

best_run = mlflow_client.get_run(best_child_run_id)

print("Best child run: ")
print(best_run)

# Create local folder
local_dir = "./artifact_downloads"
if not os.path.exists(local_dir):
    os.mkdir(local_dir)

# Download run's artifacts/outputs
local_path = mlflow_client.download_artifacts(
    best_run.info.run_id, "outputs", local_dir
)
print(f"Artifacts downloaded in: {local_path}")
print(f"Artifacts: {os.listdir(local_path)}")

Inscrire le modèle

Inscrivez le modèle à l’aide du chemin azureml ou de votre chemin téléchargé localement.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

 az ml model create --name od-fridge-items-mlflow-model --version 1 --path azureml://jobs/$best_run/outputs/artifacts/outputs/mlflow-model/ --type mlflow_model --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

model_name = "od-fridge-items-mlflow-model"
model = Model(
    path=f"azureml://jobs/{best_run.info.run_id}/outputs/artifacts/outputs/mlflow-model/",
    name=model_name,
    description="my sample object detection model",
    type=AssetTypes.MLFLOW_MODEL,
)

# for downloaded file
# model = Model(
#     path=mlflow_model_dir,
#     name=model_name,
#     description="my sample object detection model",
#     type=AssetTypes.MLFLOW_MODEL,
# )

registered_model = ml_client.models.create_or_update(model)

Après avoir inscrit le modèle que vous souhaitez utiliser, vous pouvez le déployer à l’aide du point de terminaison en ligne managé deploy-managed-online-endpoint

Configurer le point de terminaison en ligne

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: od-fridge-items-endpoint
auth_mode: key

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# Creating a unique endpoint name with current datetime to avoid conflicts
import datetime

online_endpoint_name = "od-fridge-items-" + datetime.datetime.now().strftime(
    "%m%d%H%M%f"
)

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint for deploying model",
    auth_mode="key",
    tags={"foo": "bar"},
)
print(online_endpoint_name)

Créer le point de terminaison

À l’aide de MLClient créé précédemment, nous allons maintenant créer le point de terminaison dans l’espace de travail. Cette commande lance la création du point de terminaison et retourne une réponse de confirmation pendant que la création du point de terminaison se poursuit.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

az ml online-endpoint create --file .\create_endpoint.yml --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

ml_client.begin_create_or_update(endpoint).result()

Nous pouvons également créer un point de terminaison de lot pour l’inférence par lot sur de grands volumes de données sur une période. Examinez le notebook de scoring par lot de détection d’objets pour l’inférence par lots à l’aide du point de terminaison de lot.

Configurer le déploiement en ligne

Un déploiement est un ensemble de ressources nécessaires pour héberger le modèle qui effectue l’inférence réelle. Nous créons un déploiement pour notre point de terminaison en utilisant la classe ManagedOnlineDeployment. Vous pouvez utiliser l’une des références SKU de machine virtuelle GPU ou CPU pour votre cluster de déploiement.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

name: od-fridge-items-mlflow-deploy
endpoint_name: od-fridge-items-endpoint
model: azureml:od-fridge-items-mlflow-model@latest
instance_type: Standard_DS3_v2
instance_count: 1
liveness_probe:
    failure_threshold: 30
    success_threshold: 1
    timeout: 2
    period: 10
    initial_delay: 2000
readiness_probe:
    failure_threshold: 10
    success_threshold: 1
    timeout: 10
    period: 10
    initial_delay: 2000

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

deployment = ManagedOnlineDeployment(
    name="od-fridge-items-mlflow-deploy",
    endpoint_name=online_endpoint_name,
    model=registered_model.id,
    instance_type="Standard_DS4_V2",
    instance_count=1,
    request_settings=req_timeout,
    liveness_probe=ProbeSettings(
        failure_threshold=30,
        success_threshold=1,
        timeout=2,
        period=10,
        initial_delay=2000,
    ),
    readiness_probe=ProbeSettings(
        failure_threshold=10,
        success_threshold=1,
        timeout=10,
        period=10,
        initial_delay=2000,
    ),
)

Créer le déploiement

En utilisant le MLClient créé précédemment, nous allons créer le déploiement dans l’espace de travail. Cette commande lance la création du déploiement et retourne une réponse de confirmation pendant que la création du déploiement se poursuit.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

az ml online-deployment create --file .\create_deployment.yml --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

ml_client.online_deployments.begin_create_or_update(deployment).result()

Mettre à jour le trafic :

Par défaut, le déploiement actuel est défini pour recevoir 0 % de trafic. vous pouvez définir le pourcentage de trafic que le déploiement actuel doit recevoir. Somme des pourcentages de trafic de tous les déploiements avec un point de terminaison qui ne doit pas dépasser 100 %.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

az ml online-endpoint update --name 'od-fridge-items-endpoint' --traffic 'od-fridge-items-mlflow-deploy=100' --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# od fridge items deployment to take 100% traffic
endpoint.traffic = {"od-fridge-items-mlflow-deploy": 100}
ml_client.begin_create_or_update(endpoint).result()

test du déploiement

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

CLI example not available, please use Python SDK.

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

# Create request json
import base64

sample_image = os.path.join(dataset_dir, "images", "1.jpg")


def read_image(image_path):
    with open(image_path, "rb") as f:
        return f.read()


request_json = {
    "input_data": {
        "columns": ["image"],
        "data": [base64.encodebytes(read_image(sample_image)).decode("utf-8")],
    }
}

import json

request_file_name = "sample_request_data.json"

with open(request_file_name, "w") as request_file:
    json.dump(request_json, request_file)

resp = ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name=deployment.name,
    request_file=request_file_name,
)

Visualiser les détections

Maintenant que vous avez attribué un score à une image de test, vous pouvez visualiser les cadres englobants pour cette image. Pour ce faire, vérifiez que matplotlib est installé.

Azure CLI
Kit de développement logiciel (SDK) Python

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

CLI example not available, please use Python SDK.

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

%matplotlib inline
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import matplotlib.patches as patches
from PIL import Image
import numpy as np
import json

IMAGE_SIZE = (18, 12)
plt.figure(figsize=IMAGE_SIZE)
img_np = mpimg.imread(sample_image)
img = Image.fromarray(img_np.astype("uint8"), "RGB")
x, y = img.size

fig, ax = plt.subplots(1, figsize=(15, 15))
# Display the image
ax.imshow(img_np)

# draw box and label for each detection
detections = json.loads(resp)
for detect in detections[0]["boxes"]:
    label = detect["label"]
    box = detect["box"]
    conf_score = detect["score"]
    if conf_score > 0.6:
        ymin, xmin, ymax, xmax = (
            box["topY"],
            box["topX"],
            box["bottomY"],
            box["bottomX"],
        )
        topleft_x, topleft_y = x * xmin, y * ymin
        width, height = x * (xmax - xmin), y * (ymax - ymin)
        print(
            f"{detect['label']}: [{round(topleft_x, 3)}, {round(topleft_y, 3)}, "
            f"{round(width, 3)}, {round(height, 3)}], {round(conf_score, 3)}"
        )

        color = np.random.rand(3)  #'red'
        rect = patches.Rectangle(
            (topleft_x, topleft_y),
            width,
            height,
            linewidth=3,
            edgecolor=color,
            facecolor="none",
        )
        ax.add_patch(rect)
        plt.text(topleft_x, topleft_y - 10, label, color=color, fontsize=20)
plt.show()

Nettoyer les ressources

Sautez cette section si vous prévoyez d’exécuter d’autres tutoriels Azure Machine Learning.

Si vous n’avez pas l’intention d’utiliser les ressources que vous avez créées, supprimez-les pour éviter des frais.

Dans le portail Azure, sélectionnez Groupes de ressources tout à gauche.
À partir de la liste, sélectionnez le groupe de ressources créé.
Sélectionnez Supprimer le groupe de ressources.
Entrez le nom du groupe de ressources. Puis sélectionnez Supprimer.

Vous pouvez également conserver le groupe de ressources mais supprimer un espace de travail unique. Affichez les propriétés de l’espace de travail, puis sélectionnez Supprimer.

Étapes suivantes

Dans ce tutoriel sur le machine learning automatisé, vous avez effectué les tâches suivantes :

Configuration d’un espace de travail et préparation des données pour une expérience
Entraînement d’un modèle de détection d’objet automatisé
Spécification des valeurs d’hyperparamètres pour votre modèle
Balayage hyperparamétrique
Déploiement de votre modèle
Visualisation des détections

Apprenez-en davantage sur la vision par ordinateur en ML automatisé.
Découvrez comment configurer AutoML pour entraîner des modèles de vision par ordinateur avec Python.
Découvrez comment configurer l’apprentissage incrémentiel sur les modèles de vision par ordinateur.
Découvrez les hyperparamètres disponibles pour les tâches de vision par ordinateur.
Exemples de code :
- Azure CLI
- Kit de développement logiciel (SDK) Python
S’APPLIQUE À :Extension ml Azure CLI v2 (actuelle)
- Passez en revue les exemples de code détaillé et les cas d’usage disponibles dans le référentiel azureml-examples d’exemples de Machine Learning automatisé. Vérifiez les dossiers avec le préfixe « cli-automl-image- » pour obtenir des exemples propres à la création de modèles de vision par ordinateur.
S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)
- Passez en revue les exemples de code détaillé et les cas d’usage disponibles dans le dépôt GitHub d’exemples de blocs-notes pour le Machine Learning automatisé. Vérifiez les dossiers avec le préfixe « automl-image- » pour obtenir des exemples propres à la création de modèles de vision par ordinateur.

Notes

L’utilisation du jeu de données des objets réfrigérants est disponible sous la licence MIT.

Tutoriel : Entraîner un modèle de détection d’objet avec AutoML et Python

Prérequis

Configuration de la cible de calcul

Configuration de l’expérience

Visualiser les données d’entrée

Charger des données et créer MLTable

Configurer votre expérience de détection d’objet

Balayage automatique des hyperparamètres pour les tâches d’image (Mode automatique)

Balayage manuel des hyperparamètres pour les tâches d’image

Limites du travail

Inscrire et déployer un modèle

Obtenir le meilleur essai

Inscrire le modèle

Configurer le point de terminaison en ligne

Créer le point de terminaison

Configurer le déploiement en ligne

Créer le déploiement

Mettre à jour le trafic :

test du déploiement

Visualiser les détections

Nettoyer les ressources

Étapes suivantes

Ressources supplémentaires