Tutoriel : Bien démarrer avec Azure Machine Learning dans votre environnement de développement (partie 1 sur 4)Tutorial: Get started with Azure Machine Learning in your development environment (part 1 of 4)

Dans cette série de tutoriels en quatre parties, vous allez découvrir les notions de base d’Azure Machine Learning et effectuer des tâches de machine learning Python basées sur des travaux, sur la plateforme cloud Azure.In this four-part tutorial series, you'll learn the fundamentals of Azure Machine Learning and complete jobs-based Python machine learning tasks on the Azure cloud platform.

Dans la partie 1 de cette série de didacticiels, vous allez :In part 1 of this tutorial series, you will:

  • Installer le SDK Azure Machine Learning.Install the Azure Machine Learning SDK.
  • Configurer la structure de répertoires pour le code.Set up the directory structure for code.
  • Créez un espace de travail Machine Learning.Create an Azure Machine Learning workspace.
  • Configurer votre environnement de développement local.Configure your local development environment.
  • Configurer un cluster de calcul.Set up a compute cluster.

Notes

Cette série de tutoriels porte sur les concepts Azure Machine Learning nécessaires pour soumettre des programmes de traitement par lots : c’est là que le code est soumis au cloud pour s’exécuter en arrière-plan sans aucune intervention de l’utilisateur.This tutorial series focuses on the Azure Machine Learning concepts required to submit batch jobs - this is where the code is submitted to the cloud to run in the background without any user interaction. Ces concepts s’avèrent utiles pour les scripts ou le code terminés que vous voulez exécuter à plusieurs reprises, ou bien pour les tâches de Machine Learning gourmandes en calcul.This is useful for finished scripts or code you wish to run repeatedly, or for compute-intensive machine learning tasks. Si vous êtes plus intéressé par un workflow exploratoire, vous pouvez utiliser à la place Jupyter ou RStudio sur une instance de calcul Azure Machine Learning.If you are more interested in an exploratory workflow, you could instead use Jupyter or RStudio on an Azure Machine Learning compute instance.

PrérequisPrerequisites

Installer le Kit de développement logiciel (SDK) Azure Machine LearningInstall the Azure Machine Learning SDK

Tout au long de ce tutoriel, vous allez utiliser le SDK Azure Machine Learning pour Python.Throughout this tutorial, you will use the Azure Machine Learning SDK for Python. Pour éviter les problèmes de dépendance Python, vous allez créer un environnement isolé.To avoid Python dependency issues, you'll create an isolated environment. Cette série de tutoriels utilise conda pour créer cet environnement.This tutorial series uses conda to create that environment. Si vous préférez utiliser d’autres solutions, comme venv, virtualenv ou Docker, veillez à utiliser une version de Python > = 3.5 et < 3.9.If you prefer to use other solutions, such as venv, virtualenv, or docker, make sure you use a Python version >=3.5 and < 3.9.

Vérifiez si conda est installé sur votre système :Check if you have conda installed on your system:

conda --version

Si cette commande retourne une erreur conda not found, téléchargez et installez Miniconda.If this command returns a conda not found error, download and install Miniconda.

Une fois que vous avez installé Conda, utilisez un terminal ou une fenêtre d’invite Anaconda pour créer un environnement :Once you have installed Conda, use a terminal or Anaconda Prompt window to create a new environment:

conda create -n tutorial python=3.8

Ensuite, installez le SDK Azure Machine Learning dans l’environnement Conda que vous avez créé :Next, install the Azure Machine Learning SDK into the conda environment you created:

conda activate tutorial
pip install azureml-core

Notes

L’installation du SDK Azure Machine Learning prend environ 2 minutes.It takes approximately 2 minutes for the Azure Machine Learning SDK install to complete.

Si vous recevez une erreur de délai d’expiration, essayez plutôt pip install --default-timeout=100 azureml-core.If you get a timeout error, try pip install --default-timeout=100 azureml-core instead.

Créer la structure de répertoires pour le codeCreate a directory structure for code

Nous vous recommandons de configurer la structure de répertoires simple suivante pour ce tutoriel :We recommend that you set up the following simple directory structure for this tutorial:

structure de répertoires : niveau supérieur de tutoriel avec un sous-répertoire .azureml

  • tutorial : Répertoire de plus haut niveau du projet.tutorial: Top-level directory of the project.
  • .azureml : Sous-répertoire masqué pour le stockage des fichiers de configuration Azure Machine Learning..azureml: Hidden subdirectory for storing Azure Machine Learning configuration files.

Par exemple, pour créer cela dans une fenêtre Bash :For example, to create this in a bash window:

mkdir tutorial
cd tutorial
mkdir .azureml

Conseil

Pour créer ou afficher la structure dans une fenêtre graphique, vous devez d’abord activer la capacité à afficher et à créer des fichiers et des dossiers masqués :To create or view the structure in a graphical window, first enable the ability to see and create hidden files and folders:

  • Dans une fenêtre Finder Mac, utilisez Commande+Maj+.In a Mac Finder window use Command + Shift + . pour activer/désactiver l’affichage des fichiers/dossiers masqués.to toggle the display of hidden files/folders.
  • Dans un Explorateur de fichiers Windows 10, consultez le guide pratique pour afficher les fichiers et dossiers cachés.In a Windows 10 File Explorer, see how to view hidden files and folders.
  • Dans l’interface graphique Linux, utilisez Ctrl+H ou le menu Afficher, puis cochez la case Afficher les fichiers masqués.In the Linux Graphical Interface, use Ctrl + h or the View menu and check the box to Show hidden files.

Création d’un espace de travail Microsoft Azure Machine LearningCreate an Azure Machine Learning workspace

Un espace de travail est la ressource de niveau supérieur pour Azure Machine Learning et est un endroit centralisé où vous pouvez :A workspace is a top-level resource for Azure Machine Learning and is a centralized place to:

  • Gérer des ressources comme le calcul.Manage resources such as compute.
  • Stocker des ressources comme des notebooks, des environnements, des jeux de données, des pipelines, des modèles et des points de terminaison.Store assets like notebooks, environments, datasets, pipelines, models, and endpoints.
  • Collaborer avec d’autres membres de l’équipe.Collaborate with other team members.

Dans le répertoire de plus haut niveau, tutorial, ajoutez un nouveau fichier Python appelé 01-create-workspace.py en utilisant le code suivant.In the top-level directory, tutorial, add a new Python file called 01-create-workspace.py by using the following code. Adaptez les paramètres (nom, ID d’abonnement, groupe de ressources et emplacement) selon vos préférences.Adapt the parameters (name, subscription ID, resource group, and location) with your preferences.

Vous pouvez exécuter le code dans une session interactive ou sous la forme d’un fichier Python.You can run the code in an interactive session or as a Python file.

Notes

Quand vous utilisez un environnement de développement local (par exemple votre ordinateur), vous êtes invité à vous authentifier auprès de votre espace de travail en utilisant un code d’appareil la première fois que vous exécutez le code suivant.When you're using a local development environment (for example, your computer), you'll be asked to authenticate to your workspace by using a device code the first time you run the following code. Suivez les instructions à l’écran.Follow the on-screen instructions.

# tutorial/01-create-workspace.py
from azureml.core import Workspace

ws = Workspace.create(name='<my_workspace_name>', # provide a name for your workspace
                      subscription_id='<azure-subscription-id>', # provide your subscription ID
                      resource_group='<myresourcegroup>', # provide a resource group name
                      create_resource_group=True,
                      location='<NAME_OF_REGION>') # For example: 'westeurope' or 'eastus2' or 'westus2' or 'southeastasia'.

# write out the workspace details to a configuration file: .azureml/config.json
ws.write_config(path='.azureml')

Dans la fenêtre qui contient l’environnement Conda tutorial1 activé, exécutez ce code à partir du répertoire tutorial.In the window that has the activated tutorial1 conda environment, run this code from the tutorial directory.

cd <path/to/tutorial>
python ./01-create-workspace.py

Conseil

Si l’exécution de ce code génère une erreur indiquant que vous n’avez pas accès à l’abonnement, consultez Créer un espace de travail pour obtenir plus d’informations sur les options d’authentification.If running this code gives you an error that you do not have access to the subscription, see Create a workspace for information on authentication options.

Une fois que vous avez exécuté 01-create-workspace.py avec succès, votre structure de dossiers se présente comme suit :After you've successfully run 01-create-workspace.py, your folder structure will look like:

Le fichier config.json apparaît dans le sous-répertoire .azureml après l’exécution de 01-create-workspace.py

Le fichier .azureml/config.json contient les métadonnées nécessaires pour se connecter à votre espace de travail Azure Machine Learning.The file .azureml/config.json contains the metadata necessary to connect to your Azure Machine Learning workspace. Il contient en fait votre ID d’abonnement, le groupe de ressources et le nom de l’espace de travail.Namely, it contains your subscription ID, resource group, and workspace name.

Notes

Le contenu de config.json n’est pas constitué de secrets.The contents of config.json are not secrets. Cela ne pose pas de problèmes de partager ces informations.It's fine to share these details.

L’authentification est toujours requise pour interagir avec votre espace de travail Azure Machine Learning.Authentication is still required to interact with your Azure Machine Learning workspace.

Créer un cluster de calcul Azure Machine LearningCreate an Azure Machine Learning compute cluster

Créez un script Python dans le répertoire de plus haut niveau tutorial appelé 02-create-compute.py.Create a Python script in the tutorial top-level directory called 02-create-compute.py. Placez-y le code suivant pour créer un cluster de calcul Azure Machine Learning qui sera mis à l’échelle automatiquement entre zéro et quatre nœuds :Populate it with the following code to create an Azure Machine Learning compute cluster that will autoscale between zero and four nodes:

# tutorial/02-create-compute.py
from azureml.core import Workspace
from azureml.core.compute import ComputeTarget, AmlCompute
from azureml.core.compute_target import ComputeTargetException

ws = Workspace.from_config() # This automatically looks for a directory .azureml

# Choose a name for your CPU cluster
cpu_cluster_name = "cpu-cluster"

# Verify that the cluster does not exist already
try:
    cpu_cluster = ComputeTarget(workspace=ws, name=cpu_cluster_name)
    print('Found existing cluster, use it.')
except ComputeTargetException:
    compute_config = AmlCompute.provisioning_configuration(vm_size='STANDARD_D2_V2',
                                                           idle_seconds_before_scaledown=2400,
                                                           min_nodes=0,
                                                           max_nodes=4)
    cpu_cluster = ComputeTarget.create(ws, cpu_cluster_name, compute_config)

cpu_cluster.wait_for_completion(show_output=True)

Dans la fenêtre qui contient l’environnement Conda tutorial1 activé, exécutez le fichier Python :In the window that has the activated tutorial1 conda environment, run the Python file:

python ./02-create-compute.py

Notes

Quand le cluster est créé, aucun nœud n’y est provisionné.When the cluster is created, it will have 0 nodes provisioned. Le cluster n’implique aucun coût tant que vous n’avez pas soumis un travail.The cluster does not incur costs until you submit a job. Ce cluster fera l’objet d’un scale-down après 2 400 secondes (40 minutes) d’inactivité.This cluster will scale down when it has been idle for 2,400 seconds (40 minutes).

Votre structure de dossiers se présente désormais comme suit :Your folder structure will now look as follows:

Ajouter 02-create-compute.py au répertoire du tutoriel

Afficher dans le studioView in the studio

Connectez-vous au studio Azure Machine Learning pour afficher l’espace de travail et l’instance de calcul que vous avez créés.Sign in to Azure Machine Learning studio to view the workspace and compute instance you created.

  1. Sélectionnez l’abonnement que vous avez utilisé pour créer l’espace de travail.Select the Subscription you used to create the workspace.
  2. Sélectionnez l’espace de travail Machine Learning que vous avez créé, tutorial-ws.Select the Machine Learning workspace you created, tutorial-ws.
  3. Une fois que l’espace de travail est chargé, sur le côté gauche, sélectionnez Calcul.Once the workspace loads, on the left side, select Compute.
  4. En haut, sélectionnez l’onglet Clusters de calcul.At the top, select the Compute clusters tab.

Capture d’écran : Afficher l’instance de calcul dans votre espace de travail.

Cette vue montre le cluster de calcul provisionné, ainsi que le nombre de nœuds inactifs, de nœuds occupés et de nœuds non provisionnés.This view shows the provisioned compute cluster, along with the number of idle nodes, busy nodes, and unprovisioned nodes. Étant donné que vous n’avez pas encore utilisé le cluster, tous les nœuds ne sont pas provisionnés pour le moment.Since you haven't used the cluster yet, all the nodes are currently unprovisioned.

Étapes suivantesNext steps

Dans ce tutoriel de configuration, vous avez :In this setup tutorial, you have:

  • Créé un espace de travail Azure Machine LearningCreated an Azure Machine Learning workspace.
  • Configuré votre environnement de développement local.Set up your local development environment.
  • Créé un cluster de calcul Azure Machine Learning.Created an Azure Machine Learning compute cluster.

Dans les autres sections de ce tutoriel, vous allez apprendre à :In the other parts of this tutorial you will learn:

  • Partie 2.Part 2. Exécuter du code dans le cloud en utilisant le SDK Azure Machine Learning pour Python.Run code in the cloud by using the Azure Machine Learning SDK for Python.
  • Partie 3.Part 3. Gérer l’environnement Python que vous utilisez pour entraîner le modèle.Manage the Python environment that you use for model training.
  • Partie 4.Part 4. Charger des données dans Azure et les utiliser dans la formation.Upload data to Azure and consume that data in training.

Continuez avec le tutoriel suivant pour découvrir comment envoyer un script au cluster de calcul Azure Machine Learning.Continue to the next tutorial, to walk through submitting a script to the Azure Machine Learning compute cluster.