Share via


Migrer un jeu de données Studio (classique) vers Azure Machine Learning

Important

La prise en charge d’Azure Machine Learning Studio (classique) prendra fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

Depuis le 1er décembre 2021, vous ne pouvez plus créer de nouvelles ressources Machine Learning Studio (classique) (espace de travail et plan de service Web). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les expériences et les services Web Machine Learning Studio (classiques) existants. Pour plus d’informations, consultez l’article suivant :

La documentation de Machine Learning Studio (classique) est en cours de retrait et pourrait ne pas être mise à jour à l’avenir.

Dans cet article, vous allez apprendre à migrer un jeu de données Studio (classique) vers Azure Machine Learning. Pour plus d’informations sur la migration à partir de Studio (classique), consultez l’article de présentation sur la migration.

Vous avez le choix entre trois options pour migrer un jeu de données vers Azure Machine Learning. Lisez chaque section pour déterminer l’option qui convient le mieux à votre scénario.

Où sont les données ? Option de migration
Dans Studio (classique) Option 1 : Téléchargez le jeu de données à partir de Studio (classique) et chargez-le dans Azure Machine Learning.
Stockage cloud Option 2 : Inscrivez un jeu de données à partir d’une source cloud.

Option 3 : Utilisez le module Importer des données pour obtenir des données à partir d’une source cloud.

Notes

Azure Machine Learning prend également en charge les workflows de type « Code First » pour la création et la gestion des jeux de données.

Prérequis

Télécharger le jeu de données à partir de Studio (classique)

La façon la plus simple de migrer un jeu de données Studio (classique) vers Azure Machine Learning consiste à télécharger votre jeu de données et à l’inscrire dans Azure Machine Learning. Cela crée une nouvelle copie de votre jeu de données et le charge dans un magasin de données d’Azure Machine Learning.

Vous pouvez télécharger directement les types de jeux de données Studio (classique) suivants.

  • Texte brut (.txt)
  • Comma-separated values (CSV) avec un en-tête (.csv) ou sans (. nh.csv)
  • Tab-separated values (TSV) avec un en-tête (.tsv) ou sans (. nh.tsv)
  • Fichier Excel
  • Fichier zip (.zip)

Pour télécharger des jeux de données directement :

  1. Accédez à votre espace de travail Studio (classique) [https://studio.azureml.net].

  2. Dans la barre de navigation de gauche, sélectionnez l’onglet Jeux de données.

  3. Sélectionnez le ou les jeux de données que vous souhaitez télécharger.

  4. Dans la barre d’action inférieure, sélectionnez Télécharger.

    AScreenshot showing how to download a dataset in Studio (classic).

Pour les types de données suivants, vous devez utiliser le module Convertir au format CSV pour télécharger des jeux de données.

  • Données SVMLight (.svmlight)
  • Données Attribute Relation File Format [ARFF] (.arff)
  • Fichier d’espace de travail ou d’objet R (.RData)
  • Type de jeu de données (.data). Le type du jeu de données est le type de données internes Studio (classique) pour la sortie du module.

Pour convertir votre jeu de données en CSV et télécharger les résultats :

  1. Accédez à votre espace de travail Studio (classique) [https://studio.azureml.net].

  2. Création d'une nouvelle expérience.

  3. Faites glisser et déposez le jeu de données que vous souhaitez télécharger sur le canevas.

  4. Ajoutez un module Convertir au format CSV.

  5. Connectez le port d’entrée du module Convertir au format CSV au port de sortie de votre jeu de données.

  6. Exécutez l’expérience.

  7. Cliquez avec le bouton droit sur le module Convertir au format CSV.

  8. Sélectionnez Jeu de données des résultats>Télécharger.

    Screenshot showing how to setup a convert to CSV pipeline.

Charger votre jeu de données sur Azure Machine Learning

Après avoir téléchargé le fichier de données, vous pouvez l’inscrire en tant que ressource de données dans Azure Machine Learning :

  1. Accédez à Azure Machine Learning Studio

  2. Sous Ressources dans le volet de navigation gauche, sélectionnez Données. Sous l’onglet Ressources de données, sélectionnez Créer Screenshot highlights Create in the Data assets tab.

  3. Attribuez un nom et une description facultative à votre ressource de données. Sélectionnez ensuite l’option Tabulaire sous Type, dans la section Types de jeux de données de la liste déroulante.

    Notes

    Vous pouvez également charger des fichiers ZIP en tant que ressources de données. Pour charger un fichier ZIP, sélectionnez Fichier pour Type, dans la section Types de jeux de données de la liste déroulante. Screenshot shows data asset source choices.

  4. Pour la source de données, sélectionnez l’option « À partir de fichiers locaux » pour charger votre jeu de données.

  5. Pour la sélection de fichiers, commencez par choisir l’emplacement où vous souhaitez que vos données soient stockées dans Azure. Vous allez sélectionner un magasin de données Azure Machine Learning. Pour plus d’informations sur les magasins de données, consultez Se connecter aux services de stockage. Ensuite, chargez le jeu de données que vous avez téléchargé précédemment.

  6. Suivez les étapes pour définir les paramètres d’analyse des données et le schéma de votre ressource de données.

  7. Une fois que vous avez atteint l’étape Révision, cliquez sur Créer sur la dernière page.

Importer des données à partir de sources cloud

Si vos données se trouvent déjà dans un service de stockage cloud et que vous souhaitez conserver vos données à leur emplacement d’origine, vous pouvez utiliser l’une des options suivantes :

Méthode d’ingestion Description
Inscrire un jeu de données Azure Machine Learning Ingérer des données à partir de sources de données locales et en ligne (Blob, ADLS Gen1, ADLS Gen2, Partage de fichiers, Base de données SQL).

Crée une référence à la source de données, qui est évaluée tardivement au moment de l’exécution. Utilisez cette option si vous accédez à ce jeu de données à plusieurs reprises et que vous souhaitez activer des fonctionnalités avancées de données, telles que le contrôle de version et la surveillance des données.
Module Importer des données Ingérer des données à partir de sources de données en ligne (Blob, ADLS Gen1, ADLS Gen2, Partage de fichiers, Base de données SQL).

Le jeu de données est importé uniquement dans l’exécution du pipeline du concepteur en cours.

Notes

Les utilisateurs de Studio (classique) doivent noter que les sources cloud suivantes ne sont pas prises en charge en mode natif dans Azure Machine Learning :

  • Requête Hive
  • table Azure
  • Azure Cosmos DB
  • Base de données SQL locale

Nous recommandons aux utilisateurs de migrer leurs données vers des services de stockage pris en charge à l’aide d’Azure Data Factory.

Inscrire un jeu de données Azure Machine Learning

Procédez comme suit pour inscrire un jeu de données à Azure Machine Learning à partir d’un service cloud :

  1. Créez un magasin de données qui relie le service de stockage cloud à votre espace de travail Azure Machine Learning.

  2. Inscrivez un jeu de données. Si vous migrez un jeu de données Studio (classique), sélectionnez le paramètre de jeu de données Tabulaire.

Une fois que vous avez inscrit un jeu de données dans Azure Machine Learning, vous pouvez l’utiliser dans le concepteur :

  1. Créez un brouillon de pipeline de concepteur.
  2. Dans la palette du module à gauche, développez la section Jeux de données.
  3. Faites glisser votre jeu de données inscrit sur le canevas.

Utiliser le module Importer des données

Pour importer des données directement dans votre pipeline du concepteur, procédez comme suit :

  1. Créez un magasin de données qui relie le service de stockage cloud à votre espace de travail Azure Machine Learning.

Une fois que vous avez créé le magasin de données, vous pouvez utiliser le module Importer des données dans le concepteur pour ingérer des données à partir de celui-ci :

  1. Créez un brouillon de pipeline de concepteur.
  2. Dans la palette du module à gauche, recherchez le module Importer des données et faites-le glisser dans le canevas.
  3. Sélectionnez le module Importer des données et utilisez les paramètres dans le volet droit pour configurer votre source de données.

Étapes suivantes

Dans cet article, vous avez appris à migrer un jeu de données Studio (classique) vers Azure Machine Learning. L’étape suivante consiste à reconstruire un pipeline de formation Studio (classique).

Consultez les autres articles de la série sur la migration Studio (classique) :

  1. Vue d’ensemble de la migration.
  2. Migrer des jeux de données.
  3. Reconstruire un pipeline de formation Studio (classique).
  4. Reconstruire un service web Studio (classique).
  5. Intégrer un service web Azure Machine Learning à des applications clientes.
  6. Migrer Exécuter un script R.