Installer le kit de développement logiciel (SDK) Azure Machine Learning pour Python

Cet article est un guide pour les différentes options d’installation du kit de développement logiciel (SDK).

Installation par défaut

Utilisez azureml-core.

pip install azureml-core

Installez ensuite les autres packages requis pour votre travail particulier.

Installer la mise à niveau

Conseil

Nous vous recommandons de toujours conserver azureml-Core mis à jour vers la dernière version.

Mettre à niveau une version antérieure :

pip install --upgrade azureml-core

Vérifier la version

Vérifiez la version du kit de développement logiciel :

pip show azureml-core

Pour afficher tous les packages dans votre environnement :

pip list

Vous pouvez également afficher la version du kit de développement logiciel (SDK) dans Python, mais cette version n’inclut pas la version mineure.

import azureml.core
print(azureml.core.VERSION)

Pour en savoir plus sur la configuration de votre environnement de développement pour Azure Machine Learning service, consultez Configurer votre environnement de développement.

Autres packages azureml

Le kit de développement logiciel (SDK) contient de nombreux autres packages facultatifs que vous pouvez installer. Ils incluent les dépendances qui ne sont pas requises pour tous les cas d’usage et donc pas incluses dans l’installation par défaut afin d’éviter d’encombrer l’environnement. Le tableau suivant présente certains de ces packages facultatifs et leurs cas d’utilisation.

 Package supplémentaire  Cas d’utilisation
azureml-accel-models Accélère les réseaux neuronaux profonds sur des FPGA avec le service Azure ML Modèles accélérés matériellement.
azureml-train-automl Fournit des classes pour la génération et l’exécution d’expériences de Machine Learning automatisé. Installe également les packages communs de science des données, notamment pandas , numpy et scikit-learn . Installez azureml-train-automl .

Si vous envisagez d’envoyer des séries de MILLILITREs automatisées sur un calcul distant et que vous n’avez pas besoin d’effectuer d’autres tâches localement, nous vous recommandons d’utiliser le client léger, azureml-train-automl-client , le package qui fait partie de l' azureml-sdk installation par défaut.

Pour plus d' informations sur l’utilisation du automl Kit de développement logiciel (SDK) complet ou de son client léger, consultez le Guide d’utilisation supplémentaire azureml-train-automl-client .
azureml-contrib Installe les packages azureml-contrib-*, qui incluent des fonctionnalités expérimentales ou des fonctionnalités en préversion.
azureml-datadrift Contient des fonctionnalités permettant de détecter si les données d’entraînement du modèle ont dérivé de ses données de scoring.
azureml-interpret Utilisé pour l’interprétation du modèle, y compris l’importance des fonctionnalités et des classes pour les modèles BlackBox et Whitebox.
azureml-widgets Prend en charge les widgets interactifs dans un environnement du notebook Jupyter. Cette installation n’est pas nécessaire si vous n’exécutez pas dans un notebook Jupyter (par exemple, si vous générez dans PyCharm) ou si vous n’avez pas besoin de widgets activés.
azureml-contrib-services Fournit des fonctionnalités pour les scripts de score pour demander un accès HTTP brut.
azureml-tensorboard Fournit des classes et des méthodes pour l’exportation de l’historique des exécutions d’expérience et le lancement de TensorBoard pour visualiser les performances et la structure des expérimentations.

Pour obtenir la liste complète des packages disponibles, consultez AzureML sur Pypi.

Conseils supplémentaires de cas d’utilisation

Si votre cas d’utilisation est décrit ci-dessous, notez les conseils et les actions suggérées.

Cas d’utilisation Assistance
À automl  Installez le azureml-train-automl Kit de développement logiciel (SDK) complet dans un nouvel environnement python 64 bits. Un nouvel environnement 64 bits est requis en raison d’une dépendance sur l’infrastructure LightGBM . Ce package installe et épingle des versions spécifiques des packages de science des données à des fins de compatibilité, ce qui nécessite un environnement propre.

Le package client léger, azureml-train-automl-client , n’installe pas de packages de science des données supplémentaires ou nécessite un environnement python propre. Nous vous recommandons de azureml-train-automl-client soumettre uniquement des exécutions de ml automatisées à un calcul distant, et de ne pas avoir à envoyer des exécutions locales ou de télécharger votre modèle localement.
Utilisation d’Azure Databricks Dans l’environnement Azure Databricks, utilisez les sources de bibliothèque détaillées dans ce guide pour l’installation du kit de développement logiciel (SDK). Consultez également ces conseils pour plus d’informations sur l’utilisation du kit de développement logiciel (SDK) Azure Machine Learning pour Python sur Azure Databricks.
Utilisation d’Azure Data Science Virtual Machine Le kit SDK Python est préinstallé sur les machines Azure DSVM créées après le 27 septembre 2018.
Exécution des tutoriels ou notebooks Azure Machine Learning Si vous utilisez une version du kit de développement logiciel (SDK) antérieure à celle mentionnée dans le didacticiel ou le notebook, vous devez mettre à niveau votre kit de développement logiciel (SDK). Certaines fonctionnalités des didacticiels et des notebooks peuvent nécessiter des packages Python supplémentaires, tels que matplotlib,scikit-learn ou pandas. Les instructions de chaque didacticiel et notebook vous indiquent les packages requis.

Dépannage

  • Installation de pip : il n’est pas garanti que les dépendances soient cohérentes avec l’installation monoligne :

    Il s’agit d’une limitation connue de pip, car il ne dispose pas d’un outil de résolution des dépendances fonctionnel lorsque vous effectuez une installation à partir d’une ligne unique. La première dépendance unique est la seule qu’il examine.

    Dans le code suivant, azureml-datadrift et azureml-train-automl sont tous deux installés à l’aide d’une installation pip monoligne.

      pip install azureml-datadrift, azureml-train-automl
    

    Pour cet exemple, supposons que azureml-datadrift nécessite une version supérieure à 1.0 et que azureml-train-automl nécessite une version inférieure à 1.2. Si la dernière version de azureml-datadrift est 1.3, les deux packages sont mis à niveau vers la version 1.3, indépendamment de la nécessité d’une version antérieure pour le package azureml-train-automl.

    Pour vous assurer que les versions appropriées sont installées pour vos packages, installez-les en utilisant plusieurs lignes de commande comme dans le code suivant. L’ordre n’est pas un problème ici, puisque pip passe explicitement à une version antérieure dans le cadre de l’appel de ligne suivant. Ainsi, les dépendances de version appropriées sont appliquées.

       pip install azureml-datadrift
       pip install azureml-train-automl 
    
  • L’installation du package d’explication n’est pas garantie durant l’installation de azureml-train-automl-client :

    Durant une exécution AutoML distante avec activation des explications du modèle, vous verrez le message d’erreur « Installez le package azureml-explain-model pour les explications du modèle. » Il s'agit d'un problème connu. Pour contourner ce problème, suivez l’une des étapes ci-dessous :

    1. Installez azureml-explain-model en local.
        pip install azureml-explain-model
    
    1. Désactivez entièrement la fonctionnalité d’explicabilité en passant model_explainability=False dans la configuration AutoML.
        automl_config = AutoMLConfig(task = 'classification',
                               path = '.',
                               debug_log = 'automated_ml_errors.log',
                               compute_target = compute_target,
                               run_configuration = aml_run_config,
                               featurization = 'auto',
                               model_explainability=False,
                               training_data = prepped_data,
                               label_column_name = 'Survived',
                               **automl_settings)
    
  • Erreurs Panda : généralement visibles pendant l’expérience AutoML :

    Quand vous configurez manuellement votre environnement à l’aide de PIP, vous pouvez remarquer des erreurs (en particulier de pandas) en raison de l’installation de versions de packages non prises en charge.

    Par exemple : ModuleNotFoundError: No module named 'pandas.core.internals.managers'; 'pandas.core.internals' is not a package

    Pour éviter ce type d’erreur, installez le Kit de développement logiciel (SDK) AutoML à l’aide de la commande automl_setup.cmd :

    1. Ouvrez une invite Anaconda et clonez le référentiel GitHub pour un ensemble d’exemples de notebooks.
    git clone https://github.com/Azure/MachineLearningNotebooks.git
    
    1. Accédez au dossier how-to-use-azureml/automated-machine-learning où les exemples de notebooks ont été extraits, puis exécutez :
    automl_setup
    
  • KeyError: « brand » lors de l’exécution d’AutoML sur une capacité de calcul locale ou dans un cluster Azure Databricks

    Si un nouvel environnement a été créé après le 10 juin 2020 à l’aide du kit de développement logiciel (SDK) 1.7.0 ou version antérieure, la formation peut échouer avec cette erreur en raison d’une mise à jour dans le package py-cpuinfo. (Les environnements créés jusqu’au 10 juin 2020 inclus ne sont pas affectés, tout comme les expériences exécutées sur une capacité de calcul distante, car des images de formation mises en cache sont utilisées.) Pour contourner ce problème, prenez l’une des deux mesures suivantes :

    • Mettez à jour la version du kit de développement logiciel (SDK) vers 1.8.0 ou une version ultérieure (py-cpuinfo revient alors à la version antérieure, soit 5.0.0) :

      pip install --upgrade azureml-sdk[automl]
      
    • Passez à la version antérieure de py-cpuinfo, soit 5.0.0 :

      pip install py-cpuinfo==5.0.0
      
  • Message d’erreur : Impossible de désinstaller « PyYAML »

    Kit SDK Azure Machine Learning pour Python : PyYAML est un projet installé distutils. Par conséquent, nous ne pouvons pas déterminer avec précision les fichiers qui lui appartiennent en cas de désinstallation partielle. Pour poursuivre l’installation du kit de développement logiciel (SDK) en ignorant cette erreur, utilisez :

    pip install --upgrade azureml-sdk[notebooks,automl] --ignore-installed PyYAML
    
  • Échec de l’installation du SDK Azure Machine Learning avec une exception : ModuleNotFoundError : Absence du module nommé « ruamel »ou « ImportError » : Absence du module nommé « ruamel.yaml »

    Ce problème se produit pendant l’installation du SDK Azure Machine Learning pour Python sur le pip le plus récent (>20.1.1) dans l’environnement de base conda pour toutes les versions publiées du SDK Azure Machine Learning pour Python. Reportez-vous aux solutions de contournement suivantes :

    • Évitez d’installer le SDK Python dans l’environnement de base conda. Créez plutôt votre environnement conda et installez le SDK dans cet environnement utilisateur nouvellement créé. Le pip le plus récent devrait fonctionner dans ce nouvel environnement conda.

    • Pour créer des images dans docker, où vous ne pouvez pas quitter l’environnement de base conda, épinglez le pip <=20.1.1 dans le fichier docker.

    conda install -c r -y conda python=3.6.2 pip=20.1.1
    

Étapes suivantes

Essayez de suivre les étapes suivantes pour savoir comment utiliser le kit de développement logiciel (SDK) Azure Machine Learning service pour Python :

  1. Lisez la présentation pour en savoir plus sur les classes de clé et les modèles de conception avec des exemples de code.
  2. Suivez ce tutoriel pour commencer à créer des expériences et des modèles.