Entraînement de modèles Machine Learning avec AKS

Stockage Blob
Container Registry
Kubernetes Service

Idée de solution Solution Idea

Si vous souhaitez nous voir développer cet article avec d’autres informations, les détails de l’implémentation, le guide de tarification ou des exemples de code, faites-le-nous savoir avec les Commentaires de GitHub !If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

L’apprentissage de modèles à l’aide de jeux de données volumineux est une tâche complexe et gourmande en ressources.Training of models using large datasets is a complex and resource intensive task. Utilisez des outils familiers tels que TensorFlow et Kubeflow pour simplifier la formation de vos modèles Machine Learning.Use familiar tools such as TensorFlow and Kubeflow to simplify training of Machine Learning models. Vos modèles ML s’exécuteront dans des clusters AKS avec des machines virtuelles compatibles avec les processeurs GPU.Your ML models will run in AKS clusters backed by GPU enabled VMs.

ArchitectureArchitecture

Diagramme d’architecture Télécharger un SVG de cette architecture.Architecture diagram Download an SVG of this architecture.

Data FlowData Flow

  1. Créez un package de modèle ML pour un conteneur et le publier sur ACR.Package ML model into a container and publish to ACR
  2. Le service Stockage Blob Azure héberge les jeux de données d’apprentissage et un modèle formé.Azure Blob storage hosts training data sets and trained model
  3. Utilisez Kubeflow pour déployer le travail d’apprentissage sur AKS. La tâche d’apprentissage distribuée à AKS comprend des serveurs de paramètres et des nœuds Worker.Use Kubeflow to deploy training job to AKS, distributed training job to AKS includes Parameter servers and Worker nodes
  4. Traitez le modèle de production à l’aide de Kubeflow, en promouvant un environnement cohérent entre le test, le contrôle et la production.Serve production model using Kubeflow, promoting a consistent environment across test, control and production
  5. AKS prend en charge les machines virtuelles compatibles avec le processeur GPU.AKS supports GPU enabled VM
  6. Le développeur peut créer des fonctionnalités qui interrogent le modèle s’exécutant dans le cluster AKS.Developer can build features querying the model running in AKS cluster