Training von Machine Learning-Modellen mit AKS

Blob Storage
Container Registry
Kubernetes-Dienst

Lösungsidee Solution Idea

Wenn Sie möchten, dass wir diesen Artikel durch weitere Informationen, Implementierungsdetails, Preisinformationen oder Codebeispiele ergänzen, kontaktieren Sie uns über GitHub-Feedback.If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Das Trainieren von Modellen mit großen Datasets ist eine komplexe und ressourcenintensive Aufgabe.Training of models using large datasets is a complex and resource intensive task. Verwenden Sie vertraute Tools wie TensorFlow und Kubeflow, um das Training von Machine Learning-Modellen zu vereinfachen.Use familiar tools such as TensorFlow and Kubeflow to simplify training of Machine Learning models. Ihre ML-Modelle werden in AKS-Clustern ausgeführt, die von GPU-fähigen virtuellen Computern unterstützt werden.Your ML models will run in AKS clusters backed by GPU enabled VMs.

AufbauArchitecture

Architekturdiagramm Laden Sie eine SVG-Datei für diese Architektur herunter.Architecture diagram Download an SVG of this architecture.

DatenflussData Flow

  1. Packen Sie das ML-Modell in einen Container, und veröffentlichen Sie es in ACR.Package ML model into a container and publish to ACR
  2. Azure Blob Storage hostet Trainingsdatasets und das trainierte Modell.Azure Blob storage hosts training data sets and trained model
  3. Verwenden Sie Kubeflow zum Bereitstellen eines Trainingsauftrags in AKS. Der in AKS bereitgestellte Trainingsauftrag enthält Parameterserver und Workerknoten.Use Kubeflow to deploy training job to AKS, distributed training job to AKS includes Parameter servers and Worker nodes
  4. Stellen Sie das Produktionsmodell mithilfe von Kubeflow bereit, mit einer konsistenten für Tests, Kontrolle und Produktion konsistenten Umgebung.Serve production model using Kubeflow, promoting a consistent environment across test, control and production
  5. AKS unterstützt GPU-fähige virtuelle Computer.AKS supports GPU enabled VM
  6. Entwickler können durch Abfragen des im AKS-Cluster ausgeführten Modells Features erstellen.Developer can build features querying the model running in AKS cluster