Trenowanie modeli uczenia maszynowego za pomocą usługi AKS

Blob Storage
Container Registry
Kubernetes Service

Pomysł rozwiązania Solution Idea

Jeśli chcesz się dowiedzieć, Rozszerz ten artykuł, aby uzyskać więcej informacji, szczegóły dotyczące implementacji, wskazówki dotyczące cen lub przykłady kodu, powiadom nas o opinii usługi GitHub.If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Szkolenie modeli przy użyciu dużych zestawów danych to zadanie złożone i intensywnie obciążające zasoby.Training of models using large datasets is a complex and resource intensive task. Korzystaj ze znanych narzędzi, takich jak TensorFlow i Kubeflow, aby uprościć szkolenia modeli Machine Learning.Use familiar tools such as TensorFlow and Kubeflow to simplify training of Machine Learning models. Modele sieci są uruchamiane w klastrach AKS, które są obsługiwane przez maszyny wirtualne obsługujące procesor GPU.Your ML models will run in AKS clusters backed by GPU enabled VMs.

ArchitekturaArchitecture

Diagram architektury Pobiera plik SVG z tej architektury.Architecture diagram Download an SVG of this architecture.

Przepływ danychData Flow

  1. Model ML modelu w kontenerze i publikowanie w usłudze ACRPackage ML model into a container and publish to ACR
  2. Usługa Azure Blob Storage obsługuje zestawy danych szkoleniowych i model szkolonyAzure Blob storage hosts training data sets and trained model
  3. Użyj Kubeflow do wdrożenia zadania szkoleniowego do AKS, rozproszonego zadania szkoleniowego do AKS zawiera serwery parametrów i węzły procesów roboczychUse Kubeflow to deploy training job to AKS, distributed training job to AKS includes Parameter servers and Worker nodes
  4. Obsługuj model produkcyjny za pomocą Kubeflow, promując spójne środowisko dla testów, kontroli i produkcjiServe production model using Kubeflow, promoting a consistent environment across test, control and production
  5. AKS obsługuje maszynę wirtualną z obsługą procesora GPUAKS supports GPU enabled VM
  6. Deweloperzy mogą tworzyć funkcje wysyłające zapytania do modelu działającego w klastrze AKSDeveloper can build features querying the model running in AKS cluster