Kubeflow를 사용하여 AKS에 기계 학습 모델 배포

Blob Storage
Container Registry
Kubernetes Service

솔루션 아이디어

잠재적인 사용 사례, 대체 서비스, 구현 고려 사항 또는 가격 책정 지침과 같은 추가 정보를 사용하여 이 문서를 확장하려는 경우 GitHub 피드백을통해 알려주세요!

이 솔루션 개념은 AKS(Azure Kubernetes Service)에대한 실시간 유추에 관한 것입니다.

잠재적인 사용 사례

기계 학습 모델의 대규모 프로덕션 배포가 필요한 경우 AKS를 사용합니다. 대규모는 빠른 응답 시간, 배포된 서비스의 자동 크기 조정 및 로깅과 같은 기능을 의미합니다. 자세한 내용은 Azure Kubernetes Service 클러스터에 모델 배포를 참조하세요.

이 솔루션에서 Kubeflow는 AKS에 대한 배포를 관리하는 데 사용됩니다. ML 모델은 GPU 지원 VM에서 지원하는 AKS 클러스터에서 실행됩니다.

아키텍처

아키텍처 다이어그램: AKS(Azure Kubernetes Services)에 기계 학습 모델 배포아키텍처의 SVG를 다운로드합니다.

데이터 흐름

  1. ML(기계 학습) 모델을 컨테이너에 패키지하고 ACR(Azure Container Registry)에 게시합니다.
  2. Azure Blob Storage는 학습 데이터 집합 및 학습된 모델을 호스트합니다.
  3. Kubeflow를 사용하여 AKS(Azure Kubernetes Services)에 학습 작업 배포 AKS에 분산 학습 작업에는 매개 변수 서버 및 작업자 노드가 포함됩니다.
  4. Kubeflow를 사용하여 프로덕션 모델을 제공하고 테스트, 제어 및 프로덕션에서 일관된 환경을 촉진합니다.
  5. AKS는 GPU 사용 VM을 지원합니다.
  6. 개발자는 AKS 클러스터에서 실행되는 모델을 쿼리하는 기능을 빌드합니다.

구성 요소

다음 단계

제품 설명서를 읽습니다.

다른 아키텍처 센터 문서를 참조하세요.