MLflow 가이드

MLflow는 엔드투엔드 기계 학습 수명 주기를 관리하기 위한 오픈 소스 플랫폼입니다. 다음과 같은 기본 구성 요소가 있습니다.

  • 추적: 매개 변수와 결과를 기록하고 비교하는 실험을 추적할 수 있습니다.
  • 모델: 다양한 모델 서비스 및 유추 플랫폼에 다양한 ML 라이브러리의 모델을 관리하고 배포할 수 있습니다.
  • 프로젝트: 다른 데이터 과학자와 공유하거나 프로덕션으로 전송하기 위해 재사용 및 재현 가능한 형식으로 ML 코드를 패키지할 수 있습니다.
  • 모델 레지스트리: 모델의 전체 수명 주기 단계 전환(준비에서 프로덕션으로, 버전 지정 및 주석 기능 포함)을 관리하기 위해 모델 저장소를 중앙 집중화할 수 있습니다.
  • 모델 서비스 제공: MLflow 모델을 REST 엔드포인트로 호스트할 수 있습니다.

MLflow는 Java , Python, RREST API를 지원합니다.

Azure Databricks는 엔터프라이즈 보안 기능, 고가용성 및 기타 Azure Databricks 작업 영역 기능(예: 실험 및 실행 관리와 Notebook 개정 캡쳐)과 통합된 완전 관리형 MLflow의 호스팅된 버전을 제공합니다. Azure Databricks의 MLflow는 기계 학습 모델 학습 실행의 추적 및 보안, 기계 학습 프로젝트의 실행을 위한 통합 환경을 제공합니다.

MLflow 데이터는 플랫폼 관리형 키를 사용하여 Azure Databricks에 의해 암호화됩니다. 관리 서비스에 대해 고객 관리형 키 사용을 사용하는 암호화는 지원되지 않습니다.

처음에는 기본적인 MLflow 추적 API를 보여주는 빠른 시작으로 시작해야 합니다. 후속 문서에서는 Notebook 예제를 사용하여 각 MLflow 구성 요소를 소개하고, 이러한 구성 요소가 Azure Databricks 내에서 호스팅되는 방법을 설명합니다.