MLflow 실험을 사용하여 학습 실행 구성

실험은 모델 학습 실행을 위한 조직의 단위입니다. 실험에는 작업 영역과 Notebook의 두 가지 유형이 있습니다.

  • Databricks Machine Learning UI 또는 MLflow API에서 작업 영역 실험을 만들 수 있습니다. 작업 영역 실험은 Notebook과 연결되어 있지 않으며 모든 Notebook은 실험 ID 또는 실험 이름을 사용하여 이러한 실험에 대한 실행을 기록할 수 있습니다.
  • Notebook 실험은 특정 Notebook과 연결되어 있습니다. Azure Databricks는 mlflow.start_run()을 사용하여 실행을 시작할 때 활성 실험이 없는 경우 Notebook 실험을 자동으로 만듭니다.

액세스할 수 있는 작업 영역의 모든 실험을 보려면 사이드바에서 Machine Learning > 실험을 선택합니다.

실험 페이지

작업 영역 실험 만들기

이 섹션에서는 Azure Databricks UI를 사용하여 작업 영역 실험을 만드는 방법을 설명합니다. 작업 영역에서 또는 실험 페이지에서 직접 작업 영역 실험을 만들 수 있습니다.

MLflow API 또는 Databricks Terraform 공급자databricks_mlflow_experiment와 함께 사용할 수도 있습니다.

작업 영역 실험에 대한 실행 로깅에 대한 지침은 로깅 예제 Notebook을 참조하세요.

  1. 사이드바에서 작업 영역을 클릭합니다작업 영역 아이콘.

  2. 실험을 만들 폴더로 이동합니다.

  3. 폴더를 마우스 오른쪽 단추로 클릭하고 MLflow 실험 만들기 > 를 선택합니다.

  4. MLflow 실험 만들기 대화 상자에서 실험 이름과 아티팩트 위치(선택 사항)를 입력합니다. 아티팩트 위치를 지정하지 않으면 아티팩트가 dbfs:/databricks/mlflow-tracking/<experiment-id>에 저장됩니다.

    Azure Databricks는 DBFS 및 Azure Blob Storage 아티팩트 위치를 지원합니다.

    Azure Blob Storage에 아티팩트를 저장하려면 wasbs://<container>@<storage-account>.blob.core.windows.net/<path> 형식의 URI를 지정합니다. Azure Blob Storage에 저장된 아티팩트는 MLflow UI에 표시되지 않습니다. Blob Storage 클라이언트를 사용하여 다운로드해야 합니다.

    참고 항목

    DBFS 이외의 위치에 아티팩트를 저장하면 MLflow UI에 아티팩트가 표시되지 않습니다. DBFS 이외의 위치에 저장된 모델은 모델 레지스트리에 등록할 수 없습니다.

  5. 만들기를 클릭합니다. 빈 실험이 나타납니다.

실험 페이지에서 새 작업 영역 실험을 만들 수도 있습니다. 새 실험을 만들려면 드롭다운 메뉴를 사용합니다 실험 만들기 드롭다운 . 드롭다운 메뉴에서 AutoML 실험 또는 빈 실험을 선택할 수 있습니다.

  • AutoML 실험. AutoML 실험 구성 페이지가 표시됩니다. AutoML 사용에 대한 자세한 내용은 Azure Databricks AutoML UI를 사용하여 ML 모델 학습을 참조하세요.

  • 빈 실험. MLflow 실험 만들기 대화 상자가 나타납니다. 대화 상자에 이름 및 선택적 아티팩트 위치를 입력하여 새 작업 영역 실험을 만듭니다. 기본 아티팩트 위치는 dbfs:/databricks/mlflow-tracking/<experiment-id>입니다.

    이 실험에 대한 실행을 기록하려면 실험 경로와 함께 mlflow.set_experiment()를 호출합니다. 실험 경로는 실험 페이지 상단에 나타납니다. 자세한 내용과 예제 Notebook는 로깅 예제 Notebook을 참조하세요.

Notebook 실험 만들기

Notebook에서 mlflow.start_run() 명령을 사용하면 실행이 활성 실험에 메트릭과 매개 변수를 기록합니다. 활성 실험이 없으면 Azure Databricks는 Notebook 실험을 만듭니다. Notebook 실험은 해당 Notebook과 동일한 이름 및 ID를 공유합니다. Notebook ID는 Notebook URL 및 ID 끝에 있는 숫자 식별자입니다.

또는 Azure Databricks 작업 영역 경로를 mlflow.set_experiment()의 기존 Notebook에 전달하여 Notebook 실험을 만들 수 있습니다.

Notebook 실험에 대한 실행 로깅에 대한 지침은 로깅 예제 Notebook을 참조하세요.

참고 항목

API(예: Python의 MlflowClient.tracking.delete_experiment())를 사용하여 Notebook 실험을 삭제하면 Notebook 자체가 휴지통 폴더로 이동됩니다.

실험 보기

액세스 권한이 있는 각 실험은 실험 페이지에 표시됩니다. 이 페이지에서 모든 실험을 볼 수 있습니다. 실험 이름을 클릭하면 실험 페이지가 표시됩니다.

실험 페이지에 액세스하는 추가적인 방법:

  • 작업 영역 메뉴에서 작업 영역 실험에 대한 실험 페이지에 액세스할 수 있습니다.
  • Notebook에서 Notebook 실험을 위한 실험 페이지에 액세스할 수 있습니다.

실험을 검색하려면 필터 실험 필드에 텍스트를 입력하고 Enter 키를 누르거나 돋보기 아이콘을 클릭합니다. 이름, 만든 사람, 위치 또는 설명 열에 검색 텍스트가 포함된 실험만 표시하도록 실험 목록이 변경됩니다.

표에서 실험 이름을 클릭하면 실험 페이지가 표시됩니다.

실험 보기

실험 페이지에는 실험과 관련된 모든 실행이 나열됩니다. 테이블에서 실행 이름을 클릭하여 실험과 연결된 모든 실행에 대한 실행 페이지를 열 수 있습니다. 원본 열은 실행을 만든 Notebook 버전에 대한 액세스를 제공합니다. 메트릭 또는 매개 변수 설정별로 실행을 검색하고 필터링할 수도 있습니다.

작업 영역 실험 보기

  1. 사이드바에서 작업 영역을 클릭합니다작업 영역 아이콘.
  2. 실험이 포함된 폴더로 이동합니다.
  3. 실험 이름을 클릭합니다.

Notebook 실험 보기

Notebook의 오른쪽 사이드바에서 실험 아이콘실험 아이콘클릭합니다.

실험 실행 사이드바가 나타나고 실행 매개 변수 및 메트릭을 포함하여 Notebook 실험과 연결된 각 실행의 요약이 표시됩니다. 사이드바 상단에는 가장 최근에 기록된 Notebook이 실행되는 실험의 이름이 있습니다(Notebook 실험 또는 작업 영역 실험).

실행 매개 변수 및 메트릭 보기

사이드바에서 실험 페이지로 이동하거나 실행으로 직접 이동할 수 있습니다.

  • 실험을 보려면 실험 실행 옆에 있는 맨 오른쪽을 클릭합니다외부 링크.
  • 실행을 표시하려면 실행의 이름을 클릭합니다.

실험 관리

실험 페이지, 실험 페이지 또는 작업 영역 메뉴에서 소유한 실험에 대한 사용 권한의 이름을 바꾸거나 삭제하거나 관리할 수 있습니다.

참고 항목

Databricks Git 폴더의 Notebook에서 만든 MLflow 실험에 대한 사용 권한의 이름을 직접 바꾸거나 삭제하거나 관리할 수 없습니다. Git 폴더 수준에서 이러한 작업을 수행해야 합니다.

실험 페이지 또는 실험 페이지에서 실험 이름 바꾸기

Important

이 기능은 공개 미리 보기 상태입니다.

실험 페이지 또는 실험 페이지에서 실험 이름을 바꾸려면 이름 바꾸기를 클릭하고 세 개의 단추 아이콘 선택합니다.

작업 영역 메뉴에서 실험 이름 바꾸기

  1. 사이드바에서 작업 영역을 클릭합니다작업 영역 아이콘.
  2. 실험이 포함된 폴더로 이동합니다.
  3. 실험 이름을 마우스 오른쪽 단추로 클릭하고 이름 바꾸기를 선택합니다.

실험 이름 복사

실험 이름을 복사하려면 실험 페이지의 위쪽을 클릭합니다 복사 아이콘 . MLflow 명령 set_experiment에서 이 이름을 사용하여 활성 MLflow 실험을 설정할 수 있습니다.

실험 이름 아이콘

Notebook의 실험 사이드바에서 실험 이름을 복사할 수도 있습니다.

Notebook 실험 삭제

Notebook 실험은 Notebook의 일부이며 별도로 삭제할 수 없습니다. Notebook을 삭제하면 연결된 Notebook 실험이 삭제됩니다. UI를 사용하여 Notebook 실험을 삭제하면 Notebook도 삭제됩니다.

API를 사용하여 Notebook 실험을 삭제하려면 작업 영역 API를 사용하여 Notebook과 실험이 모두 작업 영역에서 삭제되도록 합니다.

작업 영역 메뉴에서 작업 영역 실험 삭제

  1. 사이드바에서 작업 영역을 클릭합니다작업 영역 아이콘.
  2. 실험이 포함된 폴더로 이동합니다.
  3. 실험 이름을 마우스 오른쪽 단추로 클릭하고 휴지통으로 이동을 선택합니다.

실험 페이지 또는 실험 페이지에서 작업 영역 또는 Notebook 실험 삭제

Important

이 기능은 공개 미리 보기 상태입니다.

실험 페이지 또는 실험 페이지에서 실험을 삭제하려면 삭제를 클릭하고 세 개의 단추 아이콘 선택합니다.

Notebook 실험을 삭제하면 Notebook도 삭제됩니다.

실험에 대한 사용 권한 변경

실험 페이지에서 실험에 대한 공유를 변경하려면 권한을 클릭합니다.

실험 페이지 권한 단추

실험 페이지에서 소유한 실험에 대한 권한을 변경할 수 있습니다. 작업 열을 클릭하고 세 개의 단추 아이콘 사용 권한을 선택합니다.

실험 권한 수준에 대한 자세한 내용은 MLFlow 실험 ACL을 참조 하세요.

작업 영역 간에 실험 복사

작업 영역 간에 MLflow 실험을 마이그레이션하려면 커뮤니티 기반 오픈 소스 프로젝트 MLflow Export-Import를 사용하면 됩니다.

이러한 도구를 사용하여 다음을 수행할 수 있습니다.

  • 동일하거나 다른 추적 서버의 다른 데이터 과학자와 공유하고 협업합니다. 예를 들어 다른 사용자의 실험을 작업 영역으로 복제할 수 있습니다.
  • MLflow 실험을 복사하고 로컬 추적 서버에서 Databricks 작업 영역으로 실행합니다.
  • 중요 업무용 실험 및 모델을 다른 Databricks 작업 영역에 백업합니다.