Azure Machine Learning 디자이너(v1)란?

Azure Machine Learning 디자이너는 Azure Machine Learning에서 모델을 학습시키고 배포하는 데 사용되는 끌어서 놓기 인터페이스입니다. 이 문서에서는 디자이너에서 수행할 수 있는 작업을 설명합니다.

참고 항목

Designer는 두 가지 형식의 구성 요소, 즉 기존의 미리 빌드된 구성 요소(v1)와 사용자 지정 구성 요소(v2)를 지원합니다. 이 두 가지 형식의 구성 요소는 호환되지 않습니다.

클래식 미리 빌드된 구성 요소는 주로 데이터 처리와 회귀 및 분류와 같은 기존 기계 학습 작업을 위해 미리 빌드된 구성 요소를 제공합니다. 이 형식의 구성 요소는 계속 지원되지만 새 구성 요소가 추가되지는 않습니다.

사용자 지정 구성 요소를 사용하면 고유의 코드를 구성 요소로 래핑할 수 있습니다. 작업 영역 전체에서 구성 요소를 공유하고 Studio, CLI v2 및 SDK v2 인터페이스 전체에서 원활한 작성을 지원합니다.

새 프로젝트의 경우 AzureML V2와 호환되고 계속해서 새로운 업데이트를 받을 수 있는 사용자 지정 구성 요소를 사용하는 것이 좋습니다.

이 문서는 미리 빌드된 클래식 구성 요소에 적용되며 CLI v2 및 SDK v2와 호환되지 않습니다.

GIF of a building a pipeline in the designer.

디자이너는 Azure Machine Learning 작업 영역을 사용하여 다음과 같은 공유 리소스를 구성합니다.

모델 학습 및 배포

시각적 캔버스를 사용하여 포괄적인 기계 학습 워크플로를 만듭니다. 디자이너에서 모델을 모두 학습시키고 테스트 및 배포합니다.

  • 데이터 자산구성 요소를 캔버스에 끌어서 놓습니다.
  • 구성 요소를 연결하여 파이프라인 초안을 만듭니다.
  • Azure Machine Learning 작업 영역에서 컴퓨팅 리소스를 사용하여 파이프라인 실행을 제출합니다.
  • 학습 파이프라인유추 파이프라인으로 변환합니다.
  • REST 파이프라인 엔드포인트에 파이프라인을 게시하여 다른 매개 변수 및 데이터 자산과 함께 실행되는 새 파이프라인을 제출합니다.
    • 학습 파이프라인을 게시하여 매개 변수 및 데이터 자산을 변경하는 동안 여러 모델을 학습하는 데 단일 파이프라인을 다시 사용합니다.
    • 일괄 처리 유추 파이프라인을 게시하여 이전에 학습된 모델을 통해 새 데이터에 대한 예측을 수행합니다.
  • 실시간 유추 파이프라인을 온라인 엔드포인트에 배포하여 새 데이터에 대한 예측을 실시간으로 수행합니다.

Workflow diagram for training, batch inference, and real-time inference in the designer.

파이프라인

파이프라인은 연결하는 데이터 자산 및 분석 구성 요소로 구성됩니다. 파이프라인은 다양한 용도로 사용됩니다. 단일 모델을 학습하는 파이프라인이나 여러 모델을 학습하는 파이프라인을 만들 수 있습니다. 실시간 또는 일괄 처리로 예측을 수행하는 파이프라인을 만들거나 데이터 정리만 수행하는 파이프라인을 만들 수 있습니다. 파이프라인을 사용하여 작업을 다시 사용하고 프로젝트를 구성할 수 있습니다.

파이프라인 초안

디자이너에서 파이프라인을 편집하면 진행 상황이 파이프라인 초안으로 저장됩니다. 구성 요소를 추가 또는 제거하고, 컴퓨팅 대상을 구성하고, 매개 변수를 만드는 등의 작업을 통해 언제든지 파이프라인 초안을 편집할 수 있습니다.

유효한 파이프라인에는 다음과 같은 특징이 있습니다.

  • 데이터 자산은 구성 요소에만 연결될 수 있습니다.
  • 구성 요소는 데이터 자산 또는 다른 구성 요소에만 연결될 수 있습니다.
  • 구성 요소의 모든 입력 포트에는 데이터 흐름에 대한 연결이 포함되어야 합니다.
  • 각 구성 요소의 모든 필수 매개 변수를 설정해야 합니다.

파이프라인 초안을 실행할 준비가 되면 파이프라인 작업을 제출합니다.

파이프라인 작업

파이프라인을 실행할 때마다 파이프라인의 구성과 해당 결과가 작업 영역에 파이프라인 작업으로 저장됩니다. 파이프라인 작업으로 돌아가서 문제 해결 또는 감사를 위해 파이프라인 실행을 검사할 수 있습니다. 파이프라인 작업을 복제하여 편집할 새 파이프라인 초안을 만듭니다.

파이프라인 작업은 실험으로 그룹화되어 작업 기록을 구성합니다. 모든 파이프라인 작업의 실험을 설정할 수 있습니다.

데이터

기계 학습 데이터 자산을 사용하여 손쉽게 데이터에 액세스하고 데이터를 사용할 수 있습니다. 디자이너에는 실험에 사용할 여러 샘플 데이터 자산이 포함되어 있습니다. 필요할 때 더 많은 데이터 자산을 등록할 수 있습니다.

구성 요소

구성 요소는 데이터에 대해 수행할 수 있는 알고리즘입니다. 디자이너에는 데이터 수신 함수부터 학습, 점수 매기기, 유효성 검사 프로세스에 이르는 다양한 구성 요소가 있습니다.

구성 요소에는 구성 요소 내부 알고리즘을 구성하는 데 사용할 수 있는 매개 변수 집합이 포함될 수 있습니다. 캔버스에서 구성 요소를 선택할 때 구성 요소 매개 변수가 캔버스 오른쪽의 속성 창에 표시됩니다. 해당 창에서 매개 변수를 수정하여 모델을 튜닝할 수 있습니다. 디자이너에서 개별 구성 요소의 컴퓨팅 리소스를 설정할 수 있습니다.

Screenshot showing the component properties.

사용할 수 있는 기계 학습 알고리즘의 라이브러리를 탐색하는 데 도움이 필요한 경우 알고리즘 및 구성 요소 참조 개요를 참조하세요. 알고리즘 선택에 도움이 필요한 경우 Azure Machine Learning 알고리즘 치트 시트를 참조하세요.

Compute 리소스

작업 영역의 컴퓨팅 리소스를 사용하여 파이프라인을 실행하고 배포된 모델을 온라인 엔드포인트 또는 파이프라인 엔드포인트(일괄 처리 유추의 경우)로 호스트합니다. 지원되는 컴퓨팅 대상은 다음과 같습니다.

컴퓨팅 대상 학습 배포
Azure Machine Learning 컴퓨팅
Azure Kubernetes Service

컴퓨팅 대상은 Azure Machine Learning 작업 영역에 연결됩니다. Azure Machine Learning Studio의 작업 영역에서 컴퓨팅 대상을 관리합니다.

배포

실시간 유추를 수행하려면 파이프라인을 온라인 엔드포인트로 배포해야 합니다. 온라인 엔드포인트는 외부 애플리케이션과 점수 매기기 모델 간 인터페이스를 만듭니다. 온라인 엔드포인트를 호출하면 애플리케이션에 대한 예측 결과가 실시간으로 반환됩니다. 온라인 엔드포인트를 호출하려면 엔드포인트를 배포할 때 생성된 API 키를 전달합니다. 엔드포인트는 웹 프로그래밍 프로젝트에 일반적으로 사용되는 아키텍처인 REST를 기반으로 합니다.

온라인 엔드포인트는 Azure Kubernetes Service 클러스터에 배포해야 합니다.

모델을 배포하는 방법을 알아보려면 자습서: 디자이너를 사용하여 기계 학습 모델 배포를 참조하세요.

게시

파이프라인을 파이프라인 엔드포인트에 게시할 수도 있습니다. 온라인 엔드포인트와 마찬가지로, 파이프라인 엔드포인트를 사용하여 REST 호출을 통해 외부 애플리케이션에서 새 파이프라인 작업을 제출할 수 있습니다. 그러나 파이프라인 엔드포인트를 사용하여 실시간으로 데이터를 보내거나 받을 수 없습니다.

게시된 파이프라인은 유연하며, 모델을 학습 또는 재학습시키고, 일괄 처리 유추를 수행하고, 새 데이터를 처리하는 등의 작업을 수행하는 데 사용할 수 있습니다. 여러 파이프라인을 단일 파이프라인 엔드포인트에 게시하고 실행할 파이프라인 버전을 지정할 수 있습니다.

게시된 파이프라인은 각 구성 요소의 파이프라인 초안에서 정의한 컴퓨팅 리소스에서 실행됩니다.

디자이너는 SDK와 동일한 PublishedPipeline 개체를 만듭니다.

다음 단계