파이프라인 매개 변수를 사용 하 여 디자이너에서 모델 다시 학습Use pipeline parameters to retrain models in the designer

이 방법 문서에서는 Azure Machine Learning designer를 사용 하 여 파이프라인 매개 변수를 사용 하 여 Machine Learning 모델을 다시 학습 하는 방법을 알아봅니다.In this how-to article, you learn how to use Azure Machine Learning designer to retrain a machine learning model using pipeline parameters. 게시된 파이프라인을 사용하여 워크플로를 자동화하고 매개 변수를 설정하여 새 데이터에 대한 모델을 학습시킵니다.You will use published pipelines to automate your workflow and set parameters to train your model on new data. 파이프라인 매개 변수를 사용 하면 다른 작업에 대해 기존 파이프라인을 다시 사용할 수 있습니다.Pipeline parameters let you re-use existing pipelines for different jobs.

이 문서에서는 다음 방법을 설명합니다.In this article, you learn how to:

  • 기계 학습 모델 학습Train a machine learning model.
  • 파이프라인 매개 변수를 만듭니다.Create a pipeline parameter.
  • 학습 파이프라인을 게시합니다.Publish your training pipeline.
  • 새 매개 변수를 사용하여 모델을 재학습시킵니다.Retrain your model with new parameters.

사전 요구 사항Prerequisites

중요

스튜디오 또는 디자이너의 단추와 같이 이 문서에 언급된 그래픽 요소가 보이지 않는 경우 작업 영역에 대한 적절한 사용 권한이 없는 것일 수 있습니다.If you do not see graphical elements mentioned in this document, such as buttons in studio or designer, you may not have the right level of permissions to the workspace. Azure 구독 관리자에게 문의하여 적절한 액세스 권한이 부여되었는지 확인하세요.Please contact your Azure subscription administrator to verify that you have been granted the correct level of access. 자세한 내용은 사용자 및 역할 관리를 참조하세요.For more information, see Manage users and roles.

또한이 문서에서는 사용자가 디자이너에서 파이프라인을 빌드하는 데 대 한 지식이 있다고 가정 합니다.This article also assumes that you have some knowledge of building pipelines in the designer. 단계별 소개를 보려면 자습서를 완료하세요.For a guided introduction, complete the tutorial.

샘플 파이프라인Sample pipeline

이 문서에서 사용 되는 파이프라인은 디자이너 홈페이지에서 샘플 파이프라인 수입 예측 의 변경 된 버전입니다.The pipeline used in this article is an altered version of a sample pipeline Income prediction in the designer homepage. 파이프라인에서는 자체 데이터를 사용하여 모델을 학습시키는 방법을 보여 주기 위해 샘플 데이터 세트 대신 데이터 가져오기 모듈을 사용합니다.The pipeline uses the Import Data module instead of the sample dataset to show you how to train models using your own data.

데이터 가져오기 모듈을 강조 표시하는 상자를 포함된 수정된 샘플 파이프라인을 보여 주는 스크린샷

파이프라인 매개 변수 만들기Create a pipeline parameter

파이프라인 매개 변수는 다양 한 매개 변수 값으로 나중에 다시 전송할 수 있는 다양 한 파이프라인을 빌드하는 데 사용 됩니다.Pipeline parameters are used to build versatile pipelines which can be resubmitted later with varying parameter values. 몇 가지 일반적인 시나리오는 다시 학습을 위해 데이터 집합 또는 일부 하이퍼 매개 변수를 업데이트 하는 것입니다.Some common scenarios are updating datasets or some hyper-parameters for retraining. 런타임에 동적으로 변수를 설정하는 파이프라인 매개 변수를 만듭니다.Create pipeline parameters to dynamically set variables at runtime.

파이프라인 매개 변수는 파이프라인의 데이터 소스 또는 모듈 매개 변수에 추가할 수 있습니다.Pipeline parameters can be added to data source or module parameters in a pipeline. 파이프라인이 다시 전송 될 때 이러한 매개 변수의 값을 지정할 수 있습니다.When the pipeline is resubmitted, the values of these parameters can be specified.

이 예에서는 학습 데이터 경로를 고정 값에서 매개 변수로 변경하여 다른 데이터에 대해 모델을 재학습시킬 것입니다.For this example, you will change the training data path from a fixed value to a parameter, so that you can retrain your model on different data. 사용 사례에 따라 다른 모듈 매개 변수를 파이프라인 매개 변수로 추가할 수도 있습니다.You can also add other module parameters as pipeline parameters according to your use case.

  1. 데이터 가져오기 모듈을 선택합니다.Select the Import Data module.

    참고

    이 예에서는 데이터 가져오기 모듈을 사용하여 등록된 데이터 저장소의 데이터에 액세스합니다.This example uses the Import Data module to access data in a registered datastore. 그러나 대체 데이터 액세스 패턴을 사용하는 경우 비슷한 단계를 따를 수 있습니다.However, you can follow similar steps if you use alternative data access patterns.

  2. 캔버스 오른쪽에 있는 모듈 세부 정보 창에서 데이터 원본을 선택합니다.In the module detail pane, to the right of the canvas, select your data source.

  3. 데이터에 대한 경로를 입력합니다.Enter the path to your data. 경로 찾아보기 를 선택하여 파일 트리를 찾아볼 수도 있습니다.You can also select Browse path to browse your file tree.

  4. 경로 필드를 마우스로 가리키고 표시되는 경로 필드 위에 있는 줄임표를 선택합니다.Mouseover the Path field, and select the ellipses above the Path field that appear.

  5. 파이프라인 매개 변수 추가 를 선택합니다.Select Add to pipeline parameter.

  6. 매개 변수 이름 및 기본값을 제공합니다.Provide a parameter name and a default value.

    파이프라인 매개 변수를 만드는 방법을 보여 주는 스크린샷

  7. 저장 을 선택합니다.Select Save.

    참고

    파이프라인 매개 변수를 추가 하는 것과 유사 하 게 모듈 세부 정보 창의 파이프라인 매개 변수에서 모듈 매개 변수를 분리할 수도 있습니다.You can also detach a module parameter from pipeline parameter in the module detail pane, similar to adding pipeline parameters.

    파이프라인 초안의 제목 옆에 있는 설정 기어 아이콘을 선택하여 파이프라인 매개 변수를 검사하고 편집할 수 있습니다.You can inspect and edit your pipeline parameters by selecting the Settings gear icon next to the title of your pipeline draft.

    • 분리 한 후 설정 창에서 파이프라인 매개 변수를 삭제할 수 있습니다.After detaching, you can delete the pipeline parameter in the Setings pane.
    • 또한 설정 창에서 파이프라인 매개 변수를 추가한 다음 일부 모듈 매개 변수에 적용할 수 있습니다.You can also add a pipeline parameter in the Settings pane, and then apply it on some module parameter.
  8. 파이프라인 실행을 제출합니다.Submit the pipeline run.

학습 파이프라인 게시Publish a training pipeline

파이프라인을 파이프라인 엔드포인트에 게시하여 나중에 파이프라인을 쉽게 다시 사용할 수 있습니다.Publish a pipeline to a pipeline endpoint to easily reuse your pipelines in the future. 파이프라인 엔드포인트는 나중에 파이프라인을 호출하는 REST 엔드포인트를 만듭니다.A pipeline endpoint creates a REST endpoint to invoke pipeline in the future. 이 예에서는 파이프라인 엔드포인트로 파이프라인을 다시 사용하여 다른 데이터에서 모델을 재학습시킬 수 있습니다.In this example, your pipeline endpoint lets you reuse your pipeline to retrain a model on different data.

  1. 디자이너 캔버스 위의 게시 를 선택합니다.Select Publish above the designer canvas.

  2. 파이프라인 엔드포인트를 선택하거나 만듭니다.Select or create a pipeline endpoint.

    참고

    단일 엔드포인트에 여러 파이프라인을 게시할 수 있습니다.You can publish multiple pipelines to a single endpoint. 지정된 엔드포인트의 각 파이프라인에는 파이프라인 엔드포인트를 호출할 때 지정할 수 있는 버전 번호가 제공됩니다.Each pipeline in a given endpoint is given a version number, which you can specify when you call the pipeline endpoint.

  3. 게시 를 선택합니다.Select Publish.

모델 재학습Retrain your model

이제 게시된 학습 파이프라인이 있으므로 이를 사용하여 새 데이터에 대해 모델을 재학습시킬 수 있습니다.Now that you have a published training pipeline, you can use it to retrain your model on new data. 스튜디오 작업 영역이나 프로그래밍 방식으로 파이프라인 엔드포인트에서 실행을 제출할 수 있습니다.You can submit runs from a pipeline endpoint from the studio workspace or programmatically.

Studio 포털을 사용 하 여 실행 제출Submit runs by using the studio portal

다음 단계를 사용 하 여 studio 포털에서 실행 되는 매개 변수가 있는 파이프라인 끝점을 제출 합니다.Use the following steps to submit a parameterized pipeline endpoint run from the studio portal:

  1. 스튜디오 작업 영역에서 엔드포인트 페이지로 이동합니다.Go to the Endpoints page in your studio workspace.
  2. 파이프라인 엔드포인트 탭을 선택합니다. 그런 다음 파이프라인 엔드포인트를 선택합니다.Select the Pipeline endpoints tab. Then, select your pipeline endpoint.
  3. 게시된 파이프라인 탭을 선택합니다. 그런 다음 실행하려는 파이프라인 버전을 선택합니다.Select the Published pipelines tab. Then, select the pipeline version that you want to run.
  4. 제출 을 선택합니다.Select Submit.
  5. 설정 대화 상자에서 실행에 대한 매개 변수 값을 지정할 수 있습니다.In the setup dialog box, you can specify the parameters values for the run. 이 예에서는 US가 아닌 데이터 세트를 사용하여 모델을 학습시키도록 데이터 경로를 업데이트합니다.For this example, update the data path to train your model using a non-US dataset.

디자이너에서 매개 변수가 있는 파이프라인 실행을 설정하는 방법을 보여 주는 스크린샷

코드를 사용하여 실행 제출Submit runs by using code

게시된 파이프라인의 REST 엔드포인트는 개요 패널에서 찾을 수 있습니다.You can find the REST endpoint of a published pipeline in the overview panel. 엔드포인트를 호출하면 게시된 파이프라인을 재학습시킬 수 있습니다.By calling the endpoint, you can retrain the published pipeline.

REST 호출을 수행하려면 OAuth 2.0 전달자 유형 인증 헤더가 필요합니다.To make a REST call, you need an OAuth 2.0 bearer-type authentication header. 작업 영역에 대한 인증을 설정하고 매개 변수가 있는 REST 호출을 만드는 방법에 대한 자세한 내용은 일괄 처리 채점용 Azure Machine Learning 파이프라인 빌드를 참조하세요.For information about setting up authentication to your workspace and making a parameterized REST call, see Build an Azure Machine Learning pipeline for batch scoring.

다음 단계Next steps

이 문서에서는 디자이너를 사용하여 매개 변수가 있는 학습 파이프라인 엔드포인트를 만드는 방법을 알아보았습니다.In this article, you learned how to create a parameterized training pipeline endpoint using the designer.

모델을 배포하여 예측을 만드는 방법에 대한 전체 연습은 회귀 모델을 학습시키고 배포하는 디자이너 자습서를 참조하세요.For a complete walkthrough of how you can deploy a model to make predictions, see the designer tutorial to train and deploy a regression model.