Share via


core 패키지

구성 가능한 기계 학습 워크플로인 Azure Machine Learning 파이프라인의 핵심 기능이 포함되어 있습니다.

Azure Machine Learning 파이프라인을 사용하면 Machine Learning 시나리오의 템플릿으로 사용할 수 있는 재사용 가능한 기계 학습 워크플로를 생성할 수 있습니다. 이 패키지에는 Azure ML 파이프라인 작업을 위한 핵심 기능이 포함되어 있으며 일반적으로 steps 패키지의 클래스와 함께 사용됩니다.

기계 학습 파이프라인은 시퀀스를 지정하고 병렬 처리할 수 있거나 단계 간에 명시적 종속성을 사용하여 생성할 수 있는 PipelineStep 개체 컬렉션으로 표시됩니다. 파이프라인 단계는 실행할 워크플로를 나타내는 Pipeline 개체를 정의하는 데 사용됩니다. Azure ML SDK가 설치된 Jupyter Notebook 또는 다른 IDE에서 파이프라인을 생성하고 작업할 수 있습니다.

Azure ML 파이프라인을 사용하면 인프라가 아닌 기계 학습에 집중할 수 있습니다. 파이프라인 빌드를 시작하려면 https://aka.ms/pl-first-pipeline을 참조하세요.

Machine Learning 파이프라인의 이점 및 Azure에서 제공하는 다른 파이프라인과의 관계에 대한 자세한 내용은 Azure Machine Learning Services의 ML 파이프라인이란?을 참조하세요.

모듈

builder

Azure Machine Learning 파이프라인을 빌드하기 위한 클래스를 정의합니다.

파이프라인 그래프는 파이프라인 단계(PipelineStep), 각 단계에서 생성되거나 소비되는 선택적 파이프라인 데이터(PipelineData), 선택적 단계 실행 시퀀스(StepSequence)로 구성됩니다.

graph

Azure Machine Learning 파이프라인 그래프를 작성하기 위한 클래스를 정의합니다.

Azure ML 파이프라인 그래프는 PipelineStep(및 파생 클래스), PipelineDataPipelineData 개체를 사용할 때 Pipeline 개체에 대해 만들어집니다. 일반적인 사용 사례에서는 이 모듈의 클래스를 직접 사용할 필요가 없습니다.

파이프라인 실행 그래프는 데이터 원본 또는 단계와 같은 기본 단위를 나타내는 모듈 노드로 구성됩니다. 노드에는 입력 포트와 출력 포트, 관련 매개 변수가 있을 수 있습니다. 에지는 그래프에서 두 노드 포트 간의 관계를 정의합니다.

module

Azure Machine Learning 파이프라인의 재사용 가능한 계산 단위를 만들고 관리하기 위한 클래스를 포함합니다.

모듈을 사용하면 입출력을 포함하고 매개 변수 및 환경 구성을 사용하여 작동할 수 있는 계산 단위를 Pipeline에 만들 수 있습니다. 하나의 파이프라인에서 사용되는 PipelineStep(및 파생 클래스)과 달리 모듈은 버전을 지정하고 다른 Azure Machine Learning 파이프라인에서 사용할 수 있습니다.

모듈은 여러 파이프라인에서 다시 사용되도록 디자인되었으며 다양한 사용 사례에 맞게 특정 계산 논리를 조정하도록 발전시킬 수 있습니다. 파이프라인의 단계를 빠른 반복에서 사용하여 알고리즘을 개선할 수 있으며, 목표가 달성되면 일반적으로 알고리즘은 다시 사용할 수 있도록 모듈로 게시됩니다.

module_step_base

Module 버전을 사용하여 파이프라인에 단계를 추가하는 기능이 포함되어 있습니다.

pipeline

재사용 가능한 Azure Machine Learning 워크플로를 생성하기 위한 클래스를 정의합니다.

pipeline_draft

변경 가능한 파이프라인을 관리하기 위한 클래스를 정의합니다.

pipeline_endpoint

버전 관리 및 엔드포인트를 포함하여 파이프라인을 관리하기 위한 클래스를 정의합니다.

pipeline_output_dataset

중간 출력을 Azure Machine Learning 데이터 세트로 승격하는 기능이 포함되어 있습니다.

기본적으로 파이프라인의 중간 데이터(출력)는 Azure Machine Learning 데이터 집합이 되지 않습니다. 중간 데이터를 Azure Machine Learning 데이터 집합으로 승격하려면 PipelineData 클래스의 as_dataset 메서드를 호출하여 PipelineOutputFileDataset 개체를 반환합니다. 그러면 PipelineOutputFileDataset 개체에서 PipelineOutputTabularDataset 개체를 만들 수 있습니다.

run

상태 확인 및 실행 세부 정보 검색을 위한 클래스를 포함하여 제출된 파이프라인에 대한 클래스를 정의합니다.

schedule

Azure Machine Learning 파이프라인 제출을 예약하기 위한 클래스를 정의합니다.

클래스

InputPortBinding

원본에서 파이프라인 단계의 입력으로의 바인딩을 정의합니다.

InputPortBinding은 단계에 대한 입력으로 사용할 수 있습니다. 원본은 PipelineData, PortDataReference, DataReference, PipelineDataset 또는 OutputPortBinding일 수 있습니다.

InputPortBinding은 바인드 개체의 이름과 달라야 하는 경우 중복 입력/출력 이름을 피하기 위해 또는 단계 스크립트가 특정 이름을 갖기 위해 입력이 필요하기 때문에 단계 입력의 이름을 지정하는 데 유용합니다. 또한 PythonScriptStep 입력에 대해 bind_mode를 지정하는 데 사용할 수도 있습니다.

InputPortBinding을 초기화합니다.

Module

Azure Machine Learning 파이프라인에 사용되는 계산 단위를 나타냅니다.

모듈은 컴퓨팅 대상에서 실행되는 파일의 컬렉션이며 인터페이스에 대한 설명입니다. 파일 컬렉션은 스크립트, 이진 파일 또는 컴퓨팅 대상에서 실행하는 데 필요한 기타 파일일 수 있습니다. 모듈 인터페이스는 입력, 출력, 매개 변수 정의를 설명합니다. 특정 값이나 데이터에 바인딩하지 않습니다. 모듈에는 모듈에 대해 정의된 파일 컬렉션을 캡처하는 스냅샷이 연결되어 있습니다.

모듈을 초기화합니다.

ModuleVersion

Module 내에서 실제 계산 단위를 나타냅니다.

이 클래스를 직접 사용하지 않아야 합니다. 대신 Module 클래스의 게시 메서드 중 하나를 사용합니다.

ModuleVersion을 초기화합니다.

ModuleVersionDescriptor

ModuleVersion의 버전 및 ID를 정의합니다.

ModuleVersionDescriptor를 초기화합니다.

OutputPortBinding

파이프라인 단계의 명명된 출력을 정의합니다.

OutputPortBinding을 사용하여 한 단계에서 생성할 데이터의 형식과 데이터를 생성하는 방법을 지정할 수 있습니다. InputPortBinding과 함께 사용하여 단계 출력이 다른 단계의 필수 입력임을 지정할 수 있습니다.

OutputPortBinding을 초기화합니다.

Pipeline

재사용 가능한 Azure Machine Learning 워크플로로 실행할 수 있는 단계 컬렉션을 나타냅니다.

파이프라인을 사용하여 다양한 기계 학습 단계를 연결하는 워크플로를 생성하고 관리합니다. 데이터 준비 및 모델 학습과 같은 각 기계 학습 단계는 파이프라인에서 하나 이상의 단계로 구성될 수 있습니다.

파이프라인을 사용하는 이유와 시기에 대한 개요는 https://aka.ms/pl-concept를 참조하세요.

파이프라인 구성에 대한 개요는 https://aka.ms/pl-first-pipeline을 참조하세요.

파이프라인을 초기화합니다.

PipelineData

Azure Machine Learning 파이프라인의 중간 데이터를 나타냅니다.

파이프라인에서 사용되는 데이터는 한 단계의 출력과 하나 이상 후속 단계의 입력으로 PipelineData 개체를 제공하여 한 단계에서 생성하고 다른 단계에서 이용할 수 있습니다.

참고 파이프라인 데이터를 사용하는 경우 사용된 디렉터리가 있는지 확인하세요.

디렉터리가 있는지 확인하는 Python 예제입니다. 한 파이프라인 단계에서 output_folder라는 출력 포트가 있다고 가정하고 이 폴더의 상대 경로에 일부 데이터를 쓰려고 합니다.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData는 데이터 액세스 및 배달에 더 이상 권장되지 않는 접근 방식인 기본 DataReference를 사용합니다. OutputFileDatasetConfig를 대신 사용하세요. OutputFileDatasetConfig를 사용하는 파이프라인에서 샘플을 확인할 수 있습니다.

PipelineData를 초기화합니다.

PipelineDataset

데이터 집합 및 파이프라인의 어댑터 역할을 합니다.

참고

이 클래스는 사용되지 않습니다. 파이프라인에서 데이터 세트를 사용하는 방법을 알아보려면 https://aka.ms/pipeline-with-dataset 를 참조하세요.

내부 클래스입니다. 이 클래스를 직접 생성하지 말고 Dataset 또는 OutputDatasetConfig 클래스에서 as_* 인스턴스 메서드를 호출해야 합니다.

데이터 세트 및 파이프라인의 어댑터 역할을 합니다.

내부 클래스입니다. 이 클래스를 직접 만들지 말고 Dataset 또는 OutputDatasetConfig 클래스에서 as_* 인스턴스 메서드를 호출해야 합니다.

PipelineDraft

실행을 제출하고 게시된 파이프라인을 만드는 데 사용할 수 있는 변경 가능한 파이프라인을 나타냅니다.

PipelineDrafts를 사용하여 파이프라인에서 반복합니다. PipelineDrafts는 처음부터 다른 PipelineDraft 또는 기존 파이프라인인 Pipeline, PublishedPipeline 또는 PipelineRun에서 생성할 수 있습니다.

PipelineDraft를 초기화합니다.

PipelineEndpoint

고유한 엔드포인트 URL에서 트리거될 수 있는 Pipeline 워크플로를 나타냅니다.

PipelineEndpoints를 사용하여 동일한 엔드포인트를 유지하면서 PublishedPipeline의 새 버전을 만들 수 있습니다. PipelineEndpoints는 작업 영역 내에서 고유하게 이름이 지정됩니다.

PipelineEndpoint 개체의 엔드포인트 특성을 사용하여 REST 호출로 외부 애플리케이션에서 새 파이프라인 실행을 트리거할 수 있습니다. REST 엔드포인트를 호출할 때 인증하는 방법에 대한 자세한 내용은 https://aka.ms/pl-restep-auth를 참조하세요.

기계 학습 파이프라인 만들기 및 실행에 대한 자세한 내용은 https://aka.ms/pl-first-pipeline을 참조하세요.

PipelineEndpoint를 초기화합니다.

PipelineParameter

파이프라인 실행에서 매개 변수를 정의합니다.

PipelineParameters를 사용하여 다양한 매개 변수 값으로 나중에 다시 제출할 수 있는 다용도 파이프라인을 구성합니다.

파이프라인 매개 변수를 초기화합니다.

PipelineRun

Pipeline의 실행을 나타냅니다.

이 클래스는 파이프라인 실행이 제출되면 관리, 상태 확인, 실행 세부 정보 검색에 사용할 수 있습니다. get_steps를 사용하여 파이프라인 실행에 의해 생성된 StepRun 개체를 검색합니다. 다른 용도로는 파이프라인 실행과 연결된 Graph 개체 검색, 파이프라인 실행 상태 가져오기, 실행 완료 대기 등이 있습니다.

파이프라인 실행을 초기화합니다.

PipelineStep

Azure Machine Learning 파이프라인의 실행 단계를 나타냅니다.

파이프라인은 파이프라인의 고유한 계산 단위인 여러 파이프라인 단계로 구성됩니다. 각 단계는 독립적으로 실행되어 격리된 컴퓨팅 리소스를 사용할 수 있습니다. 각 단계에는 일반적으로 이름이 지정된 고유한 입력, 출력, 매개 변수가 있습니다.

PipelineStep 클래스는 PythonScriptStep, DataTransferStep, HyperDriveStep과 같은 일반적인 시나리오용으로 설계된 다른 기본 제공 단계 클래스가 상속되는 기본 클래스입니다.

Pipelines와 PipelineSteps의 관계에 대한 개요는 What are ML Pipelines(ML 파이프라인이란?)를 참조하세요.

PipelineStep을 초기화합니다.

PortDataReference

완료된 StepRun의 출력과 연결된 데이터를 모델링합니다.

PortDataReference 개체를 사용하여 StepRun에서 생성된 출력 데이터를 다운로드할 수 있습니다. 이후 파이프라인에서 단계 입력으로 사용할 수도 있습니다.

PortDataReference를 초기화합니다.

PublishedPipeline

파이프라인을 구성한 Python 코드 없이 제출할 파이프라인을 나타냅니다.

또한 PublishedPipeline을 사용하여 다른 PipelineParameter 값과 입력으로 Pipeline을 다시 제출할 수 있습니다.

PublishedPipeline을 초기화합니다.

:p aram 엔드포인트 이 파이프라인에 대한 파이프라인 실행을 제출할 REST 엔드포인트 URL입니다. :type 엔드포인트: str :p aram total_run_steps: 이 파이프라인 :type total_run_steps: int :p aram 작업 영역: 게시된 파이프라인의 작업 영역의 단계 수입니다. :type 작업 영역: azureml.core.Workspace :p aram continue_on_step_failure: PipelineRun에서 다른 단계의 실행을 계속할지 여부

단계가 실패하면 기본값은 false입니다.

Schedule

파이프라인을 제출할 일정을 정의합니다.

파이프라인이 게시되면 일정을 사용하여 지정된 간격으로 또는 Blob Storage 위치에 대한 변경 내용이 검색될 때 파이프라인을 제출할 수 있습니다.

일정을 초기화합니다.

ScheduleRecurrence

파이프라인 Schedule의 빈도, 간격 및 시작 시간을 정의합니다.

ScheduleRecurrence를 사용하면 표준 시간대와 반복 시간, 분 또는 요일을 지정할 수도 있습니다.

일정 되풀이를 초기화합니다.

또한 되풀이에 대한 표준 시간대와 시간 또는 분 또는 요일을 지정할 수 있습니다.

StepRun

Pipeline에서 단계 실행입니다.

이 클래스는 부모 파이프라인 실행이 제출되고 파이프라인이 단계 실행을 제출하면 관리, 상태 확인, 실행 세부 정보 검색에 사용할 수 있습니다.

StepRun을 초기화합니다.

StepRunOutput

파이프라인에서 StepRun에 의해 생성된 출력을 나타냅니다.

StepRunOutput을 사용하여 단계에서 생성된 PortDataReference에 액세스할 수 있습니다.

StepRunOutput을 초기화합니다.

StepSequence

Pipeline의 단계 목록과 그러한 단계를 실행할 순서를 나타냅니다.

파이프라인을 초기화할 때 StepSequence를 사용하여 특정 순서로 실행할 단계가 포함된 워크플로를 생성합니다.

StepSequence를 초기화합니다.

TrainingOutput

파이프라인에서 사용할 특정 PipelineSteps의 특수 출력을 정의합니다.

TrainingOutput을 사용하면 자동화된 Machine Learning 메트릭 또는 모델을 Azure Machine Learning 파이프라인의 다른 단계에서 사용할 단계 출력으로 사용할 수 있게 됩니다. AutoMLStep 또는 HyperDriveStep와 함께 사용할 수 있습니다.

TrainingOutput을 초기화합니다.

param model_file: 출력에 포함할 특정 모델 파일입니다. HyperDriveStep에만 해당합니다.

열거형

TimeZone

되풀이 Schedule에 유효한 표준 시간대를 열거합니다.