자습서: 디자이너를 사용하여 자동차 가격 예측Tutorial: Predict automobile price with the designer

2부로 구성된 이 자습서에서는 Azure Machine Learning 디자이너를 사용하여 자동차 가격을 예측하는 기계 학습 모델을 학습하고 배포하는 방법을 알아봅니다.In this two-part tutorial, you learn how to use the Azure Machine Learning designer to train and deploy a machine learning model that predicts the price of any car. 디자이너는 코드 한 줄 없이 기계 학습 모델을 만들 수 있는 끌어서 놓기 도구입니다.The designer is a drag-and-drop tool that lets you create machine learning models without a single line of code.

이 자습서의 1부에서는 다음 방법에 대해 알아봅니다.In part one of the tutorial, you'll learn how to:

  • 새 파이프라인 만들기Create a new pipeline.
  • 데이터 가져오기Import data.
  • 데이터 준비Prepare data.
  • 기계 학습 모델 학습Train a machine learning model.
  • 기계 학습 모델 평가Evaluate a machine learning model.

이 자습서의 2부에서는 모델을 실시간 추론 엔드포인트로 배포하여 보내는 기술 사양에 따라 자동차의 가격을 예측합니다.In part two of the tutorial, you'll deploy your model as a real-time inferencing endpoint to predict the price of any car based on technical specifications you send it.

참고

이 자습서의 전체 버전은 샘플 파이프라인으로 사용할 수 있습니다.A completed version of this tutorial is available as a sample pipeline.

이를 찾으려면 작업 영역의 디자이너로 이동합니다.To find it, go to the designer in your workspace. 새 파이프라인 섹션에서 샘플 1 - 회귀 분석: 자동차 가격 예측(기본) 을 선택합니다.In the New pipeline section, select Sample 1 - Regression: Automobile Price Prediction(Basic).

중요

스튜디오 또는 디자이너의 단추와 같이 이 문서에 언급된 그래픽 요소가 보이지 않는 경우 작업 영역에 대한 적절한 사용 권한이 없는 것일 수 있습니다.If you do not see graphical elements mentioned in this document, such as buttons in studio or designer, you may not have the right level of permissions to the workspace. Azure 구독 관리자에게 문의하여 적절한 액세스 권한이 부여되었는지 확인하세요.Please contact your Azure subscription administrator to verify that you have been granted the correct level of access. 자세한 내용은 사용자 및 역할 관리를 참조하세요.For more information, see Manage users and roles.

새 파이프라인 만들기Create a new pipeline

Azure Machine Learning 파이프라인은 여러 기계 학습 및 데이터 처리 단계를 단일 리소스로 구성합니다.Azure Machine Learning pipelines organize multiple machine learning and data processing steps into a single resource. 파이프라인을 사용하면 프로젝트와 사용자 간에 복잡한 기계 학습 워크플로를 구성, 관리 및 재사용할 수 있습니다.Pipelines let you organize, manage, and reuse complex machine learning workflows across projects and users.

Azure Machine Learning 파이프라인을 만들려면 Azure Machine Learning 작업 영역이 필요합니다.To create an Azure Machine Learning pipeline, you need an Azure Machine Learning workspace. 이 섹션에서는 이러한 두 가지 리소스를 만드는 방법에 대해 알아봅니다.In this section, you learn how to create both these resources.

새 작업 영역 만들기Create a new workspace

디자이너를 사용하려면 Azure Machine Learning 작업 영역이 필요합니다.You need an Azure Machine Learning workspace to use the designer. 작업 영역은 Azure Machine Learning의 최상위 리소스로, Azure Machine Learning에서 만든 모든 아티팩트를 사용할 수 있는 중앙 집중식 환경을 제공합니다.The workspace is the top-level resource for Azure Machine Learning, it provides a centralized place to work with all the artifacts you create in Azure Machine Learning. 작업 영역 만들기에 대한 지침은 Azure Machine Learning 작업 영역 만들기 및 관리를 참조하세요.For instruction on creating a workspace, see Create and manage Azure Machine Learning workspaces.

참고

작업 영역에서 가상 네트워크를 사용하는 경우 디자이너를 사용하기 위해 사용해야 하는 추가 구성 단계가 있습니다.If your workspace uses a Virtual network, there are additional configuration steps you must use to use the designer. 자세한 내용은 Azure 가상 네트워크에서 Azure Machine Learning Studio 사용을 참조하세요.For more information, see Use Azure Machine Learning studio in an Azure virtual network

파이프라인 만들기Create the pipeline

  1. ml.azure.com에 로그인하고, 사용하려는 작업 영역을 선택합니다.Sign in to ml.azure.com, and select the workspace you want to work with.

  2. 디자이너 를 선택합니다.Select Designer.

    디자이너에 액세스하는 방법을 보여 주는 시각적 작업 영역의 스크린샷

  3. 사용하기 쉬운 미리 작성된 모듈 을 선택합니다.Select Easy-to-use prebuilt modules.

  4. 캔버스 위쪽에서 기본 파이프라인 이름인 Pipeline-Created-on 을 선택합니다.At the top of the canvas, select the default pipeline name Pipeline-Created-on. 이름을 자동차 가격 예측 으로 바꿉니다.Rename it to Automobile price prediction. 이름은 고유할 필요가 없습니다.The name doesn't need to be unique.

기본 컴퓨팅 대상 설정Set the default compute target

작업 영역에 연결된 컴퓨팅 리소스인 컴퓨팅 대상에서 파이트라인이 실행됩니다.A pipeline runs on a compute target, which is a compute resource that's attached to your workspace. 컴퓨팅 대상을 만든 후 이후 실행에 다시 사용할 수 있습니다.After you create a compute target, you can reuse it for future runs.

전체 파이프라인에 대해 기본 컴퓨팅 대상 을 설정하면, 기본적으로 모든 모듈이 동일한 컴퓨팅 대상을 사용하도록 지시합니다.You can set a Default compute target for the entire pipeline, which will tell every module to use the same compute target by default. 하지만 모듈별로 컴퓨팅 대상을 지정할 수 있습니다.However, you can specify compute targets on a per-module basis.

  1. 파이프라인 이름 옆 캔버스 상단의 기어 아이콘 기어 아이콘 스크린샷을 선택하여 설정 창을 엽니다.Next to the pipeline name, select the Gear icon Screenshot of the gear icon at the top of the canvas to open the Settings pane.

  2. 캔버스 오른쪽에 있는 설정 창에서 컴퓨팅 대상 선택 을 선택합니다.In the Settings pane to the right of the canvas, select Select compute target.

    사용 가능한 컴퓨팅 대상이 이미 있는 경우 파이프라인을 실행하도록 선택할 수 있습니다.If you already have an available compute target, you can select it to run this pipeline.

    참고

    디자이너는 Azure Machine Learning 컴퓨팅에 대해서만 학습 실험을 실행할 수 있지만 다른 컴퓨팅 대상은 표시되지 않습니다.The designer can only run training experiments on Azure Machine Learning Compute but other compute targets won't be shown.

  3. 컴퓨팅 리소스의 이름을 입력합니다.Enter a name for the compute resource.

  4. 저장 을 선택합니다.Select Save.

    참고

    컴퓨팅 리소스를 만드는 데 약 5분이 걸립니다.It takes approximately five minutes to create a compute resource. 리소스가 만들어지면 다시 사용할 수 있으며 이후 실행에는 이 대기 시간을 건너뛸 수 있습니다.After the resource is created, you can reuse it and skip this wait time for future runs.

    컴퓨팅 리소스는 비용을 절감하기 위해 유휴 상태일 때 0개 노드로 자동 크기 조정됩니다.The compute resource autoscales to zero nodes when it's idle to save cost. 지연 후 다시 사용할 경우 백업 크기를 조정하는 동안 약 5분의 대기 시간이 발생할 수 있습니다.When you use it again after a delay, you might experience approximately five minutes of wait time while it scales back up.

데이터 가져오기Import data

디자이너에는 실험에 사용할 몇 가지 샘플 데이터 세트가 포함되어 있습니다.There are several sample datasets included in the designer for you to experiment with. 이 자습서에서는 자동차 가격 데이터(원시) 를 사용합니다.For this tutorial, use Automobile price data (Raw).

  1. 파이프라인 캔버스의 왼쪽에는 데이터 세트와 모듈로 구성된 팔레트가 있습니다.To the left of the pipeline canvas is a palette of datasets and modules. 샘플 데이터 세트 를 선택하여 사용 가능한 샘플 데이터 세트를 확인합니다.Select Sample datasets to view the available sample datasets.

  2. 자동차 가격 데이터(원시) 데이터 세트를 선택하여 캔버스로 끕니다.Select the dataset Automobile price data (Raw), and drag it onto the canvas.

    캔버스로 데이터 끌기

데이터 시각화Visualize the data

사용할 데이터 세트를 파악하기 위해 데이터를 시각화할 수 있습니다.You can visualize the data to understand the dataset that you'll use.

  1. 자동차 가격 데이터(원시) 를 마우스 오른쪽 단추로 클릭하고 시각화 > 데이터 세트 출력 을 선택합니다.Right-click the Automobile price data (Raw) and select Visualize > Dataset output.

  2. 데이터 창에서 다른 열을 선택하여 각 열에 대한 정보를 확인합니다.Select the different columns in the data window to view information about each one.

    각 행은 자동차를 나타내며, 각 자동차와 연결된 변수는 열로 표시됩니다.Each row represents an automobile, and the variables associated with each automobile appear as columns. 이 데이터 세트에는 205개 행과 26개 열이 있습니다.There are 205 rows and 26 columns in this dataset.

데이터 준비Prepare data

데이터 세트는 일반적으로 분석하기 전에 일부 전처리가 필요 합니다.Datasets typically require some preprocessing before analysis. 데이터 세트를 검사할 때 일부 누락된 값이 있을 수 있습니다.You might have noticed some missing values when you inspected the dataset. 모델에서 데이터를 올바르게 분석할 수 있도록 이러한 누락된 값을 정리해야 합니다.These missing values must be cleaned so that the model can analyze the data correctly.

열 제거Remove a column

모델이 학습되는 경우 누락된 데이터에 대한 작업을 수행해야 합니다.When you train a model, you have to do something about the data that's missing. 이 데이터 세트의 normalized-losses(정규화된 손실) 열에는 값이 많이 없으므로 모델에서 해당 열을 모두 제외합니다.In this dataset, the normalized-losses column is missing many values, so you will exclude that column from the model altogether.

  1. 캔버스 왼쪽의 모듈 팔레트에서 데이터 변환 섹션을 확장하여 데이터 세트에서 열 선택 모듈을 찾습니다.In the module palette to the left of the canvas, expand the Data Transformation section and find the Select Columns in Dataset module.

  2. 데이터 세트에서 열 선택 모듈을 캔버스로 끕니다.Drag the Select Columns in Dataset module onto the canvas. 데이터 세트 아래에 모듈을 놓습니다.Drop the module below the dataset module.

  3. 자동차 가격 데이터(원시) 데이터 세트를 데이터 세트에서 열 선택 에 연결합니다.Connect the Automobile price data (Raw) dataset to the Select Columns in Dataset module. 데이터 세트의 출력 포트(캔버스의 데이터 세트 아래쪽에 있는 작은 원)에서 데이터 세트에서 열 선택 의 입력 포트(모듈 위쪽에 있는 작은 원)로 끌어서 놓습니다.Drag from the dataset's output port, which is the small circle at the bottom of the dataset on the canvas, to the input port of Select Columns in Dataset, which is the small circle at the top of the module.

    한 모듈의 출력 포트를 다른 모듈의 입력 포트에 연결할 때 파이프라인을 통해 데이터 흐름을 만듭니다.You create a flow of data through your pipeline when you connect the output port of one module to an input port of another.

    모듈 연결

  4. 데이터 세트에서 열 선택 모듈을 선택합니다.Select the Select Columns in Dataset module.

  5. 캔버스의 오른쪽에 있는 모듈 세부 정보 창에서 열 편집 을 선택합니다.In the module details pane to the right of the canvas, select Edit column.

  6. 포함 옆에 있는 열 이름 드롭다운을 펼치고 모든 열 을 선택합니다.Expand the Column names drop down next to Include, and select All columns.

  7. + 를 선택하여 새 규칙을 추가합니다.Select the + to add a new rule.

  8. 드롭다운 메뉴에서 제외열 이름 을 선택합니다.From the drop-down menus, select Exclude and Column names.

  9. 텍스트 상자에 normalized-losses 를 입력합니다.Enter normalized-losses in the text box.

  10. 오른쪽 아래에서 저장 을 선택하여 열 선택기를 닫습니다.In the lower right, select Save to close the column selector.

    열 제외

  11. 데이터 세트에서 열 선택 모듈을 선택합니다.Select the Select Columns in Dataset module.

  12. 캔버스 오른쪽의 모듈 세부 정보 창에서 주석 텍스트 상자를 선택하고 정규화된 손실 제외(Exclude normalized losses)를 입력합니다.In the module details pane to the right of the canvas, select the Comment text box and enter Exclude normalized losses.

    파이프라인을 구성하는 데 도움이 되는 주석이 그래프에 표시됩니다.Comments will appear on the graph to help you organize your pipeline.

누락 데이터 정리Clean missing data

normalized-losses 열을 제거한 후에도 누락된 값이 데이터 세트에 여전히 있습니다.Your dataset still has missing values after you remove the normalized-losses column. 누락된 데이터 정리 모듈을 사용하여 남아 있는 누락된 데이터를 제거할 수 있습니다.You can remove the remaining missing data by using the Clean Missing Data module.

대부분의 모듈을 디자이너에서 사용하려면 입력 데이터에서 누락된 값을 반드시 정리해야 합니다.Cleaning the missing values from input data is a prerequisite for using most of the modules in the designer.

  1. 캔버스 왼쪽의 모듈 팔레트에서 데이터 변환 섹션을 펼치고 누락 데이터 정리 모듈을 찾습니다.In the module palette to the left of the canvas, expand the section Data Transformation, and find the Clean Missing Data module.

  2. 누락된 데이터 정리 모듈을 파이프라인 캔버스로 끌어서 놓습니다.Drag the Clean Missing Data module to the pipeline canvas. 데이터 세트에서 열 선택 모듈에 연결합니다.Connect it to the Select Columns in Dataset module.

  3. 누락 데이터 정리 모듈을 선택합니다.Select the Clean Missing Data module.

  4. 캔버스의 오른쪽에 있는 모듈 세부 정보 창에서 열 편집 을 선택합니다.In the module details pane to the right of the canvas, select Edit Column.

  5. 표시되는 정리할 열 창에서 포함 옆에 있는 드롭다운 메뉴를 확장합니다.In the Columns to be cleaned window that appears, expand the drop-down menu next to Include. 모든 열 을 선택합니다.Select, All columns

  6. 저장 을 선택합니다.Select Save

  7. 캔버스의 오른쪽에 있는 모듈 세부 정보 창의 정리 모드 에서 전체 행 제거 선택합니다.In the module details pane to the right of the canvas, select Remove entire row under Cleaning mode.

  8. 캔버스 오른쪽의 모듈 세부 정보 창에서 주석 상자를 선택하고 누락된 값 행 제거(Remove missing value rows)를 입력합니다.In the module details pane to the right of the canvas, select the Comment box, and enter Remove missing value rows.

    파이프라인이 이제 다음과 같이 표시됩니다.Your pipeline should now look something like this:

    Select-column

기계 학습 모델 학습Train a machine learning model

이제 데이터를 처리하기 위한 모듈이 준비되었으므로 학습 모듈을 설정할 수 있습니다.Now that you have the modules in place to process the data, you can set up the training modules.

숫자인 가격을 예측하려고 하므로 회귀 알고리즘을 사용할 수 있습니다.Because you want to predict price, which is a number, you can use a regression algorithm. 이 예제에서는 선형 회귀 모델을 사용합니다.For this example, you use a linear regression model.

데이터 분할Split the data

데이터 분할은 기계 학습에서 일반적인 작업입니다.Splitting data is a common task in machine learning. 데이터를 두 개의 개별 데이터 세트로 분할합니다.You will split your data into two separate datasets. 하나의 데이터 세트는 모델을 학습하고 다른 데이터 세트는 모델의 실행 정도를 테스트합니다.One dataset will train the model and the other will test how well the model performed.

  1. 모듈 팔레트에서 데이터 변환 섹션을 펼치고 데이터 분할 모듈을 찾습니다.In the module palette, expand the section Data Transformation and find the Split Data module.

  2. 데이터 분할 모듈을 파이프라인 캔버스로 끌어서 놓습니다.Drag the Split Data module to the pipeline canvas.

  3. 누락된 데이터 정리 모듈의 왼쪽 포트를 데이터 분할 모듈에 연결합니다.Connect the left port of the Clean Missing Data module to the Split Data module.

    중요

    누락된 데이터 정리 의 왼쪽 출력 포트가 데이터 분할 에 연결되어 있는지 확인합니다.Be sure that the left output ports of Clean Missing Data connects to Split Data. 왼쪽 포트는 정리된 데이터를 포함합니다.The left port contains the the cleaned data. 오른쪽 포트는 분리된 데이터를 포함합니다.The right port contains the discarted data.

  4. 데이터 분할 모듈을 선택합니다.Select the Split Data module.

  5. 캔버스 오른쪽의 모듈 세부 정보 창에서 첫 번째 출력 데이터 세트의 행 비율 을 0.7로 설정합니다.In the module details pane to the right of the canvas, set the Fraction of rows in the first output dataset to 0.7.

    그러면 모델의 학습을 위해 데이터의 70%를 분할하고, 테스트를 위해 30%를 분할합니다.This option splits 70 percent of the data to train the model and 30 percent for testing it. 70% 데이터 세트는 왼쪽 출력 포트를 통해 액세스할 수 있습니다.The 70 percent dataset will be accessible through the left output port. 나머지 데이터는 올바른 출력 포트를 통해 사용할 수 있습니다.The remaining data will be available through the right output port.

  6. 캔버스 오른쪽의 모듈 세부 정보 창에서 주석 상자를 선택하고 데이터 세트를 학습 세트(0.7) 및 테스트 세트(0.3)로 분할(Split the dataset into training set (0.7) and test set (0.3) )을 입력합니다.In the module details pane to the right of the canvas, select the Comment box, and enter Split the dataset into training set (0.7) and test set (0.3).

모델 학습Train the model

가격이 포함된 데이터 세트를 제공하여 모델을 학습합니다.Train the model by giving it a dataset that includes the price. 알고리즘은 학습 데이터에 표시된 대로 기능과 가격 간의 관계를 설명하는 모델을 생성합니다.The algorithm constructs a model that explains the relationship between the features and the price as presented by the training data.

  1. 모듈 팔레트에서 Machine Learning 알고리즘 을 펼칩니다.In the module palette, expand Machine Learning Algorithms.

    이 옵션은 학습 알고리즘을 초기화하는 데 사용할 수 있는 몇 가지 범주의 모듈을 표시합니다.This option displays several categories of modules that you can use to initialize learning algorithms.

  2. 회귀 > 선형 회귀 를 선택하여 파이프라인 캔버스로 끌어서 놓습니다.Select Regression > Linear Regression, and drag it to the pipeline canvas.

  3. 모듈 팔레트에서 모듈 학습(Module training) 섹션을 펼치고 모델 학습 모듈을 캔버스로 끌어서 놓습니다.In the module palette, expand the section Module training, and drag the Train Model module to the canvas.

  4. 선형 회귀 모듈의 출력을 모델 학습 모듈의 왼쪽 입력에 연결합니다.Connect the output of the Linear Regression module to the left input of the Train Model module.

  5. 데이터 분할 모듈의 학습 데이터 출력(왼쪽 포트)을 모델 학습 모듈의 오른쪽 입력에 연결합니다.Connect the training data output (left port) of the Split Data module to the right input of the Train Model module.

    중요

    데이터 분할 의 왼쪽 출력 포트가 학습 모델 에 연결되어 있는지 확인합니다.Be sure that the left output ports of Split Data connects to Train Model. 왼쪽 포트는 학습 집합을 포함합니다.The left port contains the the training set. 오른쪽 포트는 테스트 집합을 포함합니다.The right port contains the test set.

    모델 학습 모듈의 올바른 구성을 보여주는 스크린샷. 선형 회귀 모듈은 모델 학습 모듈의 왼쪽 포트에 연결되며 데이터 분할 모듈은 모델 학습의 오른쪽 포트에 연결됩니다.

  6. 모델 학습 모듈을 선택합니다.Select the Train Model module.

  7. 캔버스의 오른쪽에 있는 모듈 세부 정보 창에서 열 편집 선택기를 선택합니다.In the module details pane to the right of the canvas, select Edit column selector.

  8. 레이블 열 대화 상자에서 드롭다운 메뉴를 확장하고, 열 이름 을 선택합니다.In the Label column dialog box, expand the drop-down menu and select Column names.

  9. 텍스트 상자에 가격 을 입력하여 모델이 예측할 값을 지정합니다.In the text box, enter price to specify the value that your model is going to predict.

    중요

    열 이름을 정확하게 입력해야 합니다.Make sure you enter the column name exactly. 가격 을 대문자로 하지 마세요.Do not capitalize price.

    파이프라인은 다음과 같습니다.Your pipeline should look like this:

    모델 학습 모듈을 추가한 후에 파이프라인의 올바른 구성을 보여주는 스크린샷.

모델 점수 매기기 모듈 추가Add the Score Model module

데이터의 70%를 사용하여 모델을 학습시킨 후 모델의 작동 방식을 확인하기 위해 나머지 30%의 점수를 매기는 데 이를 사용할 수 있습니다.After you train your model by using 70 percent of the data, you can use it to score the other 30 percent to see how well your model functions.

  1. 검색 상자에 모델 점수 매기기 를 입력하여 점수 매기기 모듈을 찾습니다.Enter score model in the search box to find the Score Model module. 해당 모듈을 파이프라인 캔버스로 끌어서 놓습니다.Drag the module to the pipeline canvas.

  2. 모델 학습 모듈의 출력을 모델 점수 매기기 의 왼쪽 입력 포트에 연결합니다.Connect the output of the Train Model module to the left input port of Score Model. 데이터 분할 모듈의 테스트 데이터 출력(오른쪽 포트)을 모델 점수 매기기 의 오른쪽 입력 포트에 연결합니다.Connect the test data output (right port) of the Split Data module to the right input port of Score Model.

모델 평가 모듈 추가Add the Evaluate Model module

모델 평가 모듈을 사용하여 모델이 테스트 데이터 세트의 점수를 얼마나 잘 얻었는지 평가합니다.Use the Evaluate Model module to evaluate how well your model scored the test dataset.

  1. 검색 상자에 평가 를 입력하여 모델 평가 모듈을 찾습니다.Enter evaluate in the search box to find the Evaluate Model module. 해당 모듈을 파이프라인 캔버스로 끌어서 놓습니다.Drag the module to the pipeline canvas.

  2. 모델 점수 매기기 모듈의 출력을 모델 평가 의 왼쪽 입력에 연결합니다.Connect the output of the Score Model module to the left input of Evaluate Model.

    최종 파이프라인은 다음과 같습니다.The final pipeline should look something like this:

    파이프라인의 올바른 구성을 보여주는 스크린샷.

파이프라인 제출Submit the pipeline

파이프라인이 모두 설정되었으므로 파이프라인 실행을 제출 제출하여 기계 학습 모델을 학습시킬 수 있습니다.Now that your pipeline is all setup, you can submit a pipeline run to train your machine learning model. 개발 중에 파이프라인에 대한 변경 내용을 검토하는 데 사용할 수 있는 임의의 지점에서 유효한 파이프라인 실행을 제출할 수 있습니다.You can submit a valid pipeline run at any point, which can be used to review changes to your pipeline during development.

  1. 캔버스 위쪽에서 제출 을 선택합니다.At the top of the canvas, select Submit.

  2. 파이프라인 실행 설정 대화 상자에서 새로 만들기 를 선택합니다.In the Set up pipeline run dialog box, select Create new.

    참고

    실험 그룹은 유사한 파이프라인을 함께 실행합니다.Experiments group similar pipeline runs together. 파이프라인을 여러 번 실행하는 경우 연속 실행에 대해 동일한 실험을 선택할 수 있습니다.If you run a pipeline multiple times, you can select the same experiment for successive runs.

    1. 새 실험 이름Tutorial-CarPrices 를 입력합니다.For New experiment Name, enter Tutorial-CarPrices.

    2. 제출 을 선택합니다.Select Submit.

    캔버스의 오른쪽 위에서 실행 상태와 세부 정보를 볼 수 있습니다.You can view run status and details at the top right of the canvas.

    첫 번째 실행인 경우 파이프라인이 실행을 완료하는 데 최대 20분이 걸릴 수 있습니다.If this is the first run, it may take up to 20 minutes for your pipeline to finish running. 기본 컴퓨팅 설정의 최소 노드 크기는 0입니다. 즉, 디자이너가 유휴 상태가 된 후에 리소스를 할당해야 합니다.The default compute settings have a minimum node size of 0, which means that the designer must allocate resources after being idle. 컴퓨팅 리소스가 이미 할당되었기 때문에 반복되는 파이프라인 실행은 시간이 덜 걸립니다.Repeated pipeline runs will take less time since the compute resources are already allocated. 또한 디자이너는 각 모듈에 대해 캐시된 결과를 사용하여 효율성을 더욱 향상시킵니다.Additionally, the designer uses cached results for each module to further improve efficiency.

채점된 레이블 보기View scored labels

실행이 완료되면 파이프라인 실행의 결과를 확인할 수 있습니다.After the run completes, you can view the results of the pipeline run. 먼저 회귀 모델에 의해 생성된 예측을 살펴봅니다.First, look at the predictions generated by the regression model.

  1. 모델 점수 매기기 모듈을 마우스 오른쪽 단추로 클릭하고 시각화 > 점수가 매겨진 데이터 세트 를 선택하여 출력을 확인합니다.Right-click the Score Model module, and select Visualize > Scored dataset to view its output.

    여기서는 테스트 데이터에서 예측된 가격과 실제 가격을 확인할 수 있습니다.Here you can see the predicted prices and the actual prices from the testing data.

    점수를 매긴 레이블 열이 강조 표시된 출력 시각화의 스크린샷

모델 평가Evaluate models

모델 평가 를 사용하여 테스트 데이터 세트에서 학습된 모델이 얼마나 잘 수행되었는지 확인합니다.Use the Evaluate Model to see how well the trained model performed on the test dataset.

  1. 모델 평가 모듈을 마우스 오른쪽 단추로 클릭하고 시각화 > 평가 결과 를 선택하여 출력을 확인합니다.Right-click the Evaluate Model module and select Visualize > Evaluation results to view its output.

모델에 대한 다음 통계가 표시됩니다.The following statistics are shown for your model:

  • MAE(절대 평균 오차) : 절대값 평균의 오차입니다.Mean Absolute Error (MAE): The average of absolute errors. 오차는 예측 값과 실제 값 사이의 차이입니다.An error is the difference between the predicted value and the actual value.
  • 제곱 평균 오차의 제곱근(RMSE) : 테스트 데이터 세트에 대해 예측한 제곱 평균 오차의 제곱근입니다.Root Mean Squared Error (RMSE): The square root of the average of squared errors of predictions made on the test dataset.
  • 상대 절대 오차: 실제 값과 모든 실제 값 평균 사이의 절대값 차에 대해 상대적인 절대 평균 오차입니다.Relative Absolute Error: The average of absolute errors relative to the absolute difference between actual values and the average of all actual values.
  • 상대 제곱 오차: 실제 값과 모든 실제 값 평균 사이의 제곱 차에 대해 상대적인 제곱 평균 오차입니다.Relative Squared Error: The average of squared errors relative to the squared difference between the actual values and the average of all actual values.
  • 결정 계수: R 제곱 값이라고도 하며, 모델이 데이터에 얼마나 적합한지 나타내는 통계 메트릭입니다.Coefficient of Determination: Also known as the R squared value, this statistical metric indicates how well a model fits the data.

각 오차 통계는 작을수록 좋습니다.For each of the error statistics, smaller is better. 값이 작을수록 예측이 실제 값에 더 가깝다는 것을 나타냅니다.A smaller value indicates that the predictions are closer to the actual values. 결정 계수의 경우 값이 1(1.0)에 가까울수록 더 나은 예측입니다.For the coefficient of determination, the closer its value is to one (1.0), the better the predictions.

리소스 정리Clean up resources

자습서의 2 부에서모델 배포를 계속 진행하려면 이 섹션을 건너뜁니다.Skip this section if you want to continue on with part 2 of the tutorial, deploying models.

중요

직접 만든 리소스는 다른 Azure Machine Learning 자습서 및 방법 문서에 대한 필수 조건으로 사용할 수 있습니다.You can use the resources that you created as prerequisites for other Azure Machine Learning tutorials and how-to articles.

모든 항목 삭제Delete everything

사용자가 만든 항목을 사용하지 않으려면 요금이 발생하지 않도록 전체 리소스 그룹을 삭제하세요.If you don't plan to use anything that you created, delete the entire resource group so you don't incur any charges.

  1. Azure Portal의 창 왼쪽에서 리소스 그룹을 선택합니다.In the Azure portal, select Resource groups on the left side of the window.

    Azure Portal에서 리소스 그룹 삭제

  2. 목록에서 만든 리소스 그룹을 선택합니다.In the list, select the resource group that you created.

  3. 리소스 그룹 삭제를 선택합니다.Select Delete resource group.

리소스 그룹을 삭제하면 디자이너에서 만든 모든 리소스도 삭제됩니다.Deleting the resource group also deletes all resources that you created in the designer.

개별 자산 삭제Delete individual assets

실험을 만든 디자이너에서 개별 자산을 선택한 다음, 삭제 단추를 선택하여 자산을 삭제합니다.In the designer where you created your experiment, delete individual assets by selecting them and then selecting the Delete button.

여기에서 만든 컴퓨팅 대상은 사용하지 않을 경우 제로 노드로 자동으로 크기 조정됩니다.The compute target that you created here automatically autoscales to zero nodes when it's not being used. 이 작업은 요금을 최소화하기 위해 수행됩니다.This action is taken to minimize charges. 컴퓨팅 대상을 삭제하려는 경우 다음 단계를 수행합니다. If you want to delete the compute target, take these steps:

자산 삭제

각 데이터 세트를 선택하고 등록 취소를 선택하여 작업 영역에서 데이터 세트를 등록 취소할 수 있습니다.You can unregister datasets from your workspace by selecting each dataset and selecting Unregister.

데이터 세트 등록 취소

데이터 세트를 삭제하려면 Azure Portal 또는 Azure Storage Explorer를 사용하여 스토리지 계정으로 이동하여 해당 자산을 수동으로 삭제합니다.To delete a dataset, go to the storage account by using the Azure portal or Azure Storage Explorer and manually delete those assets.

다음 단계Next steps

2부에서는 모델을 실시간 엔드포인트로 배포하는 방법에 대해 알아봅니다.In part two, you'll learn how to deploy your model as a real-time endpoint.