Azure Machine Learning 디자이너의 파이프라인 및 데이터 세트 예제Example pipelines & datasets for Azure Machine Learning designer

Azure Machine Learning 디자이너에서 기본 제공되는 예제를 사용하여 고유한 기계 학습 파이프라인 빌드를 신속하게 시작합니다.Use the built-in examples in Azure Machine Learning designer to quickly get started building your own machine learning pipelines. Azure Machine Learning 디자이너 GitHub 리포지토리는 몇 가지 일반적인 기계 학습 시나리오를 이해하는 데 도움이 되는 자세한 설명서를 포함합니다.The Azure Machine Learning designer GitHub repository contains detailed documentation to help you understand some common machine learning scenarios.

필수 구성 요소Prerequisites

  • Azure 구독An Azure subscription. Azure 구독이 없는 경우 무료 계정을 만듭니다.If you don't have an Azure subscription, create a free account
  • Azure Machine Learning 작업 영역An Azure Machine Learning workspace

중요

스튜디오 또는 디자이너의 단추와 같이 이 문서에 언급된 그래픽 요소가 보이지 않는 경우 작업 영역에 대한 적절한 사용 권한이 없는 것일 수 있습니다.If you do not see graphical elements mentioned in this document, such as buttons in studio or designer, you may not have the right level of permissions to the workspace. Azure 구독 관리자에게 문의하여 적절한 액세스 권한이 부여되었는지 확인하세요.Please contact your Azure subscription administrator to verify that you have been granted the correct level of access. 자세한 내용은 사용자 및 역할 관리를 참조하세요.For more information, see Manage users and roles.

샘플 파이프라인 사용Use sample pipelines

디자이너는 샘플 파이프라인의 복사본을 스튜디오 작업 영역에 저장합니다.The designer saves a copy of the sample pipelines to your studio workspace. 파이프라인을 편집하여 사용자의 요구에 맞게 조정하고 사용자의 파이프라인으로 저장할 수 있습니다.You can edit the pipeline to adapt it to your needs and save it as your own. 이를 시작점으로 사용하여 프로젝트를 신속하게 시작합니다.Use them as a starting point to jumpstart your projects.

디자이너 샘플을 사용하는 방법은 다음과 같습니다.Here's how to use a designer sample:

  1. ml.azure.com에 로그인하고, 사용하려는 작업 영역을 선택합니다.Sign in to ml.azure.com, and select the workspace you want to work with.

  2. 디자이너 를 선택합니다.Select Designer.

  3. 새 파이프라인 섹션에서 샘플 파이프라인을 선택합니다.Select a sample pipeline under the New pipeline section.

    샘플의 전체 목록을 보려면 더 많은 샘플 표시 를 선택합니다.Select Show more samples for a complete list of samples.

  4. 파이프라인을 실행하려면 먼저 파이프라인을 실행할 기본 컴퓨팅 대상을 설정해야 합니다.To run a pipeline, you first have to set default compute target to run the pipeline on.

    1. 캔버스 오른쪽에 있는 설정 창에서 컴퓨팅 대상 선택 을 선택합니다.In the Settings pane to the right of the canvas, select Select compute target.

    2. 표시되는 대화 상자에서 기존 컴퓨팅 대상을 선택하거나 새로 만듭니다.In the dialog that appears, select an existing compute target or create a new one. 저장 을 선택합니다.Select Save.

    3. 캔버스 맨 위에 있는 제출 을 선택하여 파이프라인 실행을 제출합니다.Select Submit at the top of the canvas to submit a pipeline run.

    샘플 파이프라인 및 컴퓨팅 설정에 따라 실행을 완료하는 데 다소 시간이 걸릴 수 있습니다.Depending on the sample pipeline and compute settings, runs may take some time to complete. 기본 컴퓨팅 설정의 최소 노드 크기는 0입니다. 즉, 디자이너가 유휴 상태가 된 후에 리소스를 할당해야 합니다.The default compute settings have a minimum node size of 0, which means that the designer must allocate resources after being idle. 컴퓨팅 리소스가 이미 할당되었기 때문에 반복되는 파이프라인 실행은 시간이 덜 걸립니다.Repeated pipeline runs will take less time since the compute resources are already allocated. 또한 디자이너는 각 모듈에 대해 캐시된 결과를 사용하여 효율성을 더욱 향상시킵니다.Additionally, the designer uses cached results for each module to further improve efficiency.

  5. 파이프라인 실행이 완료되면 파이프라인을 검토하고 각 모듈의 출력을 확인하여 자세히 알아볼 수 있습니다.After the pipeline finishes running, you can review the pipeline and view the output for each module to learn more. 다음 단계를 사용하여 모듈 출력을 봅니다.Use the following steps to view module outputs:

    1. 표시하려는 출력의 캔버스에서 모듈을 마우스 오른쪽 단추로 클릭합니다.Right-click the module in the canvas whose output you'd like to see.
    2. 시각화 를 선택합니다.Select Visualize.

    가장 일반적인 기계 학습 시나리오 중 일부에 대한 샘플을 시작점으로 사용합니다.Use the samples as starting points for some of the most common machine learning scenarios.

회귀Regression

이러한 기본 제공 회귀 샘플을 살펴보세요.Explore these built-in regression samples.

샘플 제목Sample title DescriptionDescription
회귀 - 자동차 가격 예측(기본)Regression - Automobile Price Prediction (Basic) 선형 회귀를 사용하여 자동차 가격을 예측합니다.Predict car prices using linear regression.
회귀 - 자동차 가격 예측(고급)Regression - Automobile Price Prediction (Advanced) 의사 결정 포리스트와 향상된 의사 결정 트리 회귀 변수를 사용하여 자동차 가격을 예측합니다.Predict car prices using decision forest and boosted decision tree regressors. 모델을 비교하여 가장 적합한 알고리즘을 찾습니다.Compare models to find the best algorithm.

분류Classification

이러한 기본 제공 분류 샘플을 살펴보세요.Explore these built-in classification samples. 샘플을 열고 디자이너에서 모듈 주석을 보면 샘플에 대해 자세히 알아볼 수 있습니다.You can learn more about the samples by opening the samples and viewing the module comments in the designer.

샘플 제목Sample title DescriptionDescription
기능 선택을 통한 이진 분류 - 수입 예측Binary Classification with Feature Selection - Income Prediction 2클래스 향상된 의사 결정 트리를 사용하여 수입을 높음 또는 낮음으로 예측합니다.Predict income as high or low, using a two-class boosted decision tree. 피어슨 상관 관계를 사용하여 기능을 선택합니다.Use Pearson correlation to select features.
사용자 지정 Python 스크립트를 통한 이진 분류 - 신용 위험 예측Binary Classification with custom Python script - Credit Risk Prediction 신용 애플리케이션을 위험 수준 높음 또는 위험 수준 낮음으로 분류합니다.Classify credit applications as high or low risk. Python 스크립트 실행 모듈을 사용하여 데이터에 가중치를 부여합니다.Use the Execute Python Script module to weight your data.
이진 분류 - 고객 관계 예측Binary Classification - Customer Relationship Prediction 2클래스 향상된 의사 결정 트리를 사용하여 고객 이탈을 예측합니다.Predict customer churn using two-class boosted decision trees. SMOTE를 사용하여 편향 데이터를 샘플링합니다.Use SMOTE to sample biased data.
텍스트 분류 - Wikipedia SP 500 데이터 세트Text Classification - Wikipedia SP 500 Dataset 다중 클래스 로지스틱 회귀를 사용하여 Wikipedia 문서의 회사 유형을 분류합니다.Classify company types from Wikipedia articles with multiclass logistic regression.
다중 클래스 분류 - 문자 인식Multiclass Classification - Letter Recognition 작성된 문자를 분류하는 이진 분류자의 앙상블을 만듭니다.Create an ensemble of binary classifiers to classify written letters.

Computer VisionComputer vision

기본 제공 컴퓨터 비전 예제를 살펴보세요.Explore these built-in computer vision samples. 샘플을 열고 디자이너에서 모듈 주석을 보면 샘플에 대해 자세히 알아볼 수 있습니다.You can learn more about the samples by opening the samples and viewing the module comments in the designer.

샘플 제목Sample title DescriptionDescription
DenseNet을 통한 이미지 분류Image Classification using DenseNet 컴퓨터 비전 모듈을 통해 PyTorch DenseNet을 기반으로 하여 이미지 분류 모델을 빌드합니다.Use computer vision modules to build image classification model based on PyTorch DenseNet.

추천Recommender

이러한 기본 제공 추천 샘플을 살펴보세요.Explore these built-in recommender samples. 샘플을 열고 디자이너에서 모듈 주석을 보면 샘플에 대해 자세히 알아볼 수 있습니다.You can learn more about the samples by opening the samples and viewing the module comments in the designer.

샘플 제목Sample title DescriptionDescription
광범위한 심층 분석 기반 추천 - 식당 등급 예측Wide & Deep based Recommendation - Restaurant Rating Prediction 식당/사용자 특성 및 등급에서 식당 추천 엔진을 빌드합니다.Build a restaurant recommender engine from restaurant/user features and ratings.
권장 사항 - 영화 등급 트윗Recommendation - Movie Rating Tweets 영화/사용자 기능 및 등급에서 영화 추천 엔진을 빌드합니다.Build a movie recommender engine from movie/user features and ratings.

유틸리티Utility

기계 학습 유틸리티 및 기능을 보여 주는 샘플에 대해 자세히 알아보세요.Learn more about the samples that demonstrate machine learning utilities and features. 샘플을 열고 디자이너에서 모듈 주석을 보면 샘플에 대해 자세히 알아볼 수 있습니다.You can learn more about the samples by opening the samples and viewing the module comments in the designer.

샘플 제목Sample title DescriptionDescription
Vowpal Wabbit 모델을 통한 이진 분류 - 성인 수입 예측Binary Classification using Vowpal Wabbit Model - Adult Income Prediction Vowpal Wabbit은 온라인, 해싱, allreduce, 감소, learning2search, 활성 및 대화형 학습과 같은 기술을 사용하여 기계 학습의 경계를 넓히고 있는 기계 학습 시스템입니다.Vowpal Wabbit is a machine learning system which pushes the frontier of machine learning with techniques such as online, hashing, allreduce, reductions, learning2search, active, and interactive learning. 이 샘플에서는 Vowpal Wabbit 모델을 통해 이진 분류 모델을 빌드하는 방법을 보여 줍니다.This sample shows how to use Vowpal Wabbit model to build binary classification model.
사용자 지정 R 스크립트 사용 - 항공편 지연 예측Use custom R script - Flight Delay Prediction 사용자 지정 R 스크립트를 통해 예약된 승객 항공편이 15분 넘게 지연되는지 여부를 예측합니다.Use customized R script to predict if a scheduled passenger flight will be delayed by more than 15 minutes.
이진 분류자 교차 유효성 검사 - 성인 수입 예측Cross Validation for Binary Classification - Adult Income Prediction 교차 유효성 검사를 사용하여 성인 수입에 대한 이진 분류자를 빌드합니다.Use cross validation to build a binary classifier for adult income.
순열 기능 중요도Permutation Feature Importance 순열 기능 중요도를 사용하여 테스트 데이터 세트의 중요도 점수를 계산합니다.Use permutation feature importance to compute importance scores for the test dataset.
이진 분류자 매개 변수 튜닝 - 성인 수입 예측Tune Parameters for Binary Classification - Adult Income Prediction 모델 하이퍼 매개 변수 튜닝을 사용하여 이진 분류자를 빌드하기 위한 최적의 하이퍼 매개 변수를 찾습니다.Use Tune Model Hyperparameters to find optimal hyperparameters to build a binary classifier.

데이터 세트Datasets

Azure Machine Learning 디자이너에서 새 파이프라인을 만들 때 다양한 샘플 데이터 세트가 기본적으로 포함됩니다.When you create a new pipeline in Azure Machine Learning designer, a number of sample datasets are included by default. 이러한 샘플 데이터 세트는 디자이너 홈페이지의 샘플 파이프라인에서 사용됩니다.These sample datasets are used by the sample pipelines in the designer homepage.

샘플 데이터 세트는 데이터 세트-샘플 범주에서 사용할 수 있습니다.The sample datasets are available under Datasets-Samples category. 디자이너의 캔버스 왼쪽에 있는 모듈 팔레트에서 찾을 수 있습니다.You can find this in the module palette to the left of the canvas in the designer. 캔버스로 끌어와 이러한 데이터 세트를 파이프라인에서 사용할 수 있습니다.You can use any of these datasets in your own pipeline by dragging it to the canvas.

데이터 세트 이름    Dataset name     데이터 세트 설명Dataset description
성인 인구 조사 소득 이진 분류 데이터 세트Adult Census Income Binary Classification dataset 조정 소득 지수가 100보다 큰 16세 이상 취업한 성인을 대상으로 한 1994 인구 조사 데이터베이스의 하위 집합입니다.A subset of the 1994 Census database, using working adults over the age of 16 with an adjusted income index of > 100.
사용 현황 인구 통계를 기반으로 사람을 분류하여 개인의 소득이 연간 50,000을 초과할지 예측합니다.Usage: Classify people using demographics to predict whether a person earns over 50K a year.
관련 조사: Kohavi, R., Becker, B.,(1996).Related Research: Kohavi, R., Becker, B., (1996). UCI Machine Learning 리포지토리UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer ScienceIrvine, CA: University of California, School of Information and Computer Science
자동차 가격 데이터(원시)Automobile price data (Raw) 가격, 실린더 및 MPG 수와 같은 기능, 보험 위험 점수를 포함하여 상표 및 모델별 자동차에 대한 정보입니다.Information about automobiles by make and model, including the price, features such as the number of cylinders and MPG, as well as an insurance risk score.
위험 점수는 처음에 자동차 가격과 연관이 있습니다.The risk score is initially associated with auto price. 그런 다음 보험 회계사에게 기호화로 알려진 프로세스에서 실제 위험에 맞게 조정됩니다.It is then adjusted for actual risk in a process known to actuaries as symboling. +3 값은 자동차가 위험함을 나타내고 -3 값은 안전함을 나타냅니다.A value of +3 indicates that the auto is risky, and a value of -3 that it is probably safe.
사용 현황 회귀 및 다변수 분류를 사용하여 기능별 위험 점수를 예측합니다.Usage: Predict the risk score by features, using regression or multivariate classification.
관련 조사: Schlimmer, J.C.Related Research: Schlimmer, J.C. (1987).(1987). UCI Machine Learning 리포지토리UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science.Irvine, CA: University of California, School of Information and Computer Science.
CRM 욕구 레이블 공유CRM Appetency Labels Shared KDD Cup 2009 고객 관계 예측 챌린지의 레이블(orange_small_train_appetency.labels).Labels from the KDD Cup 2009 customer relationship prediction challenge (orange_small_train_appetency.labels).
CRM 이탈 레이블 공유CRM Churn Labels Shared KDD Cup 2009 고객 관계 예측 챌린지의 레이블(orange_small_train_churn.labels).Labels from the KDD Cup 2009 customer relationship prediction challenge (orange_small_train_churn.labels).
CRM 데이터 세트 공유CRM Dataset Shared 이 데이터는 KDD Cup 2009 고객 관계 예측 챌린지(orange_small_train.data.zip)에서 제공됩니다.This data comes from the KDD Cup 2009 customer relationship prediction challenge (orange_small_train.data.zip).
데이터 세트에는 French Telecom 회사인 Orange의 고객 50,000명이 포함됩니다.The dataset contains 50K customers from the French Telecom company Orange. 각 고객은 익명으로 처리되는 230개 기능을 가지며, 이 중 190개는 숫자이고 40개는 범주입니다.Each customer has 230 anonymized features, 190 of which are numeric and 40 are categorical. 기능이 매우 희박합니다.The features are very sparse.
CRM 상향 판매 레이블 공유CRM Upselling Labels Shared KDD Cup 2009 고객 관계 예측 챌린지의 레이블(orange_large_train_upselling.labels)Labels from the KDD Cup 2009 customer relationship prediction challenge (orange_large_train_upselling.labels
비행 지연 데이터Flight Delays Data 미국 운수부 TranStats 데이터 컬렉션에서 가져온 여객기 운항정시성 데이터(정시)Passenger flight on-time performance data taken from the TranStats data collection of the U.S. Department of Transportation (On-Time).
데이터 세트는 2013년 4월-10월 기간에 해당합니다.The dataset covers the time period April-October 2013. 디자이너로 업로드하기 전에 데이터 세트는 다음과 같이 처리되었습니다.Before uploading to the designer, the dataset was processed as follows:
- 데이터 세트는 미국 본토에서 비행이 가장 많은 공항 70곳만을 포함하도록 필터링되었습니다.- The dataset was filtered to cover only the 70 busiest airports in the continental US
- 취소된 비행은 15분 초과 지연으로 레이블이 지정되었습니다.- Canceled flights were labeled as delayed by more than 15 minutes
- 우회 비행은 필터링되었습니다.- Diverted flights were filtered out
- 다음 열이 선택되었습니다. Year, Month, DayofMonth, DayOfWeek, Carrier, OriginAirportID, DestAirportID, CRSDepTime, DepDelay, DepDel15, CRSArrTime, ArrDelay, ArrDel15, Canceled- The following columns were selected: Year, Month, DayofMonth, DayOfWeek, Carrier, OriginAirportID, DestAirportID, CRSDepTime, DepDelay, DepDel15, CRSArrTime, ArrDelay, ArrDel15, Canceled
독일 신용 카드 UCI 데이터 세트German Credit Card UCI dataset german.data 파일을 사용한 UCI Statlog(독일 신용 카드) 데이터 세트(Statlog+German+Credit+Data).The UCI Statlog (German Credit Card) dataset (Statlog+German+Credit+Data), using the german.data file.
데이터 세트는 특성 집합으로 설명된 사람을 낮은 신용 위험 또는 높은 신용 위험으로 분류합니다.The dataset classifies people, described by a set of attributes, as low or high credit risks. 각 예제는 개인을 나타냅니다.Each example represents a person. 숫자 및 범주의 기능 20개와 이진 레이블(신용 위험 값)이 있습니다.There are 20 features, both numerical and categorical, and a binary label (the credit risk value). 높은 신용 위험 항목의 레이블은 2이고, 낮은 신용 위험 항목의 레이블은 1입니다.High credit risk entries have label = 2, low credit risk entries have label = 1. 낮은 위험 예제를 높은 위험으로 잘못 분류한 비용은 1이지만, 높은 위험 예제를 낮은 위험으로 분류한 비용은 5입니다.The cost of misclassifying a low risk example as high is 1, whereas the cost of misclassifying a high risk example as low is 5.
IMDB 영화 제목IMDB Movie Titles 이 데이터 세트에는 Twitter 트윗에서 평가된 영화에 대한 정보가 포함됩니다. (IMDB 영화 ID, 영화 제목, 장르 및 제작 연도)The dataset contains information about movies that were rated in Twitter tweets: IMDB movie ID, movie name, genre, and production year. 이 데이터 세트에는 170,000 개의 영화가 있습니다.There are 17K movies in the dataset. 데이터 세트는 논문 "S.The dataset was introduced in the paper "S. Dooms, T. De Pessemier 및 L. Martens.Dooms, T. De Pessemier and L. Martens. MovieTweetings: a Movie Rating Dataset Collected From Twitter.MovieTweetings: a Movie Rating Dataset Collected From Twitter. Workshop on Crowdsourcing and Human Computation for Recommender Systems, CrowdRec at RecSys 2013"에서 소개되었습니다.Workshop on Crowdsourcing and Human Computation for Recommender Systems, CrowdRec at RecSys 2013."
영화 등급Movie Ratings 이 데이터 세트는 Movie Tweetings 데이터 세트의 확장된 버전입니다.The dataset is an extended version of the Movie Tweetings dataset. 이 데이터 세트에는 잘 구성된 Twitter 트윗에서 추출한 170,000개의 영화 등급이 있습니다.The dataset has 170K ratings for movies, extracted from well-structured tweets on Twitter. 각 인스턴스는 트윗을 나타내며 사용자 ID, IMDB 영화 ID, 등급, 타임 스탬프, 해당 트윗에 대한 즐겨찾기 수, 해당 트윗의 리트윗 수 등과 같은 튜플입니다.Each instance represents a tweet and is a tuple: user ID, IMDB movie ID, rating, timestamp, number of favorites for this tweet, and number of retweets of this tweet. 이 데이터 세트는 A. Said, S. Dooms, B. Loni 및 D. Tikk가 Recommender Systems Challenge 2014를 위해 제공했습니다.The dataset was made available by A. Said, S. Dooms, B. Loni and D. Tikk for Recommender Systems Challenge 2014.
날씨 데이터 세트Weather Dataset NOAA에서 제공한 시간별 지상 기상 관측(201304부터 201310까지의 병합된 데이터).Hourly land-based weather observations from NOAA (merged data from 201304 to 201310).
기상 데이터는 2013년 4월-10월 기간에 공항 기상 관측소에서 수행된 관측을 포함합니다.The weather data covers observations made from airport weather stations, covering the time period April-October 2013. 디자이너로 업로드하기 전에 데이터 세트는 다음과 같이 처리되었습니다.Before uploading to the designer, the dataset was processed as follows:
- 날씨 관측소 ID가 해당 공항 ID에 매핑되었습니다.- Weather station IDs were mapped to corresponding airport IDs
- 비행이 가장 많은 공항 70곳과 연계되지 않은 기상 관측소가 필터링되었습니다.- Weather stations not associated with the 70 busiest airports were filtered out
- Date 열은 Year, Month 및 Day 열로 분할되었습니다.- The Date column was split into separate Year, Month, and Day columns
- 다음 열이 선택되었습니다. AirportID, Year, Month, Day, Time, TimeZone, SkyCondition, Visibility, WeatherType, DryBulbFarenheit, DryBulbCelsius, WetBulbFarenheit, WetBulbCelsius, DewPointFarenheit, DewPointCelsius, RelativeHumidity, WindSpeed, WindDirection, ValueForWindCharacter, StationPressure, PressureTendency, PressureChange, SeaLevelPressure, RecordType, HourlyPrecip, Altimeter- The following columns were selected: AirportID, Year, Month, Day, Time, TimeZone, SkyCondition, Visibility, WeatherType, DryBulbFarenheit, DryBulbCelsius, WetBulbFarenheit, WetBulbCelsius, DewPointFarenheit, DewPointCelsius, RelativeHumidity, WindSpeed, WindDirection, ValueForWindCharacter, StationPressure, PressureTendency, PressureChange, SeaLevelPressure, RecordType, HourlyPrecip, Altimeter
Wikipedia SP 500 데이터 세트Wikipedia SP 500 Dataset 데이터는 XML 데이터로 저장되는 각 S&P 500 회사의 자료에 따라 Wikipedia(https://www.wikipedia.org/) 에서 파생됩니다.Data is derived from Wikipedia (https://www.wikipedia.org/) based on articles of each S&P 500 company, stored as XML data.
디자이너로 업로드하기 전에 데이터 세트는 다음과 같이 처리되었습니다.Before uploading to the designer, the dataset was processed as follows:
- 각 특정 회사에 대한 텍스트 콘텐츠 추출- Extract text content for each specific company
- 위치 형식 지정 제거- Remove wiki formatting
- 영숫자가 아닌 문자 제거- Remove non-alphanumeric characters
- 모든 텍스트를 소문자로 변환- Convert all text to lowercase
- 알려진 회사 범주가 추가됨- Known company categories were added
일부 회사의 경우 문서를 찾을 수 없으므로 레코드 수가 500개 미만입니다.Note that for some companies an article could not be found, so the number of records is less than 500.
음식점 기능 데이터Restaurant Feature Data 음식점 및 음식 종료, 식사 스타일, 위치 같은 기능에 대한 메타데이터 집합입니다.A set of metadata about restaurants and their features, such as food type, dining style, and location.
사용 현황 이 데이터 세트를 다른 두 가지 음식점 데이터 세트와 함께 사용하여 추천 시스템을 학습 및 테스트합니다.Usage: Use this dataset, in combination with the other two restaurant datasets, to train and test a recommender system.
관련 조사: Bache, K. 및 Lichman, M. (2013).Related Research: Bache, K. and Lichman, M. (2013). UCI Machine Learning 리포지토리UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science.Irvine, CA: University of California, School of Information and Computer Science.
음식점 등급Restaurant Ratings 0-2점 사이에 사용자가 제공한 음식점 등급을 포함합니다.Contains ratings given by users to restaurants on a scale from 0 to 2.
사용 현황 이 데이터 세트를 다른 두 가지 음식점 데이터 세트와 함께 사용하여 추천 시스템을 학습 및 테스트합니다.Usage: Use this dataset, in combination with the other two restaurant datasets, to train and test a recommender system.
관련 조사: Bache, K. 및 Lichman, M. (2013).Related Research: Bache, K. and Lichman, M. (2013). UCI Machine Learning 리포지토리UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science.Irvine, CA: University of California, School of Information and Computer Science.
음식점 고객 데이터Restaurant Customer Data 인구 통계 및 선호도를 비롯한 고객에 대한 메타데이터 집합입니다.A set of metadata about customers, including demographics and preferences.
사용 현황 이 데이터 세트를 다른 두 가지 음식점 데이터 세트와 함께 사용하여 추천 시스템을 학습 및 테스트합니다.Usage: Use this dataset, in combination with the other two restaurant datasets, to train and test a recommender system.
관련 조사: Bache, K. 및 Lichman, M. (2013).Related Research: Bache, K. and Lichman, M. (2013). UCI Machine Learning 리포지토리 Irvine, CA: University of California, School of Information and Computer Science.UCI Machine Learning Repository Irvine, CA: University of California, School of Information and Computer Science.

리소스 정리Clean up resources

중요

직접 만든 리소스는 다른 Azure Machine Learning 자습서 및 방법 문서에 대한 필수 조건으로 사용할 수 있습니다.You can use the resources that you created as prerequisites for other Azure Machine Learning tutorials and how-to articles.

모든 항목 삭제Delete everything

사용자가 만든 항목을 사용하지 않으려면 요금이 발생하지 않도록 전체 리소스 그룹을 삭제하세요.If you don't plan to use anything that you created, delete the entire resource group so you don't incur any charges.

  1. Azure Portal의 창 왼쪽에서 리소스 그룹을 선택합니다.In the Azure portal, select Resource groups on the left side of the window.

    Azure Portal에서 리소스 그룹 삭제

  2. 목록에서 만든 리소스 그룹을 선택합니다.In the list, select the resource group that you created.

  3. 리소스 그룹 삭제를 선택합니다.Select Delete resource group.

리소스 그룹을 삭제하면 디자이너에서 만든 모든 리소스도 삭제됩니다.Deleting the resource group also deletes all resources that you created in the designer.

개별 자산 삭제Delete individual assets

실험을 만든 디자이너에서 개별 자산을 선택한 다음, 삭제 단추를 선택하여 자산을 삭제합니다.In the designer where you created your experiment, delete individual assets by selecting them and then selecting the Delete button.

여기에서 만든 컴퓨팅 대상은 사용하지 않을 경우 제로 노드로 자동으로 크기 조정됩니다.The compute target that you created here automatically autoscales to zero nodes when it's not being used. 이 작업은 요금을 최소화하기 위해 수행됩니다.This action is taken to minimize charges. 컴퓨팅 대상을 삭제하려는 경우 다음 단계를 수행합니다. If you want to delete the compute target, take these steps:

자산 삭제

각 데이터 세트를 선택하고 등록 취소를 선택하여 작업 영역에서 데이터 세트를 등록 취소할 수 있습니다.You can unregister datasets from your workspace by selecting each dataset and selecting Unregister.

데이터 세트 등록 취소

데이터 세트를 삭제하려면 Azure Portal 또는 Azure Storage Explorer를 사용하여 스토리지 계정으로 이동하여 해당 자산을 수동으로 삭제합니다.To delete a dataset, go to the storage account by using the Azure portal or Azure Storage Explorer and manually delete those assets.

다음 단계Next steps

자습서: 디자이너를 사용하여 자동차 가격 예측을 통해 예측 분석 및 기계 학습의 기본 사항을 알아봅니다.Learn the fundamentals of predictive analytics and machine learning with Tutorial: Predict automobile price with the designer