Azure Machine Learning으로 마이그레이션

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

Studio(클래식)에서 Azure Machine Learning으로 마이그레이션하는 방법을 알아봅니다. Azure Machine Learning은 코드 없는 방식과 코드 우선 방식을 결합한 현대화된 데이터 과학 플랫폼을 제공합니다.

기본 “리프트 앤 시프트” 마이그레이션을 위한 가이드입니다. 기존 machine learning 워크플로를 최적화 하거나 machine learning 플랫폼을 현대화 하는 경우 디지털 설문 조사 도구, 워크시트 및 계획 템플릿 등의 추가 리소스에 대 한 Azure Machine Learning 채택 프레임 워크 를 참조 하세요.

Azure ML adoption framework

Azure Machine Learning으로 마이그레이션하려면 다음 방식을 사용하는 것이 좋습니다.

  • 1단계: Azure Machine Learning 평가
  • 2단계: 전략 및 계획 정의
  • 3단계: 실험 및 웹 서비스 다시 빌드
  • 4단계: 클라이언트 앱 통합
  • 5단계: Studio(클래식) 자산 정리
  • 6단계: 시나리오 검토 및 확장

1단계: Azure Machine Learning 평가

  1. Azure Machine Learning의 이점, 비용, 아키텍처에 대해 알아봅니다.

  2. Azure Machine Learning 및 Studio(클래식)의 기능을 비교합니다.

    참고

    Azure Machine Learning의 디자이너 기능은 Studio(클래식)와 비슷한 끌어서 놓기 환경을 제공합니다. 하지만 Azure Machine Learning은 대안으로 강력한 코드 우선 워크플로도 제공합니다. 이 마이그레이션 시리즈는 Studio(클래식) 환경과 가장 유사하므로 디자이너에 중점을 둡니다.

    다음 표에는 ML Studio(클래식)와 Azure Machine Learning 간에 주요 차이점이 요약되어 있습니다.

    기능 ML Studio(클래식) Azure Machine Learning
    끌어서 놓기 인터페이스 클래식 환경 환경이 업데이트됨 - Azure Machine Learning 디자이너
    코드 SDK 지원되지 않음 Azure Machine Learning PythonR SDK와 완전히 통합됨
    실험 크기 조정 가능(10GB 학습 데이터 제한) 컴퓨팅 대상으로 크기 조정
    컴퓨팅 대상 학습 전용 컴퓨팅 대상, CPU만 지원 광범위한 사용자 지정이 가능한 컴퓨팅 대상 학습. GPU 및 CPU 지원 포함
    컴퓨팅 대상 배포 전용 웹 서비스 형식, 사용자 지정 불가능 광범위한 사용자 지정이 가능한 컴퓨팅 대상 배포. GPU 및 CPU 지원 포함
    ML 파이프라인 지원되지 않음 유연한 모듈식 파이프라인을 빌드하여 워크플로 자동화
    MLOps 기본 모델 관리 및 배포, CPU 전용 배포 엔터티 버전 관리(모델, 데이터, 워크플로), 워크플로 자동화, CICD 도구와의 통합, CPU 및 GPU 배포
    모델 형식 전용 형식, Studio(클래식)만 해당 학습 작업 유형에 따라 지원되는 여러 형식
    자동화된 모델 학습 및 하이퍼 매개변수 튜닝 지원되지 않음 지원됨이라는 의미입니다. 코드 우선 및 코드 없음 옵션.
    데이터 드리프트 검색 지원되지 않음 지원됨
    데이터 레이블 지정 프로젝트 지원되지 않음 지원됨
    역할 기반 Access Control(RBAC) 기여자 및 소유자 역할만 유연한 역할 정의 및 RBAC 제어
    AI 갤러리 지원됨(https://gallery.azure.ai/) 지원되지 않음

    샘플 Python SDK Notebook에서 알아보세요.
  3. Azure Machine Learning 디자이너에서 중요한 Studio(클래식) 모듈이 지원되는지 확인합니다. 자세한 내용은 아래의 Studio (클래식) 및 디자이너 구성 요소 매핑 표를 참조 하세요.

  4. Azure Machine Learning 작업 영역을 만듭니다.

2단계: 전략 및 계획 정의

  1. 비즈니스 타당성 및 예상 결과를 정의합니다.
  2. 비즈니스 결과에 맞게 실행 가능한 Azure Machine Learning 채택 계획을 수립합니다.
  3. 변경에 대한 사용자, 프로세스, 환경을 준비합니다.

계획 문서 템플릿 등의 계획 리소스를 보려면 Azure Machine Learning 채택 프레임워크를 참조하세요.

3단계: 첫 번째 모델 다시 빌드

전략을 정의한 후에는 첫 번째 모델을 마이그레이션합니다.

  1. 데이터 세트를 Azure Machine Learning으로 마이그레이션합니다.

  2. 디자이너를 사용하여 실험을 다시 빌드합니다.

  3. 디자이너를 사용하여 웹 서비스를 다시 배포합니다.

    참고

    Azure Machine Learning은 데이터 세트, 학습, 배포에 대한 코드 우선 워크플로도 지원합니다.

4단계: 클라이언트 앱 통합

  1. Azure Machine Learning 엔드포인트를 사용하도록 Studio(클래식) 웹 서비스를 호출하는 클라이언트 애플리케이션을 수정합니다.

5단계: Studio(클래식) 자산 정리

  1. 추가 요금을 방지하기 위해 Studio(클래식) 자산을 정리합니다. Azure Machine Learning 워크로드의 유효성을 검사할 때까지 대체 옵션으로 자산을 유지할 수 있습니다.

6단계: 시나리오 검토 및 확장

  1. 모델 마이그레이션에서 모범 사례를 검토하고 워크로드의 유효성을 검사합니다.
  2. 시나리오를 확장하고 추가 작업을 Azure Machine Learning으로 마이그레이션합니다.

Studio (클래식) 및 디자이너 구성 요소 매핑

디자이너에서 Studio(클래식) 실험을 다시 빌드하는 동안 사용할 모듈을 확인하려면 다음 표를 참조하세요.

중요

디자이너는 C# 패키지가 아닌 Studio(클래식)와 같은 오픈 소스 Python 패키지를 통해 모듈을 구현합니다. 이러한 차이로 인해 디자이너 구성 요소의 출력은 Studio(클래식) 구성 요소와 약간 다를 수 있습니다.

범주 Studio(클래식) 모듈 교체 디자이너 구성 요소
데이터 입력 및 출력 - 수동으로 데이터 입력
- 데이터 내보내기
- 데이터 가져오기 -
학습된 모델 로드 -
압축된 데이터 세트 압축 풀기
- 수동으로 데이터 입력
- 데이터 내보내기
- 데이터 가져오기
데이터 형식 변환 - CSV로
변환 - 데이터 세트로 변환 -
ARFF로 변환
- SVMLight로
변환 - TSV로 변환
- CSV로
변환 - 데이터 세트로 변환
데이터 변환 - 조작 - 열
추가 - 행 추가
- SQL 변환 적용 -
누락된 데이터 정리 -
표시기 값으로 변환
- 메타데이터 편집 - 데이터

조인 - 중복 행 제거 -
데이터 세트에서 열 선택 - 열 변환 선택 -

SMOTE
- 범주 값 그룹화
- 열
추가 - 행 추가
- SQL 변환 적용 -
누락된 데이터 정리 -
표시기 값으로 변환
- 메타데이터 편집 - 데이터

조인 - 중복 행 제거 -
데이터 세트에서 열 선택 - 열 변환 선택 -

SMOTE
데이터 변환 – 크기 조정 및 축소 - 클립 값
- 데이터를 Bin으로
그룹화 - 데이터 정규화
- 주 구성 요소 분석
- 클립 값
- 데이터를 Bin으로
그룹화 - 데이터 정규화
데이터 변환 – 샘플 및 분할 - 파티션 및 샘플
- 데이터 분할
- 파티션 및 샘플
- 데이터 분할
데이터 변환 – 필터 - 필터 적용
- FIR 필터
- IIR 필터 -
중앙값 필터 - 이동 평균 필터
- 임계값 필터 - 사용자 정의

필터
개수가 있는 데이터 변환 – Learning - 빌드 계산 변환
- 개수 테이블 내보내기
- 가져오기 개수 테이블 - 병합
개수 변환 -
개수 테이블 매개 변수 수정
기능 선택 - 필터 기반 기능 선택
- Linear Discriminant Analysis
- 순열 기능 중요도
- 필터 기반 기능 선택
- 순열 기능 중요도
모델 - 분류 - 다중 클래스 의사 결정 포리스트
- 다중 클래스 의사 결정
회귀 - 다중 클래스 로지스틱 회귀
- 다중 클래스 신경망 - 일대다 다중 클래스
- Two-Class 평균
퍼셉트론
- Two-Class Bayes Point Machine - Two-Class
상승된 의사 결정 트리 - Two-Class
의사 결정 포리스트 - Two-Class 의사 결정 포리스트
- Two-Class Locally-Deep
SVM
- Two-Class 로지스틱 회귀 - Two-Class
신경망 - Two-Class 지원
벡터 머신
- 다중 클래스 의사 결정 포리스트
- 다중 클래스 Boost 의사 결정 트리 - 다중 클래스
로지스틱 회귀
- 다중 클래스 신경망 - 일대다 다중 클래스 -
Two-Class 평균
퍼셉트론
- Two-Class 향상 의사 결정 트리 - Two-Class 의사 결정
포리스트
- Two-Class 로지스틱 회귀
- Two-Class 신경망 - Two-Class 지원
벡터 머신
모델 - 클러스터링 - K-평균 클러스터링 - K-평균 클러스터링
모델 - 회귀 - Bayesian 선형 회귀
- 향상 의사 결정 트리 회귀 - 의사 결정
포리스트 회귀
- 빠른 포리스트 분위수 회귀
- 선형 회귀
- 신경망 회귀
- 서수 회귀 포리스트 회귀
- 강화된 의사 결정 트리 회귀
- 의사 결정 포리스트 회귀
- 빠른 포리스트 분위수 회귀
- 선형 회귀
- 신경망 회귀
- 포아송 회귀
모델 – 변칙 검색 - One-Class SVM
- PCA-Based 변칙 검색
- PCA 기반 변칙 검색
Machine Learning – 평가 - 모델 교차 유효성 검사
- 모델 평가 - 추천
평가
- 모델 교차 유효성 검사
- 모델 평가 - 추천
평가
Machine Learning – 학습 - 스윕 클러스터링
- 변칙 검색 모델 학습
- 클러스터링 모델 학습 -
Matchbox 추천 학습 - 모델 학습
- 모델
하이퍼매개 조정
- 변칙 검색 모델 학습
- 클러스터링 모델 학습
- 모델 학습 - -
PyTorch 모델 학습
- SVD 추천 학습 - 와이드 및 심도 있는 추천 학습
- 모델
하이퍼매개 조정
Machine Learning – 점수 - 변환 적용
- 클러스터에 데이터 할당
- Matchbox 추천 점수 매기기
- 모델 점수 매기기
- 변환 적용
- 클러스터에 데이터 할당
- 이미지 모델 점수 매기기 - 모델
점수
매기기 - SVD 추천
점수 매기기 -너비 및 심도 있는 추천 점수 매기기
OpenCV 라이브러리 모듈 - 이미지 가져오기
- 미리 학습된 계단식 이미지 분류
Python 언어 모듈 - Python 스크립트 실행 - Python 스크립트 실행
- Python 모델 만들기
R 언어 모듈 - R 스크립트 실행
- R 모델 만들기
- R 스크립트 실행
통계 함수 - 수학 연산 적용
- 기본 통계 컴퓨팅 -
선형 상관 관계 계산 - 확률
함수 평가 -
불연속 값 바꾸기
- 데이터 요약 -
t-Test를 사용하여 가설 테스트
- 수학 연산 적용
- 데이터 요약
Text Analytics - 언어 감지
- 텍스트에서 핵심 구 추출
- 텍스트에서 N-Gram 기능 추출
- 기능 해시 - 지연
Dirichlet 할당
- 명명된 엔터티 인식 -
전처리 텍스트 -
Vowpal Wabbit 버전 7-10 모델 점수 매기기
- Vowpal Wabbit 버전 8 모델 점수
매기기 - Vowpal Wabbit 버전 7-10 모델 학습
- Vowpal Wabbit 버전 8 모델 학습
- 단어를 벡터로 변환
- 텍스트에서 N-Gram 기능 추출
- 기능 해시 -
Latent Dirichlet 할당
- 전처리 텍스트 -
Vowpal Wabbit 모델 점수 매기기
- Vowpal Wabbit 모델 학습
시계열 - 시계열 변칙 검색
웹 서비스 - 입력
- 출력
- 입력
- 출력
Computer Vision - 이미지 변환 적용
- 이미지 디렉터리로 변환
- Init 이미지 변환 - 분할 이미지
디렉터리 -
DenseNet 이미지 분류 -
ResNet 이미지 분류

개별 디자이너 구성 요소를 사용하는 방법에 대한 자세한 내용은 디자이너 구성 요소 참조 를 참조하세요.

디자이너 구성 요소가 없으면 어떻게 해야 합니까?

Azure Machine Learning 디자이너에는 Studio(클래식)에서 가장 인기 있는 모듈이 포함되어 있습니다. 또한 최신 기계 학습 기술을 활용하는 새로운 모듈도 포함되어 있습니다.

디자이너에 누락된 모듈이 있어 마이그레이션이 차단된 경우 지원 티켓을 만들어 문의해 주세요.

마이그레이션 예

다음 마이그레이션 예는 Studio(클래식)와 Azure Machine Learning 간의 차이점 중 일부를 강조 표시합니다.

데이터 세트

Studio(클래식)에서 데이터 세트가 작업 영역에 저장되고 Studio(클래식)에서만 사용할 수 있었습니다.

automobile-price-classic-dataset

Azure Machine Learning에서는 데이터 세트가 작업 영역에 등록되며 모든 Azure Machine Learning에서 사용할 수 있습니다. Azure Machine Learning 데이터 세트의 이점에 대한 자세한 내용은 보안 데이터 액세스를 참조하세요.

automobile-price-aml-dataset

파이프라인

Studio(클래식)에서는 실험에 작업에 대한 처리 논리가 포함되었습니다. 끌어서 놓기 모듈을 사용하여 실험을 만들었습니다.

automobile-price-classic-experiment

Azure Machine Learning에서는 파이프라인에 작업에 대한 처리 논리가 포함됩니다. 끌어서 놓기 모듈이나 코드 작성으로 파이프라인을 만들 수 있습니다.

automobile-price-aml-pipeline

웹 서비스 엔드포인트

Studio(클래식)는 실시간 예측에 REQUEST/RESPOND API를 사용하고 일괄 처리 예측 또는 재학습에 BATCH EXECUTION API를 사용했습니다.

automobile-price-classic-webservice

Azure Machine Learning은 실시간 예측에 실시간 엔드포인트를 사용하고 일괄 처리 예측 또는 재학습에 파이프라인 엔드포인트를 사용합니다.

automobile-price-aml-endpoint

다음 단계

이 문서에서는 Azure Machine Learning으로 마이그레이션하기 위한 개략적인 요구 사항을 알아보았습니다. 자세한 단계는 다음과 같은 Studio(클래식) 마이그레이션 시리즈의 다른 문서를 참조하세요.

  1. 마이그레이션 개요
  2. 마이그레이션 데이터세트
  3. Studio(클래식) 학습 파이프라인을 다시 빌드합니다.
  4. Studio(클래식) 웹 서비스를 다시 빌드합니다.
  5. Azure Machine Learning 웹 서비스를 클라이언트 앱과 통합합니다.
  6. R 스크립트 실행을 마이그레이션합니다.

추가 마이그레이션 리소스에 대해서는 Azure Machine Learning 채택 프레임워크를 참조하세요.