Studio(클래식)에서 Azure Machine Learning으로 마이그레이션

Important

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 이후에는 더 이상 새 Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Studio(클래식) 리소스를 계속 사용할 수 있습니다.

Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

Machine Learning Studio(클래식)에서 Azure Machine Learning으로 마이그레이션하는 방법을 알아봅니다. Azure Machine Learning은 코드 없는 방식과 코드 우선 방식을 결합한 현대화된 데이터 과학 플랫폼을 제공합니다.

이 가이드에서는 기본 리프트 앤 시프트 마이그레이션을 살펴봅니다. 기존 기계 학습 워크플로를 최적화하거나 기계 학습 플랫폼을 현대화하려는 경우 디지털 설문 조사 도구, 워크시트, 계획 템플릿을 포함한 추가 리소스는 Azure Machine Learning 채택 프레임워크를 참조하세요.

Azure Machine Learning 채택 프레임워크 다이어그램.

마이그레이션 시 클라우드 솔루션 설계자와 함께 작업하세요.

Azure Machine Learning으로 마이그레이션하려면 다음 방식을 사용하는 것이 좋습니다.

  • 1단계: Azure Machine Learning 평가
  • 2단계: 전략 및 계획 정의
  • 3단계: 실험 및 웹 서비스 다시 빌드
  • 4단계: 클라이언트 앱 통합
  • 5단계: Studio(클래식) 자산 정리
  • 6단계: 시나리오 검토 및 확장

1단계: Azure Machine Learning 평가

  1. Azure Machine Learning의 이점, 비용, 아키텍처에 대해 알아봅니다.

  2. Azure Machine Learning 및 Studio(클래식)의 기능을 비교합니다.

    다음 표에 주요 차이점이 요약되어 있습니다.

    기능 Studio(클래식) Azure Machine Learning
    끌어서 놓기 인터페이스 클래식 환경 업데이트된 환경: Azure Machine Learning 디자이너
    코드 SDK 지원되지 않음 Azure Machine Learning PythonR SDK와 완전히 통합됨
    실험 크기 조정 가능(10GB 학습 데이터 제한) 컴퓨팅 대상으로 크기 조정
    컴퓨팅 대상 학습 전용 컴퓨팅 대상, CPU만 지원 GPU와 CPU 지원을 포함한 광범위한 사용자 지정이 가능한 컴퓨팅 대상 학습.
    컴퓨팅 대상 배포 전용 웹 서비스 형식, 사용자 지정 불가능 GPU와 CPU 지원을 포함한 광범위한 사용자 지정이 가능한 컴퓨팅 대상 배포.
    기계 학습 파이프라인 지원되지 않음 유연한 모듈식 파이프라인을 빌드하여 워크플로 자동화
    MLOps 기본 모델 관리 및 배포, CPU 전용 배포 엔터티 버전 관리(모델, 데이터, 워크플로), 워크플로 자동화, CICD 도구와의 통합, CPU 및 GPU 배포
    모델 형식 전용 형식, Studio(클래식)만 해당 학습 작업 유형에 따라 지원되는 여러 형식
    자동화된 모델 학습 및 하이퍼 매개변수 튜닝 지원되지 않음 지원됨

    코드 우선 및 코드 없음 옵션
    데이터 드리프트 검색 지원되지 않음 지원됨
    데이터 레이블 지정 프로젝트 지원되지 않음 지원됨
    RBAC(역할 기반 액세스 제어) 기여자 및 소유자 역할만 유연한 역할 정의 및 RBAC 제어
    AI 갤러리 지원됨 지원되지 않음

    샘플 Python SDK Notebook에서 알아보기

    참고 항목

    Azure Machine Learning의 디자이너 기능은 Studio(클래식)와 비슷한 끌어서 놓기 환경을 제공합니다. 하지만 Azure Machine Learning은 대안으로 강력한 코드 우선 워크플로도 제공합니다. 이 마이그레이션 시리즈는 Studio(클래식) 환경과 가장 유사하므로 디자이너에 중점을 둡니다.

  3. Azure Machine Learning 디자이너에서 중요한 Studio(클래식) 모듈이 지원되는지 확인합니다. 자세한 내용은 Studio(클래식) 및 디자이너 구성 요소 매핑 표를 참조하세요.

  4. Azure Machine Learning 작업 영역을 만듭니다.

2단계: 전략 및 계획 정의

  1. 비즈니스 타당성 및 예상 결과를 정의합니다.

  2. 비즈니스 결과에 맞게 실행 가능한 Azure Machine Learning 채택 계획을 수립합니다.

  3. 변경에 대한 사용자, 프로세스, 환경을 준비합니다.

클라우드 솔루션 설계자와 함께 작업하여 전략을 정의하세요.

계획 문서 템플릿 등의 계획 리소스를 보려면 Azure Machine Learning 채택 프레임워크를 참조하세요.

3단계: 첫 번째 모델 다시 빌드

전략을 정의한 후에는 첫 번째 모델을 마이그레이션합니다.

  1. Azure Machine Learning으로 데이터 세트를 마이그레이션하세요.

  2. 실험을 다시 빌드하려면 Azure Machine Learning 디자이너를 사용하세요.

  3. 웹 서버를 다시 배포하려면 Azure Machine Learning 디자이너를 사용하세요.

    참고 항목

    이 지침은 Azure Machine Learning v1 개념 및 기능을 기반으로 합니다. Azure Machine Learning에는 CLI v2 및 Python SDK v2가 있습니다. v1 대신 v2를 사용하여 Studio(클래식) 모델을 다시 빌드하는 것이 좋습니다. Azure Machine Learning v2로 시작합니다.

4단계: 클라이언트 앱 통합

Azure Machine Learning 엔드포인트를 사용하도록 Studio(클래식) 웹 서비스를 호출하는 클라이언트 애플리케이션을 수정합니다.

5단계: Studio(클래식) 자산 정리

추가 요금을 방지하려면 Studio(클래식) 자산을 정리합니다. Azure Machine Learning 워크로드의 유효성을 검사할 때까지 대체 옵션으로 자산을 유지할 수 있습니다.

6단계: 시나리오 검토 및 확장

  1. 모델 마이그레이션에서 모범 사례를 검토하고 워크로드의 유효성을 검사합니다.

  2. 시나리오를 확장하고 추가 작업을 Azure Machine Learning으로 마이그레이션합니다.

Studio(클래식) 및 디자이너 구성 요소 매핑

디자이너에서 Studio(클래식) 실험을 다시 빌드하는 동안 사용할 모듈을 확인하려면 다음 표를 참조하세요.

Important

디자이너는 C# 패키지가 아닌 Studio(클래식)와 같은 오픈 소스 Python 패키지를 통해 모듈을 구현합니다. 이러한 차이로 인해 디자이너 구성 요소의 출력은 해당 Studio(클래식)와 약간 다를 수 있습니다.

범주 Studio(클래식) 모듈 대체 디자이너 구성 요소
데이터 입력 및 출력 - 수동으로 데이터 입력
- 데이터 내보내기
- 데이터 가져오기
- 학습된 모델 로드
- 압축된 데이터 세트 압축 풀기
- 수동으로 데이터 입력
- 데이터 내보내기
- 데이터 가져오기
데이터 형식 변환 - CSV로 변환
- 데이터 세트로 변환
- ARFF로 변환
- SVMLight로 변환
- TSV로 변환
- CSV로 변환
- 데이터 세트로 변환
데이터 변환 - 조작 - 열 추가
- 행 추가
- SQL 변환 적용
- 누락 데이터 정리
- 표시기 값으로 변환
- 메타데이터 편집
- 데이터 조인
- 중복 행 제거
- 데이터 세트의 열 선택
- 열 변환 선택
- SMOTE
- 범주 값 그룹화
- 열 추가
- 행 추가
- SQL 변환 적용
- 누락 데이터 정리
- 표시기 값으로 변환
- 메타데이터 편집
- 데이터 조인
- 중복 행 제거
- 데이터 세트의 열 선택
- 열 변환 선택
- SMOTE
데이터 변환 - 확장 및 축소 - 값 잘라내기
- Bin으로 데이터 그룹화
- 데이터 정규화
- 주 구성 요소 분석
- 값 잘라내기
- Bin으로 데이터 그룹화
- 데이터 정규화
데이터 변환 - 샘플링 및 분할 - 파티션 및 샘플
- 데이터 분할
- 파티션 및 샘플
- 데이터 분할
데이터 변환 - 필터 - 필터 적용
- FIR 필터
- IIR 필터
- 중앙값 필터
- 이동 평균 필터
- 임계값 필터
- 사용자 정의 필터
데이터 변환 - 개수로 학습 - 개수 변환 작성
- 개수 테이블 내보내기
- 개수 테이블 가져오기
- 개수 변환 병합
- 개수 테이블 매개 변수 수정
기능 선택 - 필터 기반 기능 선택
- 피셔 선형 판별 분석
- 순열 기능 중요도
- 필터 기반 기능 선택
- 순열 기능 중요도
모델 - 분류 - 다중 클래스 의사 결정 포리스트
- 다중 클래스 의사 결정 정글
- 다중 클래스 로지스틱 회귀
- 다중 클래스 신경망
- 일대다 다중 클래스
- 2클래스 평균 퍼셉트론
- 2클래스 Bayes 지점 머신
- 2클래스 향상된 의사 결정 트리
- 2클래스 의사 결정 포리스트
- 2클래스 의사 결정 정글
- 2클래스 로컬 심층 SVM
- 2클래스 로지스틱 회귀
- 2클래스 인공신경망
- 2클래스 Support Vector Machine
- 다중 클래스 의사 결정 포리스트
- 다중 클래스 향상된 의사 결정 트리
- 다중 클래스 로지스틱 회귀
- 다중 클래스 신경망
- 일대다 다중 클래스
- 2클래스 평균 퍼셉트론
- 2클래스 향상된 의사 결정 트리
- 2클래스 의사 결정 포리스트
- 2클래스 로지스틱 회귀
- 2클래스 인공신경망
- 2클래스 Support Vector Machine
모델 - 클러스터링 - K-평균 클러스터링 - K-평균 클러스터링
모델 - 회귀 - 베이지언 선형 회귀
- 향상된 의사 결정 트리 회귀
- 의사 결정 포리스트 회귀
- 빠른 포리스트 분위수 회귀
- 선형 회귀
- 인공신경망 회귀
- 서수 회귀
- 포아송 회귀
- 향상된 의사 결정 트리 회귀
- 의사 결정 포리스트 회귀
- 빠른 포리스트 분위수 회귀
- 선형 회귀
- 인공신경망 회귀
- 포아송 회귀
모델 - 변칙 검색 - 1클래스 svm
- PCA 기반 변칙 검색
- PCA 기반 변칙 검색
Machine Learning - 평가 - 모델 교차 유효성 검사
- 모델 평가
- 추천 평가
- 모델 교차 유효성 검사
- 모델 평가
- 추천 평가
Machine Learning - 학습 - 스윕 클러스터링
- 변칙 검색 모델 학습
- 클러스터링 모델 학습
- Matchbox 추천 학습 -
모델 학습
- 모델 하이퍼 매개 변수 튜닝
- 변칙 검색 모델 학습
- 클러스터링 모델 학습
- 모델 학습
- PyTorch 모델 학습
- SVD 추천 학습
- 와이드 및 딥 추천 학습
- 모델 하이퍼 매개 변수 튜닝
Machine Learning - 점수 - 변환 적용
- 클러스터에 데이터 할당
- Matchbox 추천 점수 매기기
- 모델 채점
- 변환 적용
- 클러스터에 데이터 할당
- 이미지 모델 채점
- 모델 채점
- SVD 추천 점수 매기기
- 와이드 및 딥 추천 점수 매기기
OpenCV 라이브러리 모듈 - 이미지 가져오기
- 미리 학습된 연속 이미지 분류
Python 언어 모듈 - Python 스크립트 실행 - Python 스크립트 실행
- Python 모델 만들기
R 언어 모듈 - R 스크립트 실행
- R 모델 만들기
- R 스크립트 실행
통계 함수 - 수학 연산 적용
- 기본 통계 컴퓨팅
- 선형 상관 관계 컴퓨팅
- 확률 함수 평가
- 불연속 값 바꾸기
- 데이터 요약
- t-테스트를 사용하여 가설 테스트
- 수학 연산 적용
- 데이터 요약
텍스트 분석 - 언어 감지
- 텍스트에서 핵심 구 추출
- 텍스트에서 N Gram 기능 추출
- 기능 해싱
- 잠재적 Dirichlet 할당
- 명명된 엔터티 인식
- 텍스트 전처리
- vVowpal Wabbit 버전 7~10 모델 점수 매기기
- Vowpal Wabbit 버전 8 모델 점수 매기기
- Vowpal Wabbit 버전 7~10 모델 학습
- Vowpal Wabbit 버전 8 모델 학습
- 단어를 벡터로 변환
- 텍스트에서 N Gram 기능 추출
- 기능 해싱
- 잠재적 Dirichlet 할당
- 텍스트 전처리
- Vowpal Wabbit 모델 점수 매기기
- Vowpal Wabbit 모델 학습
Time series(시계열) - 시계열 변칙 검색
웹 서비스 - 입력
- 출력
- 입력
- 출력
컴퓨터 비전 - 이미지 변환 적용
- 이미지 디렉터리로 변환
- 이미지 변환 시작
- 이미지 디렉터리 분할
- DenseNet 이미지 분류
- ResNet 이미지 분류

개별 디자이너 구성 요소를 사용하는 방법에 대한 자세한 내용은 알고리즘 및 구성 요소 참조를 참조하세요.

디자이너 구성 요소가 누락된 경우 어떻게 해야 되나요?

Azure Machine Learning 디자이너에는 Studio(클래식)에서 가장 인기 있는 모듈이 포함되어 있습니다. 또한 최신 기계 학습 기술을 활용하는 새로운 모듈도 포함되어 있습니다.

디자이너에 누락된 모듈이 있어 마이그레이션이 차단된 경우 지원 티켓을 만들어 문의해 주세요.

마이그레이션 예

다음 마이그레이션 예는 Studio(클래식)와 Azure Machine Learning 간의 차이점 중 일부를 강조 표시합니다.

데이터 집합

Studio(클래식)에서 데이터 세트가 작업 영역에 저장되고 Studio(클래식)에서만 사용할 수 있었습니다.

Studio 클래식의 자동차 가격 데이터 세트 스크린샷.

Azure Machine Learning에서는 데이터 세트가 작업 영역에 등록되며 모든 Azure Machine Learning에서 사용할 수 있습니다. Azure Machine Learning 데이터 세트의 이점에 대한 자세한 내용은 Azure Machine Learning의 데이터를 참조하세요.

파이프라인

Studio(클래식)에서는 실험에 작업에 대한 처리 논리가 포함되었습니다. 끌어서 놓기 모듈을 사용하여 실험을 만들었습니다.

Studio 클래식의 자동차 가격 실험 스크린샷.

Azure Machine Learning에서는 파이프라인에 작업에 대한 처리 논리가 포함됩니다. 끌어서 놓기 모듈이나 코드 작성으로 파이프라인을 만들 수 있습니다.

클래식의 자동차 가격 끌어서 놓기 파이프라인 스크린샷.

웹 서비스 엔드포인트

Studio(클래식)는 실시간 예측에 REQUEST/RESPOND API를 사용하고 일괄 처리 예측 또는 재학습에 BATCH EXECUTION API를 사용했습니다.

클래식의 엔드포인트 API 스크린샷.

Azure Machine Learning은 실시간 예측에 실시간 엔드포인트(관리 엔드포인트)를 사용하고 일괄 처리 예측 또는 재학습에 파이프라인 엔드포인트를 사용합니다.

실시간 엔드포인트 및 파이프라인 엔드포인트의 스크린샷.

이 문서에서는 Azure Machine Learning으로 마이그레이션하기 위한 개략적인 요구 사항을 알아보았습니다. 자세한 단계는 다음과 같은 Machine Learning Studio(클래식) 마이그레이션 시리즈의 다른 문서를 참조하세요.

추가 마이그레이션 리소스에 대해서는 Azure Machine Learning 채택 프레임워크를 참조하세요.