Linux 및 Windows용 Azure Data Science Virtual Machine이란?

DSVM(Data Science Virtual Machine)은 Azure 클라우드 플랫폼에서 사용할 수 있는 사용자 지정 VM 이미지이며 데이터 과학을 처리할 수 있습니다. 여기에는 고급 분석을 위한 인텔리전트 애플리케이션 빌드를 바로 수행할 수 있도록 다수의 유명한 데이터 과학 도구가 미리 설치 및 구성되어 있습니다.

DSVM은 다음에서 사용할 수 있습니다.

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

또한 대규모 분산 딥 러닝 워크로드에 최적화된 Azure Marketplace의 Ubuntu 20.04 이미지인 PyTorch용 Azure DSVM을 제공합니다. 이 사전 설치된 DSVM은 최신 PyTorch 버전으로 유효성을 검사하여 설치 비용을 절감하고 가치 창출 시간을 가속화합니다. 다음과 같은 다양한 최적화 기능으로 패키지로 제공됩니다.

  • ONNX 런타임
  • DeepSpeed​
  • MSCCL​
  • ORTMoE​
  • Fairscale​
  • Nvidia Apex​
  • 호환되는 최신 버전의 Ubuntu, Python, PyTorch 및 CUDA를 사용하는 최신 스택

Azure Machine Learning과 비교

DSVM은 데이터 과학을 위한 사용자 지정된 VM 이미지이지만 Azure Machine Learning은 다음을 다루는 엔드투엔드 플랫폼입니다.

  • 완전 관리형 컴퓨팅
    • 컴퓨팅 인스턴스
    • 분산 ML 작업용 컴퓨팅 클러스터
    • 실시간 점수 매기기를 위한 유추 클러스터
  • 데이터 저장소(예: Blob, ADLS Gen2, SQL DB)
  • 실험 추적
  • 모델 관리
  • Notebooks
  • 환경(conda 및 R 종속성 관리)
  • 레이블 지정
  • 파이프라인(엔드투엔드 데이터 과학 워크플로 자동화)

Azure Machine Learning 컴퓨팅 인스턴스와 비교

Azure Machine Learning 컴퓨팅 인스턴스는 완전히 구성되고 관리되는 VM 이미지이지만 DSVM은 관리되지 않는 VM입니다.

DSVM과 Azure Machine Learning 컴퓨팅 인스턴스 간의 주요 차이점:

기능 데이터 과학
VM
Azure Machine Learning
컴퓨팅 인스턴스
완전 관리형
언어 지원 Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python 및 R
운영 체제 Ubuntu
Windows
Ubuntu
미리 구성된 GPU 옵션
스케일 업 옵션
SSH 액세스
RDP 액세스 아니요
기본 제공
호스트된 Notebooks
아니요
(추가 구성 필요)
기본 제공 SSO 아님
(추가 구성 필요)
기본 제공 협업
사전 설치된 도구 Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(랩)

샘플 DSVM 고객 사용 사례

단기 실험 및 평가

DSVM은 새로운 데이터 과학 도구를 평가하거나 학습할 수 있습니다. 게시된 샘플 및 연습을 일부 시도해보세요

GPU를 사용한 딥 러닝

DSVM에서 학습 모델은 GPU(그래픽 처리 장치) 기반 하드웨어에서 딥 러닝 알고리즘을 사용할 수 있습니다. Azure 플랫폼의 VM 크기 조정 기능을 활용하는 경우 DSVM은 필요에 따라 클라우드에서 GPU 기반 하드웨어를 활용하는 데 도움이 됩니다. 큰 모델을 학습하거나 동일한 OS 디스크를 유지하는 동안 고속 계산이 필요한 경우 GPU 기반 VM으로 전환할 수 있습니다. DSVM에서 N 시리즈 GPU 사용 가상 머신 SKU를 선택할 수 있습니다. Azure 체험 계정은 GPU 사용 가상 머신 SKU를 지원하지 않습니다.

Windows 버전 DSVM에는 GPU 드라이버, 프레임워크 및 GPU 버전의 딥 러닝 프레임워크가 미리 설치되어 있습니다. Linux 버전의 경우 Ubuntu DSVM에서 GPU에 대한 딥 러닝이 활성화됩니다.

GPU를 기반으로 하지 않는 Azure 가상 머신에 Ubuntu 또는 Windows DSVM 버전을 배포할 수도 있습니다. 이 경우 모든 딥 러닝 프레임워크는 CPU 모드로 대체됩니다.

사용 가능한 딥 러닝 및 AI 프레임워크에 대해 자세히 알아보세요.

데이터 과학 학습 및 교육

데이터 과학 수업을 가르치는 엔터프라이즈 트레이너 및 강사는 대개 가상 머신 이미지를 제공합니다. 이 이미지는 학생 모두 일관된 설정을 갖도록 하고 샘플이 예측 가능하게 작동하도록 합니다.

DSVM은 지원 및 비호환성 문제를 완화하기 위해 일관된 설정으로 주문형 환경을 만듭니다. 이러한 환경을 빈번하게 구축해야 하는 경우, 특히 짧은 수업의 경우, 실질적인 이점이 있습니다.

DSVM에는 무엇이 포함됩니까?

자세한 내용은 이 Windows 및 Linux DSVM에 있는 도구의 전체 목록을 참조하세요.

다음 단계

자세한 내용은 다음 리소스를 방문하세요.