Share via


Data Science Virtual Machine 기반 팀 분석 및 AI 환경

DSVM(Data Science Virtual Machine)은 미리 빌드된 AI(인공 지능) 및 데이터 분석용 소프트웨어가 포함된 다양한 환경을 Azure 플랫폼에 제공합니다.

일반적으로 DSVM은 개별 분석 데스크톱으로 사용되었습니다. 미리 빌드된 이 공유 분석 환경은 과학자의 생산성을 개선합니다. 대규모 분석 팀에서 데이터 과학자 및 AI 개발자를 위한 환경을 계획함에 따라 반복되는 주제 중 하나는 공유 개발 및 실험 분석 인프라입니다. 이 인프라는 데이터 과학 및 분석 팀 전체의 협업과 일관성을 용이하게 하는 엔터프라이즈 IT 정책에 따라 관리됩니다.

공유 인프라를 사용하면 분석 환경의 IT 사용률이 개선됩니다. 일부 조직에서는 팀 기반 데이터 과학/분석 인프라를 분석 샌드박스라고 설명합니다. 이를 사용하면 데이터 과학자가 다양한 데이터 자산에 액세스하여 데이터를 빠르게 파악하고 처리할 수 있습니다. 또한 이 샌드박스 환경에서는 데이터 과학자가 프로덕션 환경에 영향을 주지 않고 실험을 실행하고, 가설의 유효성을 검사하며, 예측 모델을 빌드할 수 있습니다.

DSVM은 Azure 인프라 수준에서 작동하므로, IT 관리자가 엔터프라이즈 IT 정책을 준수하며 작동하도록 DSVM을 쉽게 구성할 수 있습니다. DSVM은 완벽한 유연성을 바탕으로 다양한 공유 아키텍처를 구현하고, 회사 데이터 자산에 대한 액세스 권한을 제어된 방식으로 제공합니다.

이 섹션에서는 DSVM을 팀 기반 데이터 과학 인프라로 배포하는 데 사용할 수 있는 패턴 및 지침을 설명합니다. 이러한 패턴의 구성 요소는 Azure IaaS(Infrastructure as a Service)에서 제공되므로 모든 Azure VM에 적용됩니다. 이 시리즈의 문서에서는 이러한 표준 Azure 인프라 기능을 DSVM에 적용하는 데 중점을 둡니다.

엔터프라이즈 팀 분석 환경의 주요 구성 요소는 다음과 같습니다.

이 시리즈에서는 위의 각 항목에 대한 지침과 팁을 제공합니다. 대규모 엔터프라이즈 구성에 DSVM을 배포하기 위한 모든 고려 사항과 요구 사항을 다루지는 않습니다. 엔터프라이즈에서 DSVM 인스턴스를 구현하면서 사용할 수 있는 몇 가지 다른 Azure 리소스는 다음과 같습니다.

마지막으로 Azure 아키텍처 센터는 클라우드 기반 분석 인프라를 구축하고 관리하기 위한 자세한 엔드투엔드 아키텍처와 모델을 제공합니다.