Linux および Windows 用の Azure Data Science Virtual Machine とはWhat is the Azure Data Science Virtual Machine for Linux and Windows?

Data Science Virtual Machine (DSVM) とは、データ サイエンス専用に構築された Azure クラウド プラットフォーム上のカスタマイズされた VM イメージです。The Data Science Virtual Machine (DSVM) is a customized VM image on the Azure cloud platform built specifically for doing data science. 多くのよく使われるデータ サイエンス ツールが事前にインストールおよび構成されており、高度な分析のためのインテリジェントなアプリケーションの構築をすぐに始めることができます。It has many popular data science tools preinstalled and pre-configured to jump-start building intelligent applications for advanced analytics.

DSVM を利用できる OS:The DSVM is available on:

  • Windows Server 2019Windows Server 2019
  • Ubuntu 18.04 LTSUbuntu 18.04 LTS

Azure Machine Learning との比較Comparison with Azure Machine Learning

DSVM がデータ サイエンス向けにカスタマイズされた VM イメージであるのに対し、Azure Machine Learning (AzureML) は、次の機能を含んだエンド ツー エンドのプラットフォームです。The DSVM is a customized VM image for Data Science but Azure Machine Learning (AzureML) is an end-to-end platform that encompasses:

  • フル マネージドのコンピューティングFully Managed Compute
    • コンピューティング インスタンスCompute Instances
    • 分散 ML タスク用のコンピューティング クラスターCompute Clusters for distributed ML tasks
    • リアルタイム スコアリング用の推論クラスターInference Clusters for real-time scoring
  • データストア (例: Blob、ADLS Gen2、SQL DB)Datastores (for example Blob, ADLS Gen2, SQL DB)
  • 実験の追跡Experiment tracking
  • モデル管理Model management
  • ノートブックNotebooks
  • 環境 (Conda と R の依存関係の管理)Environments (manage conda and R dependencies)
  • ラベル付けLabeling
  • パイプライン (エンド ツー エンドのデータ サイエンス ワークフローの自動化)Pipelines (automate End-to-End Data science workflows)

AzureML コンピューティング インスタンスとの比較Comparison with AzureML Compute Instances

Azure Machine Learning コンピューティング インスタンスがフル構成の マネージド VM イメージであるのに対し、DSVM は アンマネージド VM です。Azure Machine Learning Compute Instances are a fully configured and managed VM image whereas the DSVM is an unmanaged VM.

2 つの製品の主な違いは次のとおりです。The key differences between these two product offerings are detailed below:

特徴量Feature データ サイエンスData Science
VMVM
AzureMLAzureML
コンピューティング インスタンスCompute Instance
フル マネージドFully Managed いいえNo はいYes
言語サポートLanguage Support Python、R、Julia、SQL、C#、Python, R, Julia, SQL, C#,
Java、Node.js、F#Java, Node.js, F#
Python と RPython and R
オペレーティング システムOperating System UbuntuUbuntu
WindowsWindows
UbuntuUbuntu
事前構成済みの GPU オプションPre-Configured GPU Option はいYes はいYes
スケールアップ オプションScale up option はいYes はいYes
SSH アクセスSSH Access はいYes はいYes
RDP アクセスRDP Access はいYes いいえNo
組み込みBuilt-in
ホスト ノートブックHosted Notebooks
いいえNo
(別途構成が必要)(requires additional configuration)
はいYes
組み込み SSOBuilt-in SSO いいえNo
(別途構成が必要)(requires additional configuration)
はいYes
組み込みコラボレーションBuilt-in Collaboration いいえNo はいYes
プレインストールされているツールPre-installed Tools Jupyter(lab)、RStudio Server、VSCode、Jupyter(lab), RStudio Server, VSCode,
Visual Studio、PyCharm、Juno、Visual Studio, PyCharm, Juno,
Power BI Desktop、SSMS、Power BI Desktop, SSMS,
Microsoft Office 365、Apache DrillMicrosoft Office 365, Apache Drill
Jupyter(lab)Jupyter(lab)
RStudio ServerRStudio Server

サンプル ユース ケースSample Use Cases

以下では、DSVM のお客様の一般的な使用例をいくつか紹介します。Below we illustrate some common use cases for DSVM customers.

短期的な実験と評価Short-term experimentation and evaluation

DSVM を使用すると、特に公開されているサンプルとチュートリアルのいくつかを試すことで、新しいデータ サイエンス ツールを評価または学習できます。You can use the DSVM to evaluate or learn new data science tools, especially by going through some of our published samples and walkthroughs.

GPU を使用したディープ ラーニングDeep learning with GPUs

DSVM では、トレーニング モデルはグラフィックス処理装置 (GPU) ベースのハードウェア上でディープ ラーニング アルゴリズムを使用できます。In the DSVM, your training models can use deep learning algorithms on hardware that's based on graphics processing units (GPUs). Azure プラットフォームの VM スケーリング機能を利用することにより、DSVM はニーズに応じてクラウドで GPU ベースのハードウェアを使用するのに役立ちます。By taking advantage of the VM scaling capabilities of the Azure platform, the DSVM helps you use GPU-based hardware in the cloud according to your needs. 大規模モデルをトレーニングするときや、同じ OS ディスクを保持しつつ高速計算が必要なときに、GPU ベースの VM に切り替えることができます。You can switch to a GPU-based VM when you're training large models, or when you need high-speed computations while keeping the same OS disk. DSVM を使用して、N シリーズ GPU 対応の任意の仮想マシン SKU を選択できます。You can choose any of the N series GPUs enabled virtual machine SKUs with DSVM. Azure 無料アカウントでは、GPU 対応の仮想マシン SKU がサポートされないので注意してください。Note GPU enabled virtual machine SKUs are not supported on Azure free accounts.

Windows エディションの DSVM には、GPU ドライバー、フレームワーク、および GPU バージョンのディープ ラーニング フレームワークが事前インストールされています。The Windows editions of the DSVM come pre-installed with GPU drivers, frameworks, and GPU versions of deep learning frameworks. Linux エディションでは、GPU のディープ ラーニングは、Ubuntu の DSVM で有効になります。On the Linux editions, deep learning on GPUs is enabled on the Ubuntu DSVMs.

Ubuntu または Windows エディションの DSVM を、GPU ベースでない Azure 仮想マシンにデプロイすることもできます。You can also deploy the Ubuntu or Windows editions of the DSVM to an Azure virtual machine that isn't based on GPUs. この場合、すべてのディープ ラーニング フレームワークは CPU モードにフォールバックはします。In this case, all the deep learning frameworks will fall back to the CPU mode.

使用可能なディープ ラーニングと AI のフレームワークの詳細について学習してください。Learn more about available deep learning and AI frameworks.

データ サイエンスのトレーニングと教育Data science training and education

データ サイエンスのクラスを教える企業のトレーナーや教育担当者は、通常、仮想マシン イメージを提供します。Enterprise trainers and educators who teach data science classes usually provide a virtual machine image. そのイメージにより、受講者が一貫したセットアップを行い、サンプルが予想どおりに動作するようにすることができます。The image ensures students have a consistent setup and that the samples work predictably.

DSVM は、一貫したセットアップでオンデマンドの環境を作成するため、サポートと非互換性の問題を軽減できます。The DSVM creates an on-demand environment with a consistent setup that eases the support and incompatibility challenges. このような環境を頻繁に構築する必要がある場合 (特に短期間のトレーニング クラスの場合)、非常にメリットがあります。Cases where these environments need to be built frequently, especially for shorter training classes, benefit substantially.

DSVM に含まれているものWhat's included on the DSVM?

Windows と Linux の両方の DSVM 上で使用できるツールの完全な一覧については、こちらを参照してください。See a full list of tools on both the Windows and Linux DSVMs here.

次のステップNext steps

詳細については、次の記事を参照してください。Learn more with these articles: