PyTorch プロジェクトは、高度な学習ネットワークを構築するための、GPU による高速な計算と高レベルの機能を提供する Python パッケージです。PyTorch project is a Python package that provides GPU accelerated tensor computation and high level functionalities for building deep learning networks. ライセンスの詳細については、 GitHub の PyTorch ライセンスドキュメントを参照してください。For licensing details, see the PyTorch license doc on GitHub.

以下のセクションでは、Azure Databricks での PyTorch のインストールに関するガイダンスを提供し、PyTorch プログラムを実行する例を示します。In the sections below, we provide guidance on installing PyTorch on Azure Databricks and give an example of running PyTorch programs.


これは、PyTorch の包括的なガイドではありません。This is not a comprehensive guide to PyTorch. PyTorch の web サイトを参照してください。Refer to the PyTorch website.

PyTorch のインストールInstall PyTorch

ML 用 Databricks RuntimeDatabricks Runtime for ML

PyTorch は Databricks Runtime 5.1 ML ベータ以降に含まれています。PyTorch is included in Databricks Runtime 5.1 ML Beta and above. Databricks Runtime ML を使用してクラスターを作成し、PyTorch の使用を開始できます。You can create a cluster using Databricks Runtime ML and start using PyTorch. Machine Learning については、「Databricks Runtime」を参照してください。See Databricks Runtime for Machine Learning.

Databricks ランタイムDatabricks Runtime

ML の Databricks Runtime に含まれている PyTorch を使用することをお勧めします。We recommend using the PyTorch included on Databricks Runtime for ML. ただし、Databricks Runtime を使用する必要がある場合は、 Databricks PyPI ライブラリとして PyTorch をインストールできます。However, if you must use Databricks Runtime, PyTorch can be installed as a Databricks PyPI library. PyTorch 1.1.0 をインストールする方法については、以下を参照してください。We show how to install PyTorch 1.1.0 below:

  • GPU クラスターで、次のように指定して pytorchtorchvision をインストールします。On GPU clusters, install pytorch and torchvision by specifying the following:
    • torch==1.1.0
    • torchvision==0.3.0
  • CPU クラスターで、次のホイールファイルを使用して pytorchtorchvision をインストールします。On CPU clusters, install pytorch and torchvision by using the wheel files below:
    • Python 3:Python 3:
    • Python 2:Python 2:

1つのノードで PyTorch を使用するUse PyTorch on a single node

シングルマシンの PyTorch ワークフローをテストして移行するには、ワーカーの数をゼロに設定して Azure Databricks のドライバー専用クラスターから開始できます。To test and migrate single-machine PyTorch workflows, you can start with a driver-only cluster on Azure Databricks by setting the number of workers to zero. この設定では Apache Spark が機能しませんが、単一コンピューターの PyTorch ワークフローを実行するには、コスト効率に優れた方法です。Though Apache Spark is not functional under this setting, it is a cost-effective way to run single-machine PyTorch workflows.

PyTorch notebookPyTorch notebook

ノートブックを取得するGet notebook