Azure Data Science Virtual Machine 上の機械学習ツールとデータ サイエンス ツール

Azure Data Science Virtual Machine (DSVM) には、機械学習のための豊富な一連のツールやライブラリが備わっています。 こうしたリソースは、Python、R、Julia などの一般的な言語で使用できます。

DSVM では、機械学習の次のツールとライブラリがサポートされています。

Azure Machine Learning SDK for Python

詳細については、「Azure Machine Learning SDK for Python」を参照してください。

カテゴリ
紹介 Azure Machine Learning クラウド サービスを使用し、機械学習モデルの開発したり、デプロイしたりできます。 Python SDK を使用することで、モデルを構築、トレーニング、スケール調整、管理しながらモデルを追跡できます。 モデルをコンテナーとしてデプロイし、それをクラウド、オンプレミス、または Azure IoT Edge で実行します。
サポートされているエディション Windows (Conda 環境:AzureML)、Linux (Conda 環境: py36)
標準的な使用 一般的な機械学習プラットフォーム
構成またはインストール方法 GPU サポートと共にインストールされます
使用または実行方法 Python SDK および Azure CLI として。 Windows エディションで conda 環境 AzureML にアクティブ化ましす。または Linux エディションで py36 にアクティブ化します。
サンプルへのリンク サンプルの Jupyter ノートブックを、AzureML ディレクトリの notebooks の下で見つけます。

H2O

カテゴリ
紹介 分散型、高速、インメモリで、かつスケーラブルな機械学習をサポートするオープンソースの AI プラットフォームです。
サポートされているバージョン Linux
標準的な使用 汎用で分散型のスケーラブル機械学習
構成またはインストール方法 H2O は /dsvm/tools/h2o にインストールされます。
使用または実行方法 X2Go で VM に接続します。 新しいターミナルを起動し、java -jar /dsvm/tools/h2o/current/h2o.jar を実行します。 次に、Web ブラウザーを開始し、http://localhost:54321 に接続します。
サンプルへのリンク Jupyter の VM に関するサンプルを h2o ディレクトリの下で見つけます。

DSVM には、DSVM 用の Anaconda Python ディストリビューションの一部である一般的な scikit-learn パッケージなど、他にもいくつかの機械学習ライブラリがあります。 Python、R、Julia で使用可能なパッケージの一覧が必要な場合、それぞれのパッケージ マネージャーを実行します。

LightGBM

カテゴリ
紹介 ディシジョン ツリー アルゴリズムに基づく、高速な、分散型、高パフォーマンスの勾配ブースティング (GBDT、GBRT、GBM、または MART) フレームワークです。 機械学習タスク (ランク付けや分類など) でそれが使用されます。
サポートされているバージョン Windows、Linux
標準的な使用 汎用の勾配ブースティング フレームワーク
構成またはインストール方法 LightGBM は Windows に Python パッケージとしてインストールされます。 Linux では、コマンドラインの実行可能ファイルは /opt/LightGBM/lightgbm にあります。 R パッケージがインストールされ、Python パッケージがインストールされます。
サンプルへのリンク LightGBM ガイド

Rattle

カテゴリ
紹介 R を使用したデータ マイニングのためのグラフィカル ユーザー インターフェイス。
サポートされているエディション Windows、Linux
標準的な使用 R 用の一般的な UI データ マイニング ツール
使用または実行方法 UI ツールとして。 Windows では、コマンド プロンプトを起動し、R を実行してから、R 内で rattle() を実行します。 Linux では、X2Go で接続し、ターミナルを起動し、R を実行してから、R 内で rattle() を実行します。
サンプルへのリンク Rattle

Vowpal Wabbit

カテゴリ
紹介 高速でオープンソースの、コア以外の学習システム ライブラリ
サポートされているエディション Windows、Linux
標準的な使用 一般的な機械学習ライブラリ
構成またはインストール方法 Windows: MSI インストーラー
Linux: apt-get
使用または実行方法 パスの通ったコマンド ライン ツール (Windows では C:\Program Files\VowpalWabbit\vw.exe、Linux では /usr/bin/vw) として
サンプルへのリンク VowPal Wabbit サンプル

Weka

カテゴリ
紹介 データ マイニング タスクのための機械学習アルゴリズムのコレクション。 アルゴリズムを直接適用するか、独自の Java コードから呼び出すことができます。 Weka には、データの前処理、分類、回帰、クラスタリング、アソシエーション ルール、および視覚化のためのツールが含まれています。
サポートされているエディション Windows、Linux
標準的な使用 一般的な機械学習ツール
使用または実行方法 Windows では、 [スタート] メニューで Weka を探します。 Linux では、X2Go でサインインし、 [アプリケーション]>[開発]>[Weka] に移動します。
サンプルへのリンク Weka サンプル

XGBoost

カテゴリ
紹介 Python、R、Java、Scala、C++ など用の、高速で、可搬性があり、分散型の勾配ブースティング (GBDT、GBRT、または GBM) ライブラリ。 これは 1 台のコンピューター、Apache Hadoop、Spark 上で実行されます。
サポートされているエディション Windows、Linux
標準的な使用 一般的な機械学習ライブラリ
構成またはインストール方法 GPU サポートと共にインストールされます
使用または実行方法 Python ライブラリ (2.7 および 3.6 以降)、R パッケージ、パスの通ったコマンド ライン ツール (Windows では C:\dsvm\tools\xgboost\bin\xgboost.exe、Linux では /dsvm/tools/xgboost/xgboost) として
サンプルへのリンク サンプルは、VM 上の Linux では /dsvm/tools/xgboost/demo、Windows では C:\dsvm\tools\xgboost\demo に含まれています。