R Tools for Visual Studio のサンプル プロジェクト

次のサンプル コレクションを使用して、R、R Tools for Visual Studio (RTVS)、Microsoft R Server の使用を開始できます。

  1. サンプルの ZIP ファイルをダウンロードし、フォルダーを選択して展開します。
  2. examples/Examples.sln を開くと、プロジェクトにフォルダーが 2 つ表示されます。

    • "A First Look at R" には、R を初めて使用するユーザーのために簡単な概要が含まれます。
    • "MRS and Machine Learning" には、Machine Learning に R および Microsoft R Server を使用する方法の例が含まれます。

初めて R を検討する (A First Look at R)

このサンプルでは、ソース ファイル内の詳細なコメントを使って、R を詳しく説明しています。 これらの 2 つのファイルを体験するには、ファイルの上にカーソルを配置して、Ctrl + Enter キーを押し、各行 (1 行ずつ) を [R インタラクティブ] ウィンドウに送るのが最適な方法です。このウィンドウで結果を確認できます。 いくつかの行は、パッケージのインストールに数分かかる場合があることに注意してください。

  • 1-Getting Started with R.R には、パッケージの使用、データの読み込みと分析、およびプロットなど、多くの R の基本が含まれています。

    "1-Getting Started with R.R" サンプルの出力例

  • 2-Introduction to ggplot2.R では、視覚に訴えるプロットとシンプルな構文で知られる ggplot2 グラフィック パッケージを紹介します。 この例では、フィジーの地震データを視覚化しています。

    "2-Introduction to ggplot2.R" サンプルの出力例

Microsoft R Server と Machine Learning

この例のコレクションでは、R、および Microsoft R Server を使用して Machine Learning モデルを作成する方法、および Microsoft R Server (MRS) の機能を活用する方法を示します。 タイトルおよび示された場所の MRS でスクリプトを実行するには、MRS をインストールする必要があることに注意してください。

すべての例と同じように、これらを体験する最適な方法は、ファイルを開くことです。ファイルの上にカーソルを配置して、Ctrl + Enter キーを使用し、行ごとにコード行をステップ実行します。 詳細については、各フォルダーのマークダウン ファイルも参照してください。

  • Benchmarks では、複数のコンピューティング集中型ベンチマークを実行して、高速な並行線形代数計算に Microsoft R Open と Intel 数値演算ライブラリ (MKL) を使用して可能になるパフォーマンスを示します。 シミュレートされたデータは、特定のマトリックスに関連する計算に対して、1 つのスレッドと 2 つのスレッドを使用して比較しています。

    ベンチマーク プロットの例

  • Bike_Rental_Estimation_with_MRS では、Microsoft R Server を使用して、履歴データセットに基づくレンタルサイクルの需要予測モデルを作成します。

  • Data_Exploration には、次の 3 つのスクリプトが含まれます。

    • Import Data from URL.R では、URL によって特定されたデータ ファイルを R に読み込む方法を示します。
    • Import Data from URL to xdf.R では、URL によって特定されたデータ ファイルを xdf として Microsoft R Server に読み込む方法を示します (MRS が必要です)。
    • Using ggplot2.R は、A First Look at R/2-Introduction to ggplot2.R サンプルの拡張機能です。このスクリプトでは、対話型の 3D プロットなど、ggplot2 の機能の詳細なツアーを示します。

      ggplot2.R を使用した出力例

  • Datasets には、他のサンプルによって使用される .csv ファイルが 3 つ含まれています。

  • Flight_Delays_Prediction_with_RFlight_Delays_Prediction_with_MRS では、R、Machine Learning、過去の定時運行データおよび気象データを使用して、航空便の遅延を予測する方法を示します。
  • Machine learning には、航空便の遅延、住宅価格およびレンタルサイクルの予測を学習するためのサンプルが 3 つ含まれており、R と MRS のアプリケーションを実際の問題に対してデモします。 また、いくつかの一般的な Machine Learning モデルを使用し、Azure Machine Learning ワークスペースを使用して、Azure Web サービスとして配置する方法も示します。

  • R_MRO_MRS_Comparison は、6 パーツの比較で、構文、コンストラクト、およびパフォーマンスを含む、R、Microsoft R Open、および Microsoft R Server の類似点と相違点を示しています。

Microsoft R Open および Microsoft R Server の特別な点

Microsoft R Open (Microsoft が配布する R) は、次の 2 つの重要な点が CRAN R とは異なります。

  1. Intel 数値演算ライブラリと併用時の優れた計算性能。 Microsoft R Open と共に使用するために、Microsoft から無料でダウンロードして入手できます。

  2. 再現可能な R ツールキット。これは、R プログラムをビルドするために使用したライブラリを、作業を再現する必要がある他のユーザーが常に入手できるようにします。

Microsoft R Server は、R の拡張機能であり、多くのデータを高速に処理することができます。 次の 2 つの利便性の高い機能を R に提供します。

  1. 大容量のデータセット。 MRS では、Hadoop クラスター、データベース、およびデータ ウェアハウスなど、さまざまなソースからメモリ不足になるデータを処理することができます。 もう RAM の制限を受けることはありません。

  2. 並行、マルチコア処理。 MRS では、利用可能な演算リソース全体に計算を効率的に分散させることができます。 個人のワークステーションまたはリモート クラスターで、MRS は回答を高速に取得します。

次の比較では、MKL を使用する MRS と MRO が、MKL を使用しない R と MRO より特定のマトリックス計算に関連する計算性能で特に優れていることを示しています。 シミュレートされたデータは、この計算で使用されます。

MKL を使用する MRS と MRO と MKL を使用しない R と MRO の比較

MRO および MRS を使用した R の技術的な比較については、Lixun Zhang の詳細なディスカッションに関するページを参照してください。

次の図は、予定された旅客機の到着が 15 分以上遅延になるかどうかを予測する、ロジスティック回帰モデルのビルドに使用された経過時間を秒単位で比較しています。 CRAN R で使われた経過時間は、行が少し増えると大幅に増加しますが、MRS では約 2 倍のみ増加しています。 このベンチマークの詳細については、Benchmarks/rxGlm_benchmark.R の例を確認してください。

rxGlm のベンチマーク