Visual Studio でのデータ サイエンスと分析のアプリケーションのワークロード

Visual Studio のデータ サイエンスおよび分析アプリケーションのワークロードには、複数の言語とそれぞれのランタイム ディストリビューションがまとめられています。

Python は、データ サイエンスで使用される主要なスクリプト言語です。 Python は学習しやすく、充実したエコシステムによって提供される数々のパッケージも活用できます。 それらのパッケージは、データの取得、クリーンアップ、モデルのトレーニング、展開およびプロットなどの広範囲のシナリオに対応しています。 F# も、さまざまなデータ処理タスクに適した、機能第一の強力な .NET 言語です。

Visual Studio と R、Python、F# コード プロジェクトを示すスクリーンショット。

ワークロードのインストール

データ サイエンスおよび分析アプリケーションのワークロードは、Visual Studio インストーラーの [ワークロードワークロード]>[その他のツールセット] で利用できます。

Visual Studio インストーラー 2022 でデータ サイエンスおよび分析アプリケーションのワークロードを選択する方法を示すスクリーンショット。

Visual Studio インストーラー 2019 でデータ サイエンスおよび分析アプリケーションのワークロードを選択する方法を示すスクリーンショット。

デフォルトで、次のオプションがワークロードによってインストールされます。これらのオプションは、Visual Studio インストーラーのワークロードの [概要] セクションで変更できます。

  • F# デスクトップ言語のサポート
  • Python:
    • Python 言語サポート
    • Python Web サポート
    • Python ネイティブ開発ツール

SQL Server の統合

SQL Server では、SQL Server 内で直接高度な分析を行うことが可能な Python の使用をサポートしています。 Python は SQL Server 2017 CTP 2.0 以降でサポートされています。

データが既にあるところでコードを実行すると、次のような利点があります。

  • データ移動が不要: データをデータベースからアプリケーションまたはモデルに移動せずに、データベース内でアプリケーションをビルドできます。 この機能により、セキュリティ、コンプライアンス、ガバナンス、整合性の障壁が取り除かれ、膨大な量のデータの移動に関連する、多くの問題も解決できます。 また、クライアントのマシンのメモリに入りきらないデータセットも使用できます。

  • 導入が簡単: 準備したモデルを T-SQL スクリプトに埋め込むだけで、それを運用環境にデプロイできます。 任意の言語で記述された任意の SQL クライアント アプリケーションで、ストアド プロシージャ呼び出しを使用して、モデルおよびインテリジェンスを利用することができます。 特定の言語統合は必要ありません。

  • エンタープライズ レベルのパフォーマンスとスケール: メモリ内テーブルや列ストア インデックスなどの SQL Server の高度な機能を、RevoScale パッケージの高性能かつ拡張性の高い API と共に使用できます。 データの移動が不要になれば、データが増加した場合やアプリケーションのパフォーマンスを向上させる際のクライアント メモリの制約も回避できます。

  • 拡張性が高い: SQL Server に任意の最新のオープン ソース パッケージをインストールし実行して、SQL Server 内の大量のデータにディープ ラーニングおよび AI アプリケーションを構築できます。 SQL Server にパッケージをインストールすることは、ローカル マシンにパッケージをインストールするのと同じくらい簡単です。

  • 追加コストなしで広範に利用可能: 言語は、Express Edition を含む SQL Server 2017 以降のすべてのエディションに統合できます。

SQL Server 統合のインストール

SQL Server への統合のメリットを最大限に得るには、Visual Studio インストーラーから [ワークロード]>[その他のツールセット]>[データ ストレージと処理] にアクセスし、ワークロードをインストールします。 [SQL Server Data Tools] オプションを選択して、SQL IntelliSense、構文の強調表示、展開を有効にします。

Visual Studio インストーラー 2022 でデータ ストレージと処理ワークロードを選択する方法を示すスクリーンショット。

Visual Studio インストーラー 2019 でデータ ストレージと処理ワークロードを選択する方法を示すスクリーンショット。

詳細については、「SQL Server 2017 での Python: データベース内機械学習の強化 (ブログ)」をご覧ください。

その他のサービスと SDK

データ サイエンスおよび分析アプリケーション ワークロードから直接利用できる機能に加え、Visual Studio Code の Notebooks と Azure SDK for Python もデータ サイエンスに役立ちます。

Azure SDK for Python を使用すると、Windows、Mac、Linux で実行されているアプリケーションからの Microsoft Azure サービスの使用と管理が簡単になります。 詳細については、「Python 開発者向けの Azure」をご覧ください。

Jupyter 拡張機能と Visual Studio Code の Notebooks を組み合わせれば、Jupyter の開発をサポートでき、追加の言語拡張機能を使用してプロジェクトを強化することもできます。 このサービスには、使用を開始できるように Python、R および F# のサンプル ノートブックが含まれています。 詳細については、「Microsoft と GitHub のすべてのノートブック エクスペリエンスに関する詳細情報」をご覧ください。

R の概要のサンプルとして、Jupyter で Notebooks を使用している様子を示すスクリーンショット。