microsoftml (SQL Server Machine Learning Services の Python パッケージ)

適用対象: SQL Server 2017 (14.x) 以降

microsoftml は、Microsoft が提供する Python パッケージであり、ハイパフォーマンスの機械学習アルゴリズムを備えています。 トレーニング、変換、スコアリング、テキストと画像の分析、既存のデータから値を派生させるための特徴抽出を行うための関数が含まれています。 このパッケージは、SQL Server Machine Learning Services に含まれており、マルチコア処理を使用したビッグ データでのハイパフォーマンス、および高速データ ストリーミングをサポートしています。

パッケージの詳細 情報
現在のバージョン: 9.4
基礎となるプログラミング言語: Python 3.7.1Anaconda 4.2 ディストリビューション
パッケージ ディストリビューション: SQL Server Machine Learning Services バージョン 2017 または 2019。

microsoftml の使用方法

インストールに Python を追加すると、SQL Server Machine Learning サービスの一部として、microsoftml モジュールがインストールされます。 独占パッケージの完全コレクションに加え、Python ディストリビューション、そのモジュールとインタープリターを取得できます。 Python IDE を使用し、microsoftml で Python スクリプトを呼び出す関数を作成できますが、そのスクリプトは、Python と SQL Server Machine Learning サービスがインストールされたコンピューター上で実行する必要があります。

microsoftmlrevoscalepy は密結合されています。microsoftml で使用されるデータ ソースは、revoscalepy オブジェクトとして定義されています。 revoscalepy でコンピューティング コンテキストの制限は microsoftml に転送されます。 つまり、ローカル操作ではすべての機能を使用できますが、リモート コンピューティング コンテキストに切り替えるには RxSpark または RxInSQLServer が必要です。

バージョンとプラットフォーム

microsoftml モジュールは次のいずれかの Microsoft 製品またはダウンロードをインストールした場合にのみ利用できます。

Note

完全な製品リリース バージョンは、SQL Server 2017 では Windows のみです。 SQL Server 2019microsoftml では、Windows と Linux の両方がサポートされています。

パッケージの依存関係

microsoftml のアルゴリズムは、次に関して revoscalepy に依存します。

  • データ ソース オブジェクト - microsoftml 関数によって使用されるデータは、revoscalepy 関数を使用して作成されます。
  • リモート コンピューティング (関数の実行をリモート SQL Server インスタンスにシフトする) - revoscalepy パッケージには、SQL Serverのリモート計算コンテキストを作成してアクティブ化するための関数があります。

ほとんどの場合、microsoftml を使用しているときは常に、パッケージをまとめて読み込みます。

カテゴリ別の関数

このセクションでは、関数をカテゴリ別に一覧表示し、それぞれの使用方法について説明します。 目次を使用して関数をアルファベット順に検索することもできます。

1 - トレーニング関数

機能 説明
microsoftml.rx_ensemble モデルのアンサンブルをトレーニングします。
microsoftml.rx_fast_forest ランダム フォレスト。
microsoftml.rx_fast_linear 線形モデル。 確率的双対座標上昇法による。
microsoftml.rx_fast_trees ブーストされたツリー。
microsoftml.rx_logistic_regression ロジスティック回帰。
microsoftml.rx_neural_network ニューラル ネットワーク。
microsoftml.rx_oneclass_svm 異常検出。

2 - 変換関数

カテゴリ変数の処理

機能 説明
microsoftml.categorical テキスト列をカテゴリに変換します。
microsoftml.categorical_hash テキスト列をハッシュし、カテゴリに変換します。

スキーマ操作

機能 説明
microsoftml.concat 複数の列を連結して 1 つのベクトルにします。
microsoftml.drop_columns データセットから列を削除します。
microsoftml.select_columns データセットの列を保持します。

選択、変数

機能 説明
microsoftml.count_select カウントに基づく特徴の選択。
microsoftml.mutualinformation_select 相互情報に基づく特徴の選択。

テキスト分析

機能 説明
microsoftml.featurize_text テキスト列を数的特徴に変換します。
microsoftml.get_sentiment 感情分析。

画像分析

機能 説明
microsoftml.load_image 画像を読み込みます。
microsoftml.resize_image 画像サイズを変更します。
microsoftml.extract_pixels 画像からピクセルを抽出します。
microsoftml.featurize_image 画像を特徴に変換します。

特徴付け関数

機能 説明
microsoftml.rx_featurize データ ソースのデータ変換

スコア付け関数

関数 説明
microsoftml.rx_predict Microsoft 機械学習アルゴリズムを使用してスコアを付けます。

microsoftml を呼び出す方法

microsoftml 内の関数は、ストアド プロシージャにカプセル化された Python コードで呼び出すことができます。 ほとんどの開発者は、microsoftml ソリューションをローカルでビルドし、完成した Python コードを展開の練習としてストアド プロシージャに移行します。

Python の microsoftml パッケージは既定でインストールされますが、revoscalepy とは異なり、SQL Server でインストールされる Python 実行ファイルで Python を起動したとき、既定では読み込まれません。

最初の手順として、microsoftml パッケージをインポートし、リモート計算コンテキスト、関連する接続またはデータ ソース オブジェクトを使用する必要がある場合は、次に revoscalepy をインポートします。 その後、必要な個々の関数を参照します。

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

関連項目