microsoftml (SQL Server 機器學習服務中的 Python 套件)

適用範圍:SQL Server 2017 (14.x) 及更新版本

microsoftml 為 Microsoft 的 Python 套件,提供高效能的機器學習演算法。 它包含用於定型與轉換、評分、文字與影像分析的函式,以及用於從現有資料衍生值的特徵擷取。 該套件包含在 SQL Server 機器學習服務中,並支援高效能巨量資料,同時使用多核心處理,以及快速的資料串流。

套件詳細資料 資訊
目前的版本: 9.4
建基於: Python 3.7.1Anaconda 4.2散發套件
套件散發: SQL Server 機器學習服務版本2017或2019。

如何使用 microsoftml

當您將 Python 新增至您的安裝時, microsoftml 模組會安裝為 SQL Server 機器學習服務的一部分。 您可以取得專屬套件的完整集合,再加上其模組和解譯器的 Python 散發套件。 您可以使用任何 python IDE 來撰寫 microsoftml 中的 python 腳本呼叫函式,但腳本必須在具有 Python SQL Server 機器學習服務的電腦上執行。

Microsoftmlrevoscalepy 緊密結合; microsoftml 中使用的資料來源會定義為 revoscalepy 物件。 Revoscalepy 傳輸至 microsoftml 的計算內容限制。 也就是說,所有功能都可供本機作業使用,但切換至遠端計算內容需要 RxSpark>rxinsqlserver

版本與平台

只有當您安裝下列其中一項 Microsoft 產品或下載時,才能使用 microsoftml 模組:

注意

在 SQL Server 2017 中,完整產品發行版本僅適用於 Windows。 在 SQL Server 2019 中,microsoftml 則同時支援 Windows 和 Linux。

套件相依性

microsoftml 中的演算法在下列方面倚賴 revoscalepy

  • 資料來源物件- microsoftml 函式所使用的資料是使用 revoscalepy 函數所建立。
  • 遠端運算 (將函式執行移至遠端 SQL Server 實例) - revoscalepy 封裝提供了用來建立和啟用 SQL 伺服器之遠端計算內容的函數。

在大多數情況下,您會在每次使用 microsoftml 時一起載入套件。

依類別區分的函式

本節依類別列出函式,讓您了解每個函式的使用方式。 您也可以使用目錄來依字母順序尋找函式。

1-定型函式

函式 描述
microsoftml.rx_ensemble 將一整團模型定型。
microsoftml.rx_fast_forest 隨機樹系。
microsoftml.rx_fast_linear 線性模型。 具有推測雙座標堆疊。
microsoftml.rx_fast_trees 強化樹。
microsoftml.rx_logistic_regression 羅吉斯迴歸。
microsoftml.rx_neural_network 類神經網路。
microsoftml.rx_oneclass_svm 異常偵測。

2-轉換函式

類別目錄變數處理

函式 描述
microsoftml.categorical 將文字資料行轉換成類別。
microsoftml.categorical_hash 將文字資料行雜湊並轉換成類別。

結構描述操作

函式 描述
microsoftml.concat 將多個資料行串連成單一向量。
microsoftml.drop_columns 置放來自資料集的資料行。
microsoftml.select_columns 保留資料集的資料行。

變數選取

函式 描述
microsoftml.count_select 以計數為基礎的特徵選取。
microsoftml.mutualinformation_select 以相互資訊為基礎的特徵選取。

文字分析

函式 描述
microsoftml.featurize_text 將文字資料行轉換成數值特徵。
microsoftml.get_sentiment 情感分析。

影像分析

函式 描述
microsoftml.load_image 載入影像。
microsoftml.resize_image 調整影像的大小。
microsoftml.extract_pixels 從影像中擷取像素。
microsoftml.featurize_image 將影像轉換成特徵。

特徵化函式

函式 描述
microsoftml.rx_featurize 資料來源的資料轉換

計分函數

函式 描述
microsoftml.rx_predict 使用 Microsoft 機器學習模型進行評分

如何呼叫 microsoftml

封裝在預存程序中的 Python 程式碼可呼叫 microsoftml 中的函式。 大多數開發人員會在本機建置 microsoftml 解決方案,然後將完成的 Python 程式碼移轉至預存程序作為部署練習。

適用於 Python 的 microsoftml 套件是預設的安裝項目,但與 revoscalepy 不同,當您使用與 SQL Server 一起安裝的 Python 可執行檔來啟動 Python 工作階段時,預設並不會載入此套件。

作為第一步,請載入 microsoftml 套件,然後如果您需要使用遠端計算內容、相關連線能力或資料來源物件,則載入 revoscalepy。 接著,參考您需要的個別函式。

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

另請參閱