多元羅吉斯迴歸元件
本文描述 Azure Machine Learning 設計工具中的一個元件。
使用此元件來建立羅吉斯迴歸模型,以用來預測多個值的結果。
使用羅吉斯回歸的分類是受監督的學習方法,因此需要已加上標籤的資料集。 您可以透過提供模型和加上標籤的資料集做為元件 (例如定型模型) 的輸入來定型該模型。 然後便可以使用已定型的模型來預測新輸入範例的值。
Azure Machine Learning 也提供二元或二分變數分類的二元羅吉斯迴歸元件。
關於多元羅吉斯迴歸
羅吉斯迴歸是統計學中知名的方法,用來預測結果的機率,也普遍用於分類工作。 此演算法會將資料填入羅吉斯函式,以預測事件的發生機率。
在多級羅吉斯迴歸中,分類器可以用來預測多個結果。
設定多級羅吉斯迴歸
將多級羅吉斯迴歸元件新增至管線。
設定 [建立定型模式] 選項來指定要如何定型模型。
單一參數:如果您知道要如何設定模型,請使用此選項,並提供一組特定值做為引數。
參數範圍:如果您不確定最佳參數,且想要執行參數掃掠,請選取此選項。 選取要反覆運算的值範圍,而調整模型超參數會反覆運算您提供的所有可能設定的組合,以判斷可產生最佳結果的超參數。
最佳化允差,指定最佳化工具收斂的閾值。 換句話說,如果反覆運算之間的改進少於臨界值,此演算法會停止,並傳回目前的模型。
L1 正規化權數和 L2 正規化權數:輸入要用於正規化參數 L1 和 L2 的值。 非零值建議用於兩者。
正規化是以極端係數值來懲罰模型,以防止過度學習的一種方法。 正規化的運作方式是將假設錯誤加上係數值相關聯的懲罰。 具有極端係數值的精確模型會受到較多懲罰,而具有較保守值的不精確模型受到較少懲罰。
L1 與 L2 regularization 有不同的效果,並使用。 L1 可以套用到疏鬆的模型,使用高維度資料時,這是很有用。 相較之下,L2 regularization 是不是疏鬆的資料。 此演算法支援 L1 和 L2 正規化值的線性組合:也就是說,如果
x = L1
且y = L2
,則ax + by = c
定義正規項的線性範圍。對於羅吉斯迴歸模型,已設計出 L1 和 L2 項的各種線性組合,例如彈性網路正規化。
亂數散播:如果您想要讓結果可重複執行,請輸入整數值做為演算法的種子。 否則,將會使用系統時鐘值當作種子,如此可在您每次執行管線時產生稍微不同的結果。
連線已加上標籤的資料集,並定型模型:
提交管線。
後續步驟
請參閱 Azure Machine Learning 可用的元件集。