多元羅吉斯迴歸元件

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件來建立羅吉斯迴歸模型,以用來預測多個值的結果。

使用羅吉斯回歸的分類是受監督的學習方法,因此需要已加上標籤的資料集。 您可以透過提供模型和加上標籤的資料集做為元件 (例如定型模型) 的輸入來定型該模型。 然後便可以使用已定型的模型來預測新輸入範例的值。

Azure Machine Learning 也提供二元或二分變數分類的二元羅吉斯迴歸元件。

關於多元羅吉斯迴歸

羅吉斯迴歸是統計學中知名的方法,用來預測結果的機率,也普遍用於分類工作。 此演算法會將資料填入羅吉斯函式,以預測事件的發生機率。

在多級羅吉斯迴歸中,分類器可以用來預測多個結果。

設定多級羅吉斯迴歸

  1. 多級羅吉斯迴歸元件新增至管線。

  2. 設定 [建立定型模式] 選項來指定要如何定型模型。

    • 單一參數:如果您知道要如何設定模型,請使用此選項,並提供一組特定值做為引數。

    • 參數範圍:如果您不確定最佳參數,且想要執行參數掃掠,請選取此選項。 選取要反覆運算的值範圍,而調整模型超參數會反覆運算您提供的所有可能設定的組合,以判斷可產生最佳結果的超參數。

  3. 最佳化允差,指定最佳化工具收斂的閾值。 換句話說,如果反覆運算之間的改進少於臨界值,此演算法會停止,並傳回目前的模型。

  4. L1 正規化權數L2 正規化權數:輸入要用於正規化參數 L1 和 L2 的值。 非零值建議用於兩者。

    正規化是以極端係數值來懲罰模型,以防止過度學習的一種方法。 正規化的運作方式是將假設錯誤加上係數值相關聯的懲罰。 具有極端係數值的精確模型會受到較多懲罰,而具有較保守值的不精確模型受到較少懲罰。

    L1 與 L2 regularization 有不同的效果,並使用。 L1 可以套用到疏鬆的模型,使用高維度資料時,這是很有用。 相較之下,L2 regularization 是不是疏鬆的資料。 此演算法支援 L1 和 L2 正規化值的線性組合:也就是說,如果 x = L1y = L2,則 ax + by = c 定義正規項的線性範圍。

    對於羅吉斯迴歸模型,已設計出 L1 和 L2 項的各種線性組合,例如彈性網路正規化

  5. 亂數散播:如果您想要讓結果可重複執行,請輸入整數值做為演算法的種子。 否則,將會使用系統時鐘值當作種子,如此可在您每次執行管線時產生稍微不同的結果。

  6. 連線已加上標籤的資料集,並定型模型:

    • 如果您將 [建立定型模式] 設定為 [單一參數],請連接已標記的資料集和定型模型元件。

    • 如果您將 [建立定型模式] 設定為 [參數範圍],請連接已標記的資料集,並使用調整模型超參數來定型模型。

    注意

    如果您將參數範圍傳遞給定型模型,則系統只會使用單一參數清單中的預設值。

    如果您將單一組參數值傳遞至調整模型超參數元件,當其預期每個參數有一組設定時,則會忽略這些值,並對學習模組使用預設值。

    如果您選取 [參數範圍] 選項,並對任何參數輸入單一值,則在整個掃掠期間都會使用您所指定的該單一值,即使其他參數在某個範圍的值之間變更亦然。

  7. 提交管線。

後續步驟

請參閱 Azure Machine Learning 可用的元件集