什麼是 Azure Machine Learning 設計工具?

Azure Machine Learning 設計工具是一種拖放介面,用來在 Azure Machine Learning 中定型和部署模型。 本文描述您可以在設計工具中執行的工作。

Azure Machine Learning designer example

設計工具會使用您的 Azure Machine Learning 工作區來組織共用的資源,例如:

模型訓練和部署

使用視覺化畫布來建置端對端機器學習工作流程。 在設計工具中定型、測試及部署模型:

  • 資料集元件拖放至畫布上。
  • 連接所有元件,以建立管線草稿
  • 使用 Azure Machine Learning 工作區中的計算資源,提交管線執行
  • 將您的訓練管線轉換為推斷管線
  • 將管線發佈至 REST 管線端點,提交以不同參數和資料集執行的新管線。
    • 發佈訓練管線,以在變更參數和資料集時重複使用單一管線來訓練多個模型。
    • 發佈批次推斷管線,以使用先前訓練的模型對新資料進行預測。
  • 即時推斷管線部署到線上端點,以針對新資料進行即時預測。

Workflow diagram for training, batch inference, and real-time inference in the designer

管線

管線是由您連接的資料集和分析元件所組成。 管線有許多用途:您可以建立用來訓練單一模型的管線,或是用來訓練多個模型的管線。 您可以建立可即時或以批次方式進行預測的管線,或建立只清除資料的管線。 管線可讓您重複使用工作及組織您的專案。

管線草稿

當您在設計工具中編輯管線時,您的進度會儲存為管線草稿。 您可以在任何時間點編輯管線草稿,例如新增或移除元件、設定計算目標、建立參數等等。

有效的管線具有下列特性:

  • 資料集只能連接至元件。
  • 元件只能連接至資料集或其他元件。
  • 元件的所有輸入連接埠皆必須具有資料流程的某些連線。
  • 必須設定每個元件的所有必要參數。

當您準備好要執行管線草稿時,即可提交管線執行。

管線執行

每次執行管線時,管線的設定和其結果都會以管線執行的形式儲存在工作區中。 您可回到任何管線執行,檢查其是否需要進行疑難排解或稽核。 複製管線執行,以建立新的管線草稿來進行編輯。

管線執行會分組到各個實驗,以組織執行歷程記錄。 您可以設定每個管線執行的實驗。

資料集

機器學習資料集可讓您輕鬆地存取和使用您的資料。 設計工具中包含數個範例資料集,可供您在實驗時使用。 您可以視需要來註冊更多資料集。

元件

元件是指您在資料上可執行的演算法。 設計工具有許多元件,從資料輸入函式到定型、評分和驗證流程都有。

元件可能具有一組參數,可用來設定元件的內部演算法。 當您在畫布上選取元件時,元件的參數會顯示在畫布右邊的 [屬性] 窗格中。 您可以在此窗格中修改參數來調整模型。 您可在設計工具中設定個別元件的計算資源。

Component properties

如需瀏覽可用機器學習服務演算法程式庫的一些說明,請參閱演算法&元件參考概觀。 如需演算法選擇的說明,請參閱 Azure Machine Learning 演算法速查表

計算資源

使用您工作區中的計算資源來執行管線,並將部署的模型裝載為線上端點或管線端點 (適用於批次推斷)。 支援的計算目標包括:

計算目標 訓練 部署
Azure Machine Learning Compute
Azure Kubernetes Service

計算目標會附加至您的 Azure Machine Learning 工作區。 您可以在 Azure Machine Learning Studio 的工作區中管理計算目標。

部署

若要執行即時推斷,您必須將管線部署為線上端點。 線上端點會在外部應用程式和您的評分模型之間建立介面。 呼叫線上端點會即時將預測結果傳回到應用程式。 若要對線上端點進行呼叫,請傳遞部署端點時所建立的 API 金鑰。 端點會以 REST 為基礎,這是一種常見的 Web 程式設計專案架構。

線上端點必須部署到 Azure Kubernetes Service 叢集。

若要了解如何部署您的模型,請參閱教學課程:透過設計工具部署機器學習模型

注意

Azure Machine Learning 端點 (預覽) 提供經過改良且更簡單的部署體驗。 端點同時支援即時和 Batch 推斷案例。 端點會提供整合介面,以叫用和管理跨計算類型的模型部署。 請參閱什麼是 Azure Machine Learning 端點 (預覽)?

發佈

您也可以將管線發佈到管線端點。 與線上端點類似,管線端點可讓您使用 REST 呼叫從外部應用程式提交新的管線執行。 不過,您無法使用管線端點即時傳送或接收資料。

已發佈的管線具有彈性,可用於訓練或重新訓練模型、執行批次推斷、處理新資料等等。 您可以將多個管線發佈至單一管線端點,並指定要執行哪個管線版本。

已發佈的管線會在每個元件管線草稿中所定義的計算資源上執行。

設計工具會建立與 SDK 相同的 PublishedPipeline 物件。

後續步驟