使用 Azure Machine Learning 設計工具執行批次預測

在本文中,您將了解如何使用設計工具來建立批次預測管線。 批次預測可讓您依據需求,使用可從任何 HTTP 程式庫觸發的 Web 服務來持續對大型資料集進行評分。

在此操作說明中,您將了解下列工作:

  • 建立和發佈批次推斷管線
  • 使用管線端點
  • 管理端點版本

若要了解如何使用 SDK 來設定批次評分服務,請參閱隨附的管線批次評分教學課程

必要條件

本操作說明假設您已經有訓練管線。 如需設計工具的導引簡介,請完成設計工具教學課程的第一部分

重要

如果您看不到這份文件中提及的圖形元素,例如工作室或設計工具中的按鈕,可能是您沒有工作區的正確權限層級。 請洽詢您的 Azure 訂用帳戶管理員,以確認您已獲得授與正確的存取層級。 如需詳細資訊,請參閱管理使用者和角色

建立批次推斷管線

您的訓練管線必須至少執行一次,才能夠建立推斷管線。

  1. 移至工作區中的 [設計工具] 索引標籤。

  2. 選取訓練管線,以訓練您要用來進行預測的模型。

  3. 提交管線。

Submit the pipeline

Screenshot showing the set up pipeline job with the experiment drop-down and submit button highlighted.

您會在畫布左側看到提交清單。 您可以選取作業詳細資料連結以移至作業詳細資料頁面,然後在定型管線作業完成之後,您可以建立批次推斷管線。

Screenshot showing the submitted job list.

  1. 在作業詳細資料頁面中,選取畫布上方的下拉式 [建立推斷管線]。 選取 [批次推斷管線]

    注意

    目前自動產生推斷管線僅適用於設計工具內建元件完全建置的定型管線。

    Screenshot of the create inference pipeline drop-down with batch inference pipeline highlighted.

    其會為您建立批次推斷管線草稿。 批次推斷管線草稿會使用定型的模型作為 MD- 節點,並使用轉換作為來自定型管線作業的 TD- 節點。

    您也可以修改此推斷管線草稿,以更好地處理批次推斷的輸入資料。

    Screenshot showing a batch inference pipeline draft.

新增管線參數

若要在新資料上建立預測,您可以手動連結此管線草稿檢視中的不同資料集,或為您的資料集建立參數。 參數可讓您變更執行階段上的批次推斷程序行為。

在本節中,您會建立資料集參數來指定進行預測所需的不同資料集。

  1. 選取資料集元件。

  2. 窗格會出現在畫布的右邊。 在窗格底部,選取 [設定為管線參數]

    輸入參數的名稱,或接受預設值。

    Screenshot of cleaned dataset tab with set as pipeline parameter checked.

  3. 提交批次推斷管線,然後選取左窗格中的作業連結,以移至作業詳細資料頁面。

發佈您的批次推斷管線

現在您已經準備好部署推斷管線。 這會部署管線,並使其可供其他人使用。

  1. 選取 [發佈] 按鈕。

  2. 在出現的對話方塊中,展開 [PipelineEndpoint] 的下拉式清單,然後選取 [新增 PipelineEndpoint]

  3. 為端點提供名稱和選擇性的描述。

    在靠近對話方塊底部的地方,您可以看到您所設定的參數和訓練期間所使用的資料集識別碼預設值。

  4. 選取發行

Screenshot of set up published pipeline.

使用端點

現在,您有一個已發行的管線,其中包含資料集參數。 管線將會使用訓練管線中建立的已訓練模型,為您作為參數提供的資料集評分。

提交管線作業

在本節中,您將設定手動的管線作業並改變管線參數,以對新資料進行評分。

  1. 部署完成之後,請移至端點區段。

  2. 選取 [管線端點]

  3. 選取您建立的端點名稱。

Screenshot of the pipeline endpoint tab.

  1. 選取 [已發佈的管線]

    此畫面會顯示此端點下所有已發佈的管線。

  2. 選取您發佈的管線。

    管線的詳細資料分頁會顯示管線詳細作業記錄和連接字串資訊。

  3. 選取 [提交] 以建立管線的手動執行。

    Screenshot of set up pipeline job with parameters highlighted.

  4. 將參數變更為使用不同的資料集。

  5. 選取 [提交] 以執行管線。

使用 REST 端點

您可以在端點區段中,找到如何使用管線端點和已發佈管線的相關資訊。

您可以在 [作業概觀] 面板中找到管線端點的 REST 端點。 您可以呼叫端點來取用其預設的已發佈管線。

您也可以在 [已發佈的管線] 頁面中使用已發佈的管線。 選取已發佈的管線,您可以在圖形右邊的 [發佈的管線概觀] 面板中找到其 REST 端點。

若要進行 REST 呼叫,您需要 OAuth 2.0 Bearer-type 驗證標頭。 若要進一步了解如何設定對工作區進行驗證以及如何進行參數化 REST 呼叫,請參閱下列教學課程章節

版本控制端點

設計工具會將版本指派給您發佈至端點的每個後續管線。 您可以在 REST 呼叫中指定要當做參數執行的管線版本。 如果您未指定版本號碼,則設計工具會使用預設管線。

當您發佈管線時,您可以選擇讓其成為該端點的新預設管線。

Screenshot of set up published pipeline with set as default pipeline for this endpoint checked.

您也可以在端點的 [已發佈的管線] 索引標籤中,設定新的預設管線。

Screenshot of sample pipeline tab with set as default highlighted.

更新管線端點

如果在定型管線中進行一些修改,您可能會想要將新定型的模型更新至管線端點。

  1. 在您修改的定型管線成功完成之後,請移至作業詳細資料頁面。

  2. 以滑鼠右鍵按一下 [定型模型] 元件,然後選取 [註冊資料]

    Screenshot of the train model component options with register data highlighted.

    輸入名稱並選取 [檔案] 類型。

    Screenshot of register as data asset with new data asset selected.

  3. 尋找先前的批次推斷管線草稿,或者您可以只將已發佈的管線複製到新的草稿。

  4. 將推斷管線草稿中的 MD- 節點取代為上述步驟中已註冊的資料。

    Screenshot of updating the inference pipeline draft with the registered data in the step above.

  5. 更新資料轉換節點 TD- 與定型的模型相同。

  6. 接著您可以使用已更新的模型和轉換來提交推斷管線,然後重新發佈。

下一步

  • 依照設計工具教學課程的指示來定型和部署迴歸模型。
  • 如需如何使用 SDK v1 發佈和執行已發佈管線的詳細說明,請參閱如何部署管線一文。