針對自動化 ML 實驗進行疑難排解

適用於:Azure CLI ml 延伸模組 v2 (目前)Python SDK azure-ai-ml v2 (目前)

在本指南中,了解如何識別和解決自動化機器學習實驗中的問題。

針對工作室中適用於影像和 NLP 的自動化 ML 進行疑難排解

如果適用於影像和 NLP 的自動化 ML 發生作業失敗,您可以使用下列步驟來了解錯誤。

  1. 在工作室 UI 中,AutoML 作業應該會有失敗訊息,並指出失敗原因。
  2. 如需詳細資訊,請移至此 AutoML 作業的子作業。 這個子執行是 HyperDrive 作業。
  3. 在 [試用] 索引標籤中,您可以檢查為此 HyperDrive 執行所進行的所有試用。
  4. 移至失敗的試用作業。
  5. 這些作業應該會在 [概觀] 索引標籤的 [狀態] 區段中有錯誤訊息,並指出失敗原因。 選取 [查看更多詳細資料] 以取得失敗的詳細資料。
  6. 此外,您還可以在 [輸出 + 記錄] 索引標籤中檢視 std_log.txt,以查看詳細記錄和例外狀況追蹤。

如果您的自動化 ML 執行使用管線執行來進行試用,請遵循下列步驟來了解錯誤。

  1. 遵循上面的步驟 1-4 來識別失敗的試用作業。
  2. 此執行應該會向您顯示管線執行,且管線中的失敗節點會標示為紅色。 Diagram that shows a failed pipeline job.
  3. 選取管線中的失敗節點。
  4. 這些作業應該會在 [概觀] 索引標籤的 [狀態] 區段中有錯誤訊息,並指出失敗原因。 選取 [查看更多詳細資料] 以取得失敗的詳細資料。
  5. 您可以在 [輸出 + 記錄] 索引標籤中查看 std_log.txt,以查看詳細記錄和例外狀況追蹤。

下一步