Share via


在 Language Studio 中使用 Azure Machine Learning 標籤

標記資料是準備資料集的重要部分。 使用 Azure Machine Learning 中的標籤體驗,您可以體驗更簡單的共同作業、更多彈性,以及將 標籤工作外包Azure Market Place的外部標籤廠商的能力。 您可以針對下列專案使用 Azure Machine Learning 標籤:

必要條件

在您可以將標籤專案連線到 Azure Machine Learning 之前,您需要:

  • 已成功建立具有已設定 Azure Blob 儲存體帳戶的 Language Studio 專案。
  • 已上傳至您儲存體帳戶的文字資料。
  • 至少:
    • 自訂具名實體辨識的一個實體標籤,或
    • 自訂文字分類專案的兩個類別標籤。
  • 連線到 Language Studio 帳戶所使用的相同 Azure Blob 儲存體帳戶的Azure Machine Learning 工作區

限制

  • 將您的標籤專案連線到 Azure Machine Learning 是一對一連線。 如果您中斷連線專案,您將無法將專案連線回相同的 Azure Machine Learning 專案
  • 您無法同時在 Language Studio 和 Azure Machine Learning 中加上標籤。 標籤體驗一次會在一個 Studio 中啟用。
  • 在定型模型時,將會忽略您切換的標籤體驗中的測試和定型檔案。
  • 只有 Azure Machine Learning 的 JSONL 檔案格式可以匯入 Language Studio。
  • 啟用多重語言選項的專案無法連線到 Azure Machine Learning,而且不支援所有語言。
  • 您要連線的 Azure Machine Learning 工作區必須指派給 Language Studio 所連線的相同 Azure 儲存體帳戶。 請確定 Azure Machine Learning 工作區具有儲存體帳戶的儲存體 Blob 資料讀取器許可權。 工作區必須在建立Azure 入口網站期間連結到儲存體帳戶。
  • 在兩個標籤體驗之間切換不是立即的。 可能需要一段時間才能順利完成作業。

將您的 Azure Machine Learning 標籤匯入 Language Studio

Language Studio 支援 Azure Machine Learning 所使用的 JSONL 檔案格式。 如果您已在 Azure Machine Learning 上標記資料,您可以在新的自訂專案中匯入最新的標籤,以利用這兩個 Studio 的功能。

  1. 首先,建立自訂文字分類或自訂具名實體辨識的新專案。

    1. 在出現的 [ 建立專案 ] 畫面中,遵循提示來連線儲存體帳戶,並輸入專案的基本資訊。 請確定您所使用的 Azure 資源沒有另一個儲存體帳戶已連線。

    2. 在 [ 選擇容器] 區段中,選擇指出您已經有正確格式化檔案的選項。 然後選取您最新的 Azure Machine Learning 標籤檔案。

      顯示 Language Studio 中標籤檔案選取範圍的螢幕擷取畫面。

連線到 Azure Machine Learning

連線到 Azure Machine Learning 之前,您需要具有定價方案的 Azure Machine Learning 帳戶,以符合您專案的計算需求。 請參閱 必要條件一節 ,以確定您已完成開始將 Language Studio 專案連線到 Azure Machine Learning 的所有需求。

  1. 使用Azure 入口網站流覽至連線至語言資源的Azure Blob 儲存體帳戶。

  2. 請確定儲存體Blob 資料參與者角色已指派給您Azure Blob 儲存體帳戶的角色指派內的 AML 工作區。

  3. Language Studio中流覽至您的專案。 從專案的左側導覽功能表中,選取 [資料標籤]。

  4. 選取 [使用 Azure Machine Learning],在 [ 資料標籤 描述] 或 [ 活動] 窗格底下加上標籤。

    顯示 Azure Machine Learning 連結位置的螢幕擷取畫面。

  5. 選取 [連線至 Azure Machine Learning ] 以啟動連線程式。

    顯示 Language Studio 中 [Azure Machine Learning 連線] 按鈕的螢幕擷取畫面。

  6. 在出現的視窗中,遵循提示。 選取您先前在相同 Azure 訂用帳戶下建立的 Azure Machine Learning 工作區。 輸入將在 Azure Machine Learning 中建立以啟用標籤的新 Azure Machine Learning 專案名稱。

    提示

    請先確定您的工作區已連結至相同的Azure Blob 儲存體帳戶和語言資源,再繼續進行。 您可以使用 Azure 入口網站建立新的工作區,並連結到儲存體帳戶。 確定儲存體帳戶已正確連結至工作區。

  7. (選擇性) 開啟廠商標籤切換,以使用標籤廠商公司。 選擇廠商標籤公司之前,請連絡Azure Marketplace上的廠商標籤公司,以與他們完成合約。 如需與廠商公司合作的詳細資訊,請參閱 如何外包資料標籤

    您也可以為人類標籤員留下標籤指示,以協助您進行標籤程式。 這些指示可協助他們瞭解工作,方法是留下清楚的標籤定義,並包含更好的結果範例。

  8. 檢閱 Azure Machine Learning 連線的設定,並視需要進行變更。

    重要

    完成連線 是永久的。 嘗試中斷任何時間點的已建立連線,將會永久停用您的 Language Studio 專案,而無法連線到相同的 Azure Machine Learning 專案。

  9. 在起始連線之後,您的語言 Studio 中標籤資料的能力將會停用幾分鐘,以準備新的連線。

從 Language Studio 切換至使用 Azure Machine Learning 進行標籤

建立連線之後,您可以隨時透過 Language Studio 中的 [活動] 窗格 切換至 Azure Machine Learning。

顯示使用 Azure Machine Learning 切換至標籤按鈕的螢幕擷取畫面。

當您切換時,將會停用在 Language Studio 中標記資料的能力,而且您將能夠在 Azure Machine Learning 中標記資料。 您可以隨時透過 Azure Machine Learning 切換回 Language Studio 中的標籤。

如需如何標記文字的詳細資訊,請參閱 Azure Machine Learning 如何標記。 如需管理和追蹤文字標籤專案的相關資訊,請參閱 Azure Machine Learning 設定和管理文字標籤專案

使用來自 Azure Machine Learning 的標籤來定型模型

當您使用 Azure Machine Learning 切換至標籤時,您仍然可以在 Language Studio 中定型、評估及部署模型。 若要使用來自 Azure Machine Learning 的更新標籤來定型您的模型:

  1. 從專案語言工作室畫面左側的導覽功能表中選取 [定型作業 ]。

  2. 從訓練頁面中的 [選擇標籤來源] 區段中,選取[從 Azure Machine Learning 匯入最新的標籤]。 這會在開始定型作業之前,先同步處理來自 Azure Machine Learning 的標籤。

    螢幕擷取畫面,顯示從 Azure Machine Learning 使用標籤的選取器。

從 Azure Machine Learning 使用 Language Studio 切換至標籤

切換至使用 Azure Machine Learning 進行標籤之後,您可以隨時切換回 Language Studio 專案的標籤。

注意

  • 只有 Azure Machine Learning 中具有 正確角色 的使用者才能切換標籤。
  • 當您切換至使用 Language Studio 時,將會停用 Azure Machine Learning 上的標籤。

若要使用 Language Studio 切換回標籤:

  1. 流覽至 Azure Machine Learning 中的專案,然後從左側導覽功能表中選取 [資料標籤 ]。

  2. 選取 [Language Studio] 索引標籤,然後選取 [切換至 Language Studio]。

    螢幕擷取畫面,顯示從 Language Studio 使用標籤的選取器。

  3. 此程式需要幾分鐘的時間才能完成,而且在 Azure Machine Learning 中標籤的能力將會停用,直到從 Language Studio 切換回為止。

中斷與 Azure Machine Learning 的連線

中斷專案與 Azure Machine Learning 的連線是永久、無法復原的程式,而且無法復原。 您將無法再存取 Azure Machine Learning 中的標籤,且未來將無法將 Azure Machine Learning 專案重新連線到任何 Language Studio 專案。 若要中斷與 Azure Machine Learning 的連線:

  1. 藉由將標籤體驗切換回 Language Studio,確定您想要維護的任何更新標籤都會與 Azure Machine Learning 同步。
  2. 從 Language Studio 左側導覽功能表中選取 [專案設定 ]。
  3. 從 [管理 Azure Machine Learning 連線] 區段選取 [從 Azure Machine Learning 中斷連線] 按鈕。

下一步

深入瞭解為 自訂文字分類自訂具名實體辨識標記您的資料。