敏捷式資料科學專案開發

本文件說明開發人員如何藉由使用 Team Data Science Process (TDSP),在專案小組中以系統化、版本控制,以及共同作業的方式執行資料科學專案。 TDSP 是由 Microsoft 開發的架構,可提供一系列的活動,以有效率地執行以雲端為基礎的預測性分析解決方案。 如需資料科學小組所處理的角色和工作的大綱,請參閱 Team Data 科學程式角色和工作(task)。

本文章包含如何執行以下作業的指示:

  • 針對專案中包含的工作專案進行短期 衝刺計畫
  • 工作專案 加入至短期衝刺。
  • 建立和使用專門與 TDSP 生命週期階段一致的 agile 衍生工作專案範本

下列指示概述使用 Azure Boards 和 Azure DevOps 中 Azure Repos 設定 TDSP 小組環境所需的步驟。 這些指示會使用 Azure DevOps,因為這是如何在 Microsoft 中執行 TDSP。 如果您的群組使用不同的程式碼裝載平臺,則小組負責人工作通常不會變更,但完成工作的方式會不同。 例如,與 Git 分支連結的工作專案可能與使用 Azure Repos 的 GitHub 不同。

下圖說明典型的短期衝刺計畫、編碼,以及資料科學專案的原始檔控制工作流程:

Team Data Science Process

工作專案類型

在 TDSP 短期衝刺計畫架構中,有四個經常使用的 工作專案 類型: 功能使用者案例、工作 bug。 所有工作專案的待處理專案都是在專案層級,而不是 Git 存放庫層級。

以下是工作專案類型的定義:

  • 功能:對應至專案參與的功能。 與用戶端的不同合作是不同的功能,因此最好將專案的不同階段視為不同的功能。 如果您選擇架構 <ClientName>-<EngagementName> ,例如命名您的功能,您可以輕鬆地辨識專案的內容,並從名稱本身參與。

  • 使用者 案例:使用者案例是完成功能端對端所需的工作專案。 使用者案例的範例包括:

    • 取得資料
    • 探索資料
    • 產生功能
    • 建置模型
    • 模型運作
    • 重新定型模型
  • 工作 :工作 是可指派的工作專案,必須完成才能完成特定的使用者案例。 例如,使用者案例中的工作會 取得資料

    • 取得 SQL Server 認證
    • 將資料上傳至 Azure Synapse Analytics
  • Bug: bug 是在現有的程式碼或檔中,必須修正才能完成工作的問題。 如果錯誤是由遺失的工作專案所造成,則可以提升為使用者案例或工作。

資料科學家可能會覺得更適合使用敏捷式範本,以 TDSP 生命週期階段和階段取代功能、使用者案例和工作。 若要建立專門與 TDSP 生命週期階段一致的 agile 衍生範本,請參閱 使用 AGILE TDSP 工作範本

注意

TDSP 會從軟體程式碼管理 (SCM) ,借用功能、使用者案例、工作和 Bug 的概念。 TDSP 概念可能會與傳統 SCM 定義稍有不同。

規劃短期衝刺

許多資料科學家都參與多個專案,這可能需要數個月才能完成,並在不同的步調繼續進行。 短期衝刺計劃對於專案優先順序,以及資源規劃和配置相當有用。 在 Azure Boards 中,您可以輕鬆地建立、管理和追蹤專案的工作專案,並進行短期衝刺計畫,以確保專案會如預期般向前移動。

如需短期衝刺計畫的詳細資訊,請參閱 Scrum 短期衝刺

如需 Azure Boards 中短期衝刺計畫的詳細資訊,請參閱 將待處理專案指派給短期衝刺。

將功能加入至待處理專案

建立專案和專案程式碼存放庫之後,您可以將功能新增至待處理專案,以代表專案的工作。

  1. 從您的專案頁面,選取 > 左側導覽列中的 [面板待處理專案]。

  2. 在 [ 處理專案] 索引標籤上,如果頂端列中的工作專案類型是 [ 故事]、[下拉] 和 [選取 功能]。 然後選取 [ 新增工作專案]。

    選取 [新增工作專案]

  3. 輸入功能的標題,通常是您的專案名稱,然後選取 [ 新增至頁首]。

    輸入標題,然後選取 [新增至頁首]

  4. 處理專案清單中,選取並開啟新的功能。 填寫描述、指派小組成員,以及設定規劃參數。

    您也可以選取 [開發] 區段底下的 [新增連結],將功能連結至專案的 Azure Repos 程式碼存放庫。

    編輯功能之後,請選取 [ 儲存] & 關閉]。

    編輯功能,然後選取 [儲存] & 關閉

將使用者案例新增至功能

在功能下,您可以新增使用者案例來描述完成專案所需的主要步驟。

若要將新的使用者案例加入至功能:

  1. 在 [ 處理專案] 索引標籤上,選取 + 功能左邊的。

    在功能底下新增使用者案例

  2. 提供使用者案例標題,並編輯指派、狀態、描述、批註、規劃和優先順序等詳細資料。

    您也可以選取 [開發] 區段底下的 [新增連結],將使用者案例連結至專案 Azure Repos 程式碼存放庫的分支。 選取您要連結工作專案的存放庫和分支,然後選取 [確定]

    新增連結

  3. 當您完成編輯使用者案例時,請選取 [ 儲存 & 關閉]。

將工作新增至使用者案例

工作是完成每個使用者案例所需的特定詳細步驟。 當使用者案例的所有工作都完成之後,使用者案例也應完成。

若要將工作加入至使用者案例,請選取 [ + 使用者案例] 專案旁的,然後選取 [工作]。 填寫工作中的標題和其他資訊。

將工作新增至使用者案例

建立功能、使用者案例 和工作之後 ,您可以在 [待處理專案 ] 或 [ 面板] 視圖中加以查看,以追蹤其狀態。

待處理專案(backlog)

面板視圖

使用 agile TDSP 工作範本

資料科學家可能會覺得更適合使用敏捷式範本,以 TDSP 生命週期階段和階段取代功能、使用者案例和工作。 在 Azure Boards 中,您可以建立 agile 衍生的範本,使用 TDSP 生命週期階段來建立和追蹤工作專案。 下列步驟將逐步解說如何設定資料科學特定 agile 流程範本,以及如何根據範本建立資料科學工作專案。

設定 Agile 資料科學流程範本

  1. 從您的 Azure DevOps 組織主頁面上,選取左側導覽中的 [ 組織設定 ]。

  2. 在 [ 組織設定 ] 左側導覽的 [面板 ] 下, 選取 [ 處理]。

  3. 在 [所有進程] 窗格中,選取 Agile 旁的 ... ,然後選取 [建立繼承的進程]。

    從 Agile 建立繼承的進程

  4. 在 [ 從 Agile 建立繼承的進程 ] 對話方塊中,輸入名稱 AgileDataScienceProcess,然後選取 [ 建立進程]。

    建立 AgileDataScienceProcess 流程

  5. 在 [ 所有進程] 中,選取新的 AgileDataScienceProcess

  6. 在 [工作專案類型] 索引標籤上,選取每個專案 旁邊的 [...] ,然後選取[ 用],以停用 長篇功能使用者案例 和工作。

    停用工作專案類型

  7. 在 [所有程式] 中,選取 [待****處理 專案] 索引標籤。在 [組合待處理 專案] 底下,選取 [已停用的長篇 (]),然後選取 [編輯/重新命名 ]。

  8. 在 [ 編輯待處理專案層級 ] 對話方塊中:

    1. 在 [ 名稱] 底下,將 [ 長篇故事 ] 取代為 TDSP 專案
    2. 此待處理專案層級的 [工作專案類型] 底下,選取 [ 新增工作專案類型]、輸入 TDSP 專案,然後選取 [ 加入]。
    3. 在 [ 預設工作專案類型] 底下,下拉並選取 [ TDSP 專案]。
    4. 選取 [儲存]。

    設定待辦專案組合層級

  9. 遵循相同的步驟將 功能 重新命名為 TDSP 階段,然後新增下列新的工作專案類型:

    • 了解商務
    • 資料獲取
    • 模型化
    • 部署
  10. 在 [ 需求待 處理專案] 下,將 [ 故事 ] 重新命名為 TDSP 階段,加入新的工作專案類型 TDSP Substage,並將預設工作專案類型設定為 TDSP Substage

  11. 在 [ 反覆運算待 處理專案] 下,加入新的工作專案類型 [ TDSP 工作],並將它設定為預設工作專案類型。

完成這些步驟之後,待處理專案層級看起來應該像這樣:

TDSP 範本待處理專案層級

建立 Agile 資料科學處理工作專案

您可以使用資料科學流程範本來建立 TDSP 專案,並追蹤對應至 TDSP 生命週期階段的工作專案。

  1. 從您的 Azure DevOps 組織主頁面上,選取 [ 新增專案]。

  2. 在 [ 建立新專案 ] 對話方塊中,為您的專案提供名稱,然後選取 [ Advanced]。

  3. 在 [ 工作專案進程] 下,從下拉式清單選取 [ AgileDataScienceProcess],然後選取 [ 建立]。

    建立 TDSP 專案

  4. 在新建立的專案中,選取 > 左側導覽列中的 [面板待處理專案]。

  5. 若要讓 TDSP 專案可見,請選取 [ 設定小組設定 ] 圖示。 在 [ 設定 ] 畫面中,選取 [ TDSP 專案 ] 核取方塊,然後選取 [ 儲存後關閉]。

    選取 TDSP 專案核取方塊

  6. 若要建立資料科學特定的 TDSP 專案,請選取頂端列中的 [ TDSP 專案 ],然後選取 [ 新增工作專案]。

  7. 在快顯視窗中,提供 TDSP 專案工作專案的名稱,然後選取 [ 加入至頁首]。

    建立資料科學專案工作專案

  8. 若要在 TDSP 專案下新增工作專案,請選取 + 專案旁的,然後選取要建立的工作專案類型。

    選取資料科學工作專案類型

  9. 填寫 [新增工作專案] 中的詳細資料,然後選取 [ 儲存] & 關閉]。

  10. 繼續選取 + 工作專案旁邊的符號,以加入新的 TDSP 階段、階段和工作。

以下是資料科學專案工作專案應該如何出現在待處理專案( backlog )視圖中的範例:

18

下一步

使用 git 共同作業程式碼描述如何使用 git 作為共用程式碼開發架構來進行資料科學專案的共同作業程式碼開發,以及如何將這些編碼活動連結到以 agile 程式規劃的工作。

範例 逐步解說會列出特定案例的逐步解說,其中包含連結和縮圖描述。 連結的案例說明如何將雲端和內部部署工具和服務組合成工作流程或管線,以建立智慧型應用程式。

敏捷式流程的其他資源: