在 Microsoft Fabric 中使用端對端 AI 範例

Microsoft Fabric 中的 Synapse 資料科學 軟體即服務 (SaaS) 體驗可協助機器學習專業人員在單一分析平臺中建置、部署及運作其機器學習模型,同時與其他重要角色共同作業。 本文說明 Synapse 資料科學 體驗的功能,以及機器學習模型如何解決常見的商務問題。

安裝 Python 連結庫

某些端對端 AI 範例需要其他連結庫,才能進行機器學習模型開發或臨機操作數據分析。 您可以選擇其中一個選項,快速安裝 Apache Spark 工作階段的連結庫。

使用內嵌安裝功能進行安裝

使用 Python 內嵌安裝功能,例如,%pip%conda - 在您的筆記本中安裝新的連結庫。 此選項只會在目前的筆記本中安裝連結庫,而不是在工作區中安裝。 使用此程式代碼來安裝連結庫。 <library name>取代為您的連結庫名稱:imblearnwordcloud

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

設定工作區的默認連結庫

若要讓您的連結庫可在工作區中的任何筆記本中使用,您可以使用 網狀架構環境 進行該用途。 您可以建立環境、在其中安裝連結庫,然後 您的工作區系統管理員可以 將環境附加至工作區作為其默認環境。 如需將環境設定為工作區預設值的詳細資訊,請參閱 管理員 設定工作區的默認連結庫。

重要

不再支援工作區設定的連結庫管理。 您可以遵循 「將工作區連結庫和Spark屬性移轉至默認環境」 ,將現有的工作區連結庫移轉至環境,並將它附加為工作區預設值。

遵循教學課程來建立機器學習模型

這些教學課程提供常見案例的端對端範例。

客戶流失

建置模型來預測銀行客戶的流失率。 流失率,也稱為流失率,是客戶停止與銀行業務的速度。

遵循預測客戶流失教學課程中的指示。

建議

在線書店想要提供自定義的建議來增加銷售額。 透過客戶書籍評等數據,您可以開發和部署建議模型來進行預測。

遵循定型零售建議模型教學課程。

詐騙偵測

隨著未經授權的交易增加,即時信用卡詐騙偵測可協助金融機構為客戶提供更快速的解決時間。 詐騙偵測模型包括前置處理、定型、模型儲存和推斷。 定型元件會檢閱多個模型和方法,這些模型和方法可解決誤判與誤判之間的不平衡範例和取捨等挑戰。

遵循詐騙偵測教學課程中的指示。

預測

利用歷史紐約市房地產銷售數據,以及 Facebook 先知,建置具有趨勢和季節性資訊的時間序列模型,以預測未來週期中的銷售額。

遵循時間序列預測教學課程。

文字分類

在Spark中使用 word2vec 和線性回歸模型套用文字分類,以根據書籍元數據預測大英圖書館中的書籍是否為虛構或非小說。

遵循文字分類教學課程。

提升模型

以提升模式估計某些醫療對個人行為的因果影響。 在這些課程模組中觸控四個核心區域:

  • 數據處理模組:擷取特徵、處理和標籤。
  • 訓練模組:使用傳統機器學習模型來預測個別行為的差異,例如 LightGBM。
  • 預測模組:呼叫提升模型來預測測試數據。
  • 評估模組:評估提升模型對測試數據的影響。

遵循治療教學課程的因果影響。

預測性維護

根據歷史數據定型多個模型,以預測機械故障,例如溫度和旋轉速度。 然後,判斷哪一個模型最適合用來預測未來的失敗。

遵循預測性維護教學課程。

銷售預測

預測超級商店產品類別的未來銷售。 針對歷程記錄數據定型模型以執行此動作。

遵循銷售預測教學課程中的指示。