在 Azure Databricks 上使用 Apache Spark MLlib

此頁面提供範例筆記本,示範如何在 Azure Databricks 上使用 MLlib。

Apache Spark MLlib 是 Apache Spark 機器學習程式庫,其中包含常見的學習演算法和公用程式,包括分類、回歸、叢集、共同作業篩選、維度縮減和基礎優化基本類型。 如需 MLlib 功能的參考資訊,Azure Databricks 建議下列 Apache Spark API 參考:

如需從 R 使用 Apache Spark MLlib 的詳細資訊,請參閱 R 機器學習 檔。

二元分類範例筆記本

此筆記本會示範如何使用 Apache Spark MLlib 管線 API 來建置二進位分類應用程式。

二元分類筆記本

取得筆記本

決策樹範例筆記本

這些範例示範各種使用 Apache Spark MLlib 管線 API 的決策樹應用程式。

決策樹

這些筆記本會示範如何使用決策樹執行分類。

數位辨識筆記本的決策樹

取得筆記本

SFO 問卷筆記本的決策樹

取得筆記本

使用 MLlib 管線的 GBT 回歸

此筆記本會示範如何使用 MLlib 管線,使用漸層提升的樹狀結構來執行回歸,以從一周中的一天、天氣、季節等資訊預測自行車出租計數(每小時)。

自行車共用回歸筆記本

取得筆記本

Apache Spark MLlib 管線和結構化串流範例

此筆記本示範如何訓練 Apache Spark MLlib 管線上的歷程記錄資料,並將其套用至串流資料。

MLlib 管線結構化串流筆記本

取得筆記本

進階 Apache Spark MLlib Notebook 範例

此筆記本說明如何建立自訂轉換器。

自訂轉換器筆記本

取得筆記本