使用 R for Apache Spark
Microsoft Fabric 提供 Apache Spark 的內建 R 支援。 這包括SparkR和sparklyr的支援,可讓使用者使用熟悉的Spark或 R 介面與Spark互動。 您可以透過Spark批次作業定義或互動式 Microsoft Fabric 筆記本,使用 R 分析數據。
本檔提供使用 R 語言在 Synapse 中開發 Spark 應用程式的概觀。
必要條件
取得 Microsoft Fabric 訂用 帳戶。 或者,註冊免費的 Microsoft Fabric 試用版。
登入 Microsoft Fabric。
使用首頁左側的體驗切換器,切換至 Synapse 資料科學 體驗。
建立和執行筆記本會話
Microsoft Fabric 筆記本是一個 Web 介面,可讓您建立包含即時程式代碼、視覺效果和敘述文字的檔案。 筆記本是驗證想法和使用快速實驗從您的資料取得見解的絕佳位置。 筆記本也廣泛使用於數據準備、數據視覺效果、機器學習和其他巨量數據案例。
若要在 Microsoft Fabric 筆記本中開始使用 R,請將語言選項設定為 SparkR (R),以變更筆記本頂端的主要語言。
此外,您可以在一個筆記本中指定數據格開頭的語言 magic 命令,以使用多種語言。
%%sparkr
# Enter your R code here
若要深入瞭解 Microsoft Fabric 分析內的筆記本,請參閱 如何使用筆記本。
安裝套件
連結庫提供您可能想要包含在程式或專案中的可重複使用程式碼。 若要讓第三方或本機建置的程式代碼可供您的應用程式使用,您可以在其中一個工作區或筆記本會話上安裝連結庫。
若要深入瞭解如何管理 R 連結庫,請參閱 R 連結庫管理。
筆記本公用程式
Microsoft Spark 公用程式 (MSSparkUtils) 是內建套件,可協助您輕鬆執行一般工作。 您可以使用 MSSparkUtils 來處理文件系統、取得環境變數、將筆記本鏈結在一起,以及使用秘密。 R Notebook 支援 MSSparkUtils。
若要開始使用,您可以執行下列命令:
library(notebookutils)
mssparkutils.fs.help()
若要深入了解支援的 MSSparkUtils 命令,請參閱 使用 Microsoft Spark 公用程式。
使用SparkR
SparkR 是一種 R 套件,提供輕量前端以使用來自 R 的 Apache Spark。SparkR 提供分散式數據框架實作,支持選取、篩選、匯總等作業。SparkR 也支援使用 MLlib 的分散式機器學習。
您可以流覽 如何使用 SparkR 來深入瞭解如何使用 SparkR。
使用sparklyr
sparklyr 是 Apache Spark 的 R 介面。 它提供使用熟悉 R 介面與 Spark 互動的機制。 您可以透過Spark批次作業定義或互動式 Microsoft Fabric 筆記本來使用sparklyr。
若要深入瞭解如何使用sparklyr,請流覽 如何使用sparklyr。
使用 Tidyverse
Tidyverse 是一組 R 套件,數據科學家通常會在日常數據分析中使用。 它包含數據匯入的套件(readr
)、數據視覺效果(ggplot2
)、數據操作(dplyr
、 tidyr
)、功能性程序設計(purrr
)和模型建置(tidymodels
) 等。中的 tidyverse
套件設計成順暢地一起運作,並遵循一組一致的設計原則。 Microsoft Fabric 會使用每個運行時間版本散發 的最新穩定版本 tidyverse
。
若要深入瞭解如何使用 Tidyverse,請流覽 如何使用 Tidyverse。
R 視覺效果
R 生態系統提供多個圖形連結庫,其中包含許多不同的功能。 根據預設,Microsoft Fabric 中的每個 Spark 實例都包含一組策劃且熱門的開放原始碼連結庫。 您也可以使用 Microsoft Fabric 連結庫管理功能來新增或管理額外的連結庫或版本。
深入瞭解如何流覽 R 視覺效果來建立 R 視覺效果。
相關內容
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應