共用方式為


使用 R for Apache Spark

Microsoft Fabric 提供 Apache Spark 的內建 R 支援。 這包括SparkRsparklyr的支援,可讓使用者使用熟悉的Spark或 R 介面與Spark互動。 您可以透過Spark批次作業定義或互動式 Microsoft Fabric 筆記本,使用 R 分析數據。

本檔提供使用 R 語言在 Synapse 中開發 Spark 應用程式的概觀。

必要條件

建立和執行筆記本會話

Microsoft Fabric 筆記本是一個 Web 介面,可讓您建立包含即時程式代碼、視覺效果和敘述文字的檔案。 筆記本是驗證想法和使用快速實驗從您的資料取得見解的絕佳位置。 筆記本也廣泛使用於數據準備、數據視覺效果、機器學習和其他巨量數據案例。

若要在 Microsoft Fabric 筆記本中開始使用 R,請將語言選項設定為 SparkR (R),以變更筆記本頂端的主要語言

此外,您可以在一個筆記本中指定數據格開頭的語言 magic 命令,以使用多種語言。

%%sparkr
# Enter your R code here

若要深入瞭解 Microsoft Fabric 分析內的筆記本,請參閱 如何使用筆記本

安裝套件

連結庫提供您可能想要包含在程式或專案中的可重複使用程式碼。 若要讓第三方或本機建置的程式代碼可供您的應用程式使用,您可以在其中一個工作區或筆記本會話上安裝連結庫。

若要深入瞭解如何管理 R 連結庫,請參閱 R 連結庫管理

筆記本公用程式

Microsoft Spark 公用程式 (MSSparkUtils) 是內建套件,可協助您輕鬆執行一般工作。 您可以使用 MSSparkUtils 來處理文件系統、取得環境變數、將筆記本鏈結在一起,以及使用秘密。 R Notebook 支援 MSSparkUtils。

若要開始使用,您可以執行下列命令:

library(notebookutils)
mssparkutils.fs.help()

若要深入了解支援的 MSSparkUtils 命令,請參閱 使用 Microsoft Spark 公用程式

使用SparkR

SparkR 是一種 R 套件,提供輕量前端以使用來自 R 的 Apache Spark。SparkR 提供分散式數據框架實作,支持選取、篩選、匯總等作業。SparkR 也支援使用 MLlib 的分散式機器學習。

您可以流覽 如何使用 SparkR 來深入瞭解如何使用 SparkR

使用sparklyr

sparklyr 是 Apache Spark 的 R 介面。 它提供使用熟悉 R 介面與 Spark 互動的機制。 您可以透過Spark批次作業定義或互動式 Microsoft Fabric 筆記本來使用sparklyr。

若要深入瞭解如何使用sparklyr,請流覽 如何使用sparklyr

使用 Tidyverse

Tidyverse 是一組 R 套件,數據科學家通常會在日常數據分析中使用。 它包含數據匯入的套件(readr)、數據視覺效果(ggplot2)、數據操作(dplyrtidyr)、功能性程序設計(purrr)和模型建置(tidymodels) 等。中的 tidyverse 套件設計成順暢地一起運作,並遵循一組一致的設計原則。 Microsoft Fabric 會使用每個運行時間版本散發 的最新穩定版本 tidyverse

若要深入瞭解如何使用 Tidyverse,請流覽 如何使用 Tidyverse

R 視覺效果

R 生態系統提供多個圖形連結庫,其中包含許多不同的功能。 根據預設,Microsoft Fabric 中的每個 Spark 實例都包含一組策劃且熱門的開放原始碼連結庫。 您也可以使用 Microsoft Fabric 連結庫管理功能來新增或管理額外的連結庫或版本。

深入瞭解如何流覽 R 視覺效果來建立 R 視覺效果