Share via


搭配雲端規模分析使用 Azure Synapse Analytics

Azure Synapse Analytics 是布建的整合式分析服務,可加速跨資料倉儲和巨量資料系統深入解析的時間。 Azure Synapse Analytics 整合在一起:

  • 企業資料倉儲中使用的最佳 SQL 技術。
  • 用於巨量資料的 Spark 技術。
  • 資料應用程式的管線(來源對齊)和擷取、轉換和載入 (ETL) 或擷取、載入和轉換 (ELT)。

Azure Synapse Studio 是 Azure Synapse 中的工具,可提供統一的管理、監視、編碼和安全性體驗。 Synapse Studio 與其他 Azure 服務深入整合,例如 Power BI、Azure Cosmos DB 和 Azure 機器學習。

注意

本節旨在說明雲端規模分析特有的指定組態。 這是官方 Azure Synapse Analytics 檔的 讚美

概觀

在資料登陸區域 的初始設定 期間,您可以部署單一 Azure Synapse Analytics 工作區,供所有分析師和資料科學家使用。 您可以為特定資料整合或資料產品建立更多工作區。

如果您的資料產品需要提供資料列層級和資料行層級安全性的 標準化資料的 存取權,您可能需要額外的 Azure Synapse Analytics 工作區。 您可以使用 Azure Synapse 集區來提供這些工作區。 資料產品小組可能需要自己的工作區來建立資料產品,而個別的工作區僅適用于具有範圍開發存取權的產品小組。

Azure Synapse Analytics 設定

部署 Azure Synapse Analytics 的第一個步驟是設定連線至 Azure Purview 帳戶 的 Azure Synapse 工作區

Azure Synapse Analytics 網路功能

資料登陸區域會使用 Azure Synapse Analytics 受控虛擬網路 來建立工作區。 與 Azure Synapse 的通訊會透過公開的三個端點進行:SQL 集區、SQL 隨選,以及開發端點。

在網路層級,雲端規模分析會使用 synapse 受控私人端點 。 這些端點可確保資料登陸區域虛擬網路與 Azure Synapse 工作區之間的所有流量都會完全透過 Microsoft 骨幹網路移動。

Azure Synapse 資料存取控制

在 Azure Synapse Analytics 中使用存取控制清單搭配 Microsoft Entra 傳遞,以管理對 Data Lake 中檔案的存取。

針對需要限制傳回之資料行和資料列的資料,建議您使用資料列層級和資料行層級安全性來限制 Azure Synapse SQL 專用或無伺服器集區中資料表的資料存取。 資料列層級安全性和資料行層級安全性會在資料庫層級以及資料庫角色之外實作。

例如,資料列層級安全性可確保特定資料應用程式中的使用者(來源對齊)或資料產品只會看到自己的資料。 即使資料表包含整個企業的資料也一樣。

您可以將資料列層級安全性與資料行層級安全性結合,以限制對具有敏感性資料的資料行存取。 如此一來,資料列層級安全性和資料行層級安全性都會在資料庫層而非應用層套用存取限制邏輯。 每次嘗試從任何層級存取資料時,都會評估許可權。

注意

Azure Synapse 無伺服器 SQL 集區支援 檢視的資料行層級安全性 ,而不是外部資料表。 如果是外部資料表,您可以在外部資料表上方建立邏輯檢視,而不是套用資料行層級安全性。 如果是資料列層級安全性,可以使用自訂檢視作為因應措施。

如需詳細資訊,請參閱 Azure Synapse Analytics 資料存取控制

Azure Data Lake 中的 Azure Synapse 資料存取控制

部署 Azure Synapse Analytics 工作區時,您需要訂用帳戶中的 Azure Data Lake 儲存體 帳戶,或使用儲存體帳戶 URL 手動。 指定的儲存體帳戶會設定為 已部署 Azure Synapse 工作區的主要 帳戶,以儲存其資料。 Azure Synapse 會將資料儲存在容器中,其中包含名為 /synapse/{workspaceName} 的資料夾中的 Apache Spark 資料表和 Spark 應用程式記錄。 它也有一個容器來管理您選擇要安裝的任何程式庫。

提示

建議您在開發層或 Data Lake 三 個帳戶上使用 專用容器。 此容器會作為主要儲存體來儲存 Spark 中繼資料。

如需 如何設定資料存取的建議,請參閱 Azure Synapse Analytics 資料存取控制

下一步