快速入門:建立利用資料庫範本的新 Lake 資料庫

本快速入門提供完整的範例案例,讓您快速了解如何套用資料範本建立 lake 資料庫、將資料對應儲存至新模型,及透過整合式體驗分析資料。

必要條件

  • 若要從資源庫探索 lake 資料庫範本,至少需要 Synapse 使用者角色權限。
  • 若要建立 lake 資料庫,必須具有 Synapse 工作區的 Synapse 系統管理員 Synapse 參與者權限。
  • 使用建立資料表 [從資料湖] 選項時,資料湖需要儲存體 Blob 資料參與者權限。

使用資料範本建立 lake 資料庫

使用新的資料範本功能建立可供資料庫設定資料模型的 lake 資料庫。

我們的案例將使用 Retail 資料範本,並選取下列實體:

  • 零售產品 - 可提供市場,滿足潛在客戶需求的任何產品。 零售產品是相關所有身理、心理、精神和服務屬性的概括。
  • 交易 - 執行業務或客戶活動的最低層級。 交易是由一個以上不連續的事件組成。
  • 交易單行項目 - 以產品、數量細分的交易組成部分,一個部分一個單行項目。
  • 關係人 - 關係人是企業利益相關的個人、組織、法律實體、社交組織或業務單位。
  • 客戶 - 客戶是擁有、購買產品或服務的個人或法律實體。
  • 通路 - 通路是銷售與配送產品或服務的方法。

尋找實體最簡單的方式是,透過包含資料表的各營業區域上方,使用 [搜尋] 方塊。

Screenshot of a Retail database template example in use.

設定 lake 資料庫

建立資料庫後,請確定儲存體帳戶和檔案路徑已設為您要儲存資料的位置。 路徑會預設為 Azure Synapse Analytics 中主要的儲存體帳戶,但可根據需求變更。

Screenshot of an individual entity properties in the Retail database template.

若要儲存您的配置,並在 Azure Synapse 中使用,請發佈所有變更。 此步驟會完成 lake 資料庫的設定,並提供 Azure Synapse Analytics 和外部所有元件使用。

將資料內嵌至 lake 資料庫

若要將資料內嵌至 lake 資料庫,您可以使用包含工作區資料庫連接器的無程式碼資料流程對應,執行 Pipelines,將資料直接載入資料庫資料表。 您也可以使用互動式 Spark 筆記本,將資料內嵌至 lake 資料庫資料表:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

查詢資料

建立 lake 資料庫後,即有各種方式可以查詢資料。 目前,支援無伺服器 SQL 集區中的 SQL 資料庫,並自動瞭解新建立的 lake 資料庫格式。

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

在 Synapse 中存取資料的另一個方法是,開啟新的 Azure Spark 筆記本,並使用整合體驗:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

將機器學習模型定型

您可使用 lake 資料庫將機器學習模型定型,並為資料評分。 如需詳細資訊,請參考將機器學習模型定型

下一步

使用下列連結,繼續探索資料庫設計工具的功能。