什麼是 Azure Synapse Analytics?

Azure Synapse 是一項企業分析服務,可加速跨數據倉儲和巨量數據系統深入解析的時間。 Azure Synapse 彙集了企業數據倉儲中使用的最佳 SQL 技術、用於巨量數據的 Spark 技術、用於記錄和時間序列分析的數據總管、用於數據整合的管線和 ETL/ELT,以及與其他 Azure 服務深入整合,例如 Power BICosmosDBAzureML

Diagram of Azure Synapse Analytics architecture.

領先業界的 SQL

Synapse SQL 是 T-SQL 的分散式查詢系統,可啟用數據倉儲和數據虛擬化案例,並擴充 T-SQL 以解決串流和機器學習案例。

  • Synapse SQL 同時 提供無 伺服器和 專用 資源模型。 針對可預測的效能和成本,請建立專用 SQL 集區來為 SQL 資料表中所儲存的資料保留處理效能。 針對非計劃性或高載工作負載,請使用永遠可用的無伺服器 SQL 端點。
  • 使用內 建串流 功能將數據從雲端數據源送入 SQL 數據表
  • 使用 機器學習 模型使用 T-SQL PREDICT 函式將數據評分 ,以整合 AI 與 SQL

業界標準的 Apache Spark

Apache Spark for Azure Synapse 深入且順暢地整合 Apache Spark,這是最熱門的 開放原始碼 巨量數據引擎,用於數據準備、數據工程、ETL 和機器學習。

  • 具有 SparkML 演算法的 ML 模型,以及 Apache Spark 3.1 的 AzureML 整合,內建支援 Linux Foundation Delta Lake。
  • 簡化的資源模型,讓您不必擔心管理叢集。
  • 快速 Spark 啟動和積極的自動調整。
  • 適用於 Spark 的 .NET 內建支援,可讓您在 Spark 應用程式中重複使用 C# 專業知識和現有的 .NET 程式代碼。

使用 Data Lake

Azure Synapse 會一起移除使用 SQL 和 Spark 之間的傳統技術屏障。 您可以根據您的需求和專業知識順暢地混合和比對。

  • Spark 或 Hive 會順暢地取用 Data Lake 中檔案上定義的數據表。
  • SQL 和 Spark 可直接探索及分析儲存在資料湖中的 Parquet、CSV、TSV 與 JSON 檔案。
  • SQL 和 Spark 資料庫之間快速、可調整的數據載入

內建數據整合

Azure Synapse 包含與 Azure Data Factory 相同的 資料整合 引擎和體驗,可讓您建立豐富的大規模 ETL 管線,而不需要離開 Azure Synapse Analytics。

  • 從 90 個以上的數據源擷取數據
  • 具有數據流活動的無程式代碼 ETL
  • 協調筆記本、Spark 作業、預存程式、SQL 腳本等等

資料總管 (預覽)

Azure Synapse 數據總管為客戶提供互動式查詢體驗,以從記錄和遙測數據解除鎖定見解。 為了補充現有的 SQL 和 Apache Spark 分析運行時間引擎,數據總管分析運行時間會使用功能強大的索引技術來自動編製遙測數據中常用的自由文字和半結構化數據索引,以優化有效率的記錄分析。

使用數據總管作為數據平臺,以建置近乎即時的記錄分析和IoT分析解決方案,以:

  • 合併並相互關聯內部部署、雲端、第三方數據源之間的記錄和事件數據。
  • 加速 AI Ops 旅程(模式辨識、異常偵測、預測等等)
  • 取代基礎結構型記錄搜尋解決方案,以節省成本並提高生產力。
  • 為您的IoT資料建置IoT分析解決方案。
  • 建置分析 SaaS 解決方案,為您的內部和外部客戶提供服務。

整合式體驗

Synapse Studio 提供單一方式,讓企業在單一用戶體驗中建置解決方案、維護和保護所有解決方案

  • 執行關鍵工作:內嵌、探索、準備、協調、可視化
  • 監視跨 SQL、Spark 和數據總管的資源、使用量和使用者
  • 使用角色型訪問控制來簡化分析資源的存取
  • 撰寫 SQL、Spark 或 KQL 程式代碼,並與企業 CI/CD 程式整合

與 Synapse 社群互動

下一步