您现在访问的是微软AZURE全球版技术文档网站,若需要访问由世纪互联运营的MICROSOFT AZURE中国区技术文档网站,请访问 https://docs.azure.cn.

使用 HDInsight 进行交互式查询

数据工厂
Data Lake Storage
HDInsight
Power BI

解决方案理念

如果想了解详细信息(例如潜在用例、替代服务、实现注意事项或定价指南)来扩展本文,请通过反馈GitHub告知我们!

使用 SQL Apache Hive 上的 LLAP 对结构化或非结构化数据执行快速交互式Azure HDInsight。

体系结构

体系结构关系图 下载此体系结构的 SVG。

数据流

  1. 使用资源在 Azure 云或其他任何非 Azure 云之间移动Azure 数据工厂
  2. 使用 Azure Data Lake Gen2 服务创建数据登陆区域,该服务也是 Azure HDInsights hadoop 群集的主存储帐户
  3. 使用 Azure 数据工厂 或 Hive 运行 ELT 过程,以转换 HDFS 中的传入数据
  4. 在 HdFS 中使用此数据在 Hive 中创建外部表
  5. 使用Power BI解释此数据并创建新的可视化效果

组件

  • Azure 数据工厂 是一种混合数据集成服务,可用于创建、计划和协调 ETL/ELT 工作流。
  • Azure Data Lake 存储是一组功能,例如文件系统语义和文件级安全性,专用于基于 Azure Blob 存储构建的大数据分析。
  • Azure HDInsight 可以轻松、快速且经济高效地处理大量数据。 可以使用 Hadoop、Spark、Hive、LLAP、Kafka、Storm、R 等最常用的开源框架。
  • Power BI 是一套业务分析工具,用于在整个组织内提供见解。 连接数百个数据源,简化数据准备,并驱动即点分析。

另请参阅