Consultas interactivas con HDInsight

Data Factory
Data Lake Storage
HDInsight
Power BI

Idea de solución Solution Idea

Si desea que ampliemos este artículo con más información, detalles de la implementación, guía de precios o ejemplos de código, háganoslo saber en GitHub Feedback (Comentarios de GitHub).If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Realice consultas tipo SQL rápidas e interactivas a gran escala en datos estructurados o no estructurados con Apache Hive LLAP en Azure HDInsight.Perform fast, interactive SQL like queries at scale over structured or unstructured data with Apache Hive LLAP on Azure HDInsight.

ArchitectureArchitecture

Diagrama de la arquitectura Descargue un SVG de esta arquitectura.Architecture Diagram Download an SVG of this architecture.

Data FlowData Flow

  1. Mueva datos entre la nube de Azure o cualquier otra nube que no sea de Azure mediante Azure Data Factory.Move data between Azure cloud or any other non Azure cloud using Azure Data Factory
  2. Cree una zona de aterrizaje de datos con el servicio Azure Data Lake Gen2, que también es la cuenta de almacenamiento principal para el clúster de Hadoop de Azure HDInsights.Create a data landing zone using Azure Data Lake Gen2 service, which is also the primary storage account for the Azure HDInsights hadoop cluster
  3. Ejecute procedimientos de ELT con Azure Data Factory o Hive para transformar los datos entrantes en HDFS.Run ELT procedures using Azure Data Factory or Hive to transform incoming data in HDFS
  4. Cree tablas externas en Hive con estos datos en HDFS.Create external tables in Hive using this data in HDFS
  5. Use Power BI para interpretar estos datos y crear nuevas visualizaciones.Use Power BI to interpret this data and create new visualizations

ComponentesComponents

  • Azure Data Factory es un servicio de integración de datos híbridos que le permite crear, programar y orquestar flujos de trabajo ETL y ELT.Azure Data Factory is a hybrid data integration service that allows you to create, schedule and orchestrate your ETL/ELT workflows.
  • Azure Data Lake Storage es un conjunto de funcionalidades, como la semántica del sistema de archivos y la seguridad de nivel de archivo, dedicadas al análisis de macrodatos basado en Azure Blob Storage.Azure Data Lake Storage is a set of capabilities such as file system semantics, and file-level security dedicated to big data analytics built on Azure Blob storage.
  • Azure HDInsight hace que sea fácil, rápido y rentable procesar grandes cantidades de datos.Azure HDInsight makes it easy, fast, and cost-effective to process massive amounts of data. Puede usar las plataformas de código abierto más conocidas como Hadoop, Spark, Hive, LLAP, Kafka, Storm, R, etc.You can use the most popular open-source frameworks such as Hadoop, Spark, Hive, LLAP, Kafka, Storm, R, and more.
  • Power BI es un conjunto de herramientas de análisis empresarial que proporciona información detallada acerca de toda la organización.Power BI is a suite of business analytics tools that deliver insights throughout your organization. Conéctese a cientos de orígenes de datos, simplifique la preparación de los datos y realice análisis ad hoc.Connect to hundreds of data sources, simplify data prep, and drive adhoc analysis.

Consulte tambiénSee Also