HDInsight ile etkileşimli sorgulama

Data Factory
Data Lake Storage
HDInsight
Power BI

Çözüm fikri Solution Idea

Daha fazla bilgi, uygulama ayrıntıları, fiyatlandırma Kılavuzu veya kod örneği ile bu makaleyi genişletmemizi istiyorsanız GitHub geri bildirimlerindenhaberdar olalım!If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Azure HDInsight 'ta Apache Hive LLAP ile yapılandırılmış veya yapılandırılmamış veriler üzerinde ölçeklendirerek hızlı ve etkileşimli SQL gibi sorgular gerçekleştirin.Perform fast, interactive SQL like queries at scale over structured or unstructured data with Apache Hive LLAP on Azure HDInsight.

MimariArchitecture

Mimari diyagramı Bu mimarinin bir SVG indirin.Architecture Diagram Download an SVG of this architecture.

Veri AkışıData Flow

  1. Azure Data Factory kullanarak Azure bulutu veya Azure olmayan başka bir bulut arasında veri taşımaMove data between Azure cloud or any other non Azure cloud using Azure Data Factory
  2. Azure Hdınsights Hadoop kümesi için de birincil depolama hesabı olan Azure Data Lake Gen2 hizmetini kullanarak bir veri giriş bölgesi oluşturunCreate a data landing zone using Azure Data Lake Gen2 service, which is also the primary storage account for the Azure HDInsights hadoop cluster
  3. Azure Data Factory veya Hive kullanarak, gelen verileri Ida dönüştürmek için ELT yordamlarını çalıştırınRun ELT procedures using Azure Data Factory or Hive to transform incoming data in HDFS
  4. IBU verileri kullanarak Hive içinde dış tablolar oluşturunCreate external tables in Hive using this data in HDFS
  5. Bu verileri yorumlamak ve yeni görselleştirmeler oluşturmak için Power BI kullanınUse Power BI to interpret this data and create new visualizations

BileşenlerComponents

  • Azure Data Factory , ETL/ELT iş akışlarınızı oluşturmanıza, zamanlamanıza ve düzenlemenize olanak tanıyan karma bir veri tümleştirme hizmetidir.Azure Data Factory is a hybrid data integration service that allows you to create, schedule and orchestrate your ETL/ELT workflows.
  • Azure Data Lake Storage , dosya sistemi semantiği ve Azure Blob depolama üzerinde oluşturulan büyük veri analizlerine adanmış dosya düzeyi güvenlik gibi bir dizi özellik kümesidir.Azure Data Lake Storage is a set of capabilities such as file system semantics, and file-level security dedicated to big data analytics built on Azure Blob storage.
  • Azure HDInsight , büyük miktarlarda veriyi işlemek için kolay, hızlı ve uygun maliyetli hale getirir.Azure HDInsight makes it easy, fast, and cost-effective to process massive amounts of data. Hadoop, Spark, Hive, LLAP, Kafka, Storm ve R gibi en popüler açık kaynak çerçeveleri kullanabilirsiniz.You can use the most popular open-source frameworks such as Hadoop, Spark, Hive, LLAP, Kafka, Storm, R, and more.
  • Power BI , kuruluşunuz genelinde Öngörüler sağlayan bir iş analizi araçları paketidir.Power BI is a suite of business analytics tools that deliver insights throughout your organization. Yüzlerce veri kaynağına bağlanın, veri hazırlığını kolaylaştırın ve geçici analizleri yapın.Connect to hundreds of data sources, simplify data prep, and drive adhoc analysis.

Ayrıca Bkz.See Also