Architektura pro pokročilé analýzy

Analysis Services
Blob Storage
Cosmos DB
Databricks
Data Factory
Synapse Analytics

Idea řešení

Pokud se chcete podívat, jak tento článek rozšíříme o další informace, jako jsou potenciální případy použití, alternativní služby, aspekty implementace nebo pokyny k cenám, dejte nám vědět pomocí GitHub Feedback!

Transformujte data na užitečné přehledy pomocí nejlepších nástrojů strojového učení. Toto řešení umožňuje kombinovat libovolná data v libovolném měřítku a sestavovat a nasazovat vlastní modely strojového učení ve velkém měřítku.

Architektura

Diagram architektury pokročilé analýzy využívající Azure Synapse Analytics s Azure Data Lake Storage Gen2, Azure Analysis Services, Azure Cosmos DB a Power BI

Stáhněte si SVG této architektury.

Tok dat

  1. Spojte všechna strukturovaná, nestrukturovaná a částečně strukturovaná data (protokoly, soubory a média) pomocí synapse Pipelines azure Data Lake Storage.
  2. Pomocí Apache Spark můžete vyčistit a transformovat bezstruktury datových sad a kombinovat je se strukturovaných daty z provozních databází nebo datových skladů.
  3. Využijte škálovatelné techniky strojového učení a hlubokého učení k odvození hlubších přehledů z těchto dat pomocí Pythonu, Scaly nebo .NET s využitím poznámkových bloků ve Apache Spark fondu.
  4. Pro Apache Spark a přesun dat ve velkém měřítku Pipelines fond Azure Synapse Analytics synapse ve virtuálních zařízeních.
  5. Dotazování a hlášení na data v Power BI.
  6. Získejte přehledy z Apache Spark do Cosmos DB, aby byly přístupné prostřednictvím webových a mobilních aplikací.

Komponenty

  • Azure Synapse Analytics je rychlý, flexibilní a důvěryhodný cloudový datový sklad, který umožňuje elastické a nezávislé škálování, výpočty a ukládání s architekturou množeně paralelního zpracování.
  • Synapse Pipelines Dokumentace umožňuje vytvářet, plánovat a orchestrovat pracovní postupy ETL/ELT.
  • Azure Blob Storage je masivně škálovatelné úložiště objektů pro libovolný typ nestrukturovaných obrázků dat, videí, zvuku, dokumentů a snadněji a nákladově výhodněji.
  • Azure Synapse Analytics Sparku je rychlá a snadná analytická platforma založená Apache Spark spolupráci.
  • Azure Cosmos DB je globálně distribuovaná databázová služba pro více modelů. Zjistěte, jak replikovat data do libovolného počtu oblastí Azure a škálovat propustnost nezávisle na úložišti.
  • Azure Synapse Link pro Azure Cosmos DB umožňuje spouštět analýzy provozních dat v Azure Cosmos DB v reálném čase bez jakéhokoli dopadu na výkon nebo náklady na transakční úlohu pomocí dvou analytických modulů dostupných ve vašem pracovním prostoru Azure Synapse: SQL bez serveru a fondů Spark.
  • Azure Analysis Services je podniková analýza jako služba, která vám umožní řídit, nasazovat, testovat a dodávat vaše řešení BI s jistotou.
  • Power BI je sada nástrojů pro obchodní analýzy, které poskytují přehledy v celé organizaci. Připojení ke stovkám zdrojů dat, zjednodušení přípravy dat a řízení neplánované analýzy. Vytvářete skvělé sestavy a pak je publikujte, aby je vaše organizace spotřebovává na webu a na různých mobilních zařízeních.

Alternativy

  • Synapse Link je upřednostňovaným řešením Microsoftu pro analýzu nad daty Cosmos DB.

Ceny

Další kroky