Расширенная архитектура решения для аналитикиAdvanced Analytics Architecture

Концепция решения Solution Idea

Если вы хотите ознакомиться с этой статьей, дополнительные сведения (сведения о реализации, рекомендации по ценам, примеры кода и т. д.), сообщите нам о отзывах в GitHub!If you'd like to see us expand this article with more information (implementation details, pricing guidance, code examples, etc), let us know with GitHub Feedback!

Преобразуйте свои данные в ценные сведения, используя лучшие в своем классе средства машинного обучения.Transform your data into actionable insights using the best-in-class machine learning tools. Эта архитектура позволяет объединять любые данные в любом масштабе, а также создавать и развертывать пользовательские модели машинного обучения в нужном масштабе.This architecture allows you to combine any data at any scale, and to build and deploy custom machine learning models at scale.

АрхитектураArchitecture

Схема архитектуры . Скачайте SVG этой архитектуры.Architecture Diagram Download an SVG of this architecture.

Поток данныхData Flow

  1. Используйте фабрику данных Azure для Azure Data Lake Storage, чтобы объединить все структурированные, неструктурированные и полупрозрачные данные (журналы, файлы и носители).Bring together all your structured, unstructured and semi-structured data (logs, files, and media) using Azure Data Factory to Azure Data Lake Storage.
  2. Используйте Azure Databricks для очистки и преобразования наборов данных без структуры и объединения их с структурированными данными из рабочих баз данных или хранилищ данных.Use Azure Databricks to clean and transform the structureless datasets and combine them with structured data from operational databases or data warehouses.
  3. Используйте масштабируемые методики машинного обучения и глубокого обучения, чтобы получить более подробные сведения из этих данных с помощью Python, R или Scala, а также встроенных возможностей ноутбуков в Azure Databricks.Use scalable machine learning/deep learning techniques, to derive deeper insights from this data using Python, R or Scala, with inbuilt notebook experiences in Azure Databricks.
  4. Используйте собственные соединители между Azure Databricks и Azure синапсе Analytics для доступа к данным и их перемещения в масштабе.Leverage native connectors between Azure Databricks and Azure Synapse Analytics to access and move data at scale.
  5. Опытные пользователи используют встроенные возможности Azure Databricks для выполнения определения основных причин и анализа необработанных данных.Power users take advantage of the inbuilt capabilities of Azure Databricks to perform root cause determination and raw data analysis.
  6. Запрос и отчет о данных в Power BI.Query and report on data in Power BI.
  7. Воспользуйтесь аналитическими сведениями от Azure Databricks, чтобы Cosmos DB сделать их доступными через веб-и мобильные приложения.Take the insights from Azure Databricks to Cosmos DB to make them accessible through web and mobile apps.

ComponentsComponents

  • Azure синапсе Analytics — это быстрое, гибкое и надежное облачное хранилище данных, позволяющее масштабировать, вычислять и хранить эластично и независимо друг от друга с помощью архитектуры массовой параллельной обработки.Azure Synapse Analytics is the fast, flexible and trusted cloud data warehouse that lets you scale, compute and store elastically and independently, with a massively parallel processing architecture.
  • Фабрика данных Azure — это гибридная служба интеграции данных, которая позволяет создавать, планировать и координировать рабочие процессы ETL/ELT.Azure Data Factory is a hybrid data integration service that allows you to create, schedule and orchestrate your ETL/ELT workflows.
  • Хранилище BLOB-объектов Azure — это масштабируемое хранилище объектов для любого типа неструктурированных данных — образов, видео, аудио, документов и многого другого.Azure Blob storage is a Massively scalable object storage for any type of unstructured data-images, videos, audio, documents, and more-easily and cost-effectively.
  • Azure Databricks — это быстрая, простая и совместно работающая платформа аналитики на основе Apache Spark.Azure Databricks is a fast, easy, and collaborative Apache Spark-based analytics platform.
  • Azure Cosmos DB — это многомодельная глобально распределенная служба баз данных.Azure Cosmos DB is a globally distributed, multi-model database service. Узнайте, как выполнять репликацию данных в любом количестве регионов Azure и масштабировать пропускную способность независимо от хранилища.Learn how to replicate your data across any number of Azure regions and scale your throughput independent from your storage.
  • Azure Analysis Services — аналитика корпоративного уровня как услуга, позволяющая вам уверенно управлять, развертывать, тестировать и доставлять решения бизнес-аналитики.Azure Analysis Services is an enterprise grade analytics as a service that lets you govern, deploy, test, and deliver your BI solution with confidence.
  • Power BI — это набор инструментов бизнес-аналитики, которые обеспечивают целостное представление обо всей вашей организации.Power BI is a suite of business analytics tools that deliver insights throughout your organization. Подключайтесь к сотням источников данных, упрощайте подготовку данных и выполняйте специальный анализ.Connect to hundreds of data sources, simplify data prep, and drive ad hoc analysis. Создание привлекательных отчетов, а затем публикация их в Организации для использования в Интернете и на мобильных устройствах.Produce beautiful reports, then publish them for your organization to consume on the web and across mobile devices.

Дальнейшие действияNext steps

Калькулятор ценPricing Calculator