Modifier

Architecture d’analytique avancée

Azure Analysis Services
Stockage Blob Azure
Azure Cosmos DB
Azure Synapse Analytics
Power BI

Idées de solution

Cet article présente une idée de solution. Si vous souhaitez nous voir développer le contenu avec d’autres informations, telles que des cas d’usage potentiels, d’autres services, des considérations d’implémentation ou un guide des prix, faites-le-nous savoir avec les Commentaires de GitHub.

Cette architecture vous permet de combiner des données à n’importe quelle échelle avec du Machine Learning personnalisé et d’utiliser l’analytique données en quasi-temps réel sur les services de streaming.

Architecture

Diagramme d’architecture d’analytique avancée à l’aide de Azure Synapse Analytics avec Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB et Power BI.

Téléchargez un fichier Visio de cette architecture.

Dataflow

  1. Regroupez toutes vos données structurées, non structurées et semi-structurées (journaux, fichiers et médias) à l’aide de pipelines Synapse dans Azure Data Lake Storage.
  2. Utilisez des pools Apache Spark pour nettoyer et transformer les jeux de données sans structure, et les combiner avec des données structurées provenant de bases de données ou d’entrepôts de données opérationnels.
  3. Utilisez des techniques de Machine Learning/Deep Learning évolutives pour obtenir des insights plus détaillés à partir de ces données à l'aide de Python, Scala ou .NET, avec des expériences de notebook dans un pool Apache Spark.
  4. Utilisez un pool Apache Spark et des pipelines Synapse dans Azure Synapse Analytics pour accéder aux données et les déplacer à grande échelle.
  5. Interrogation et rapport sur les données de Power BI.
  6. Exportez les insights des pools Apache Spark vers Azure Cosmos DB afin de les rendre accessibles dans des applications web et mobiles.

Workflow

  • Azure Synapse Analytics est un entrepôt de données cloud rapide, flexible et fiable qui vous permet de mettre à l'échelle, de calculer et de stocker de manière élastique et indépendante, avec une architecture de traitement massivement parallèle.
  • La documentation relative aux pipelines Synapse vous permet de créer, de planifier et d’orchestrer vos workflows ETL/ELT.
  • Le stockage d’objets blob Azure est un stockage d’objets hautement évolutif pour tout type d’images de données non structurées, de vidéos, de fichiers audio, de documents, simple et économique.
  • Les pools Spark Azure Synapse Analytics représentent une plateforme d’analyse rapide, simple et collaborative basée sur Apache Spark.
  • Azure Cosmos DB est un service de base de données multimodèle distribué à l’échelle mondiale. Apprenez à répliquer vos données sur autant de régions Azure que vous le souhaitez, et mettez à l’échelle votre débit indépendamment de votre stockage.
  • Azure Synapse Link pour Azure Cosmos DB vous permet d’effectuer de l’analytique en quasi temps réel sur les données opérationnelles dans Azure Cosmos DB, sans aucun impact en termes de perfomances ou de coûts sur votre charge de travail transactionnelle, en utilisant les deux moteurs d’analytique disponibles depuis votre espace de travail Azure Synapse : SQL Serverless et des pools Spark.
  • Azure Analysis Services est une analyse de niveau entreprise en tant que service qui vous permet de gérer, déployer, tester et fournir votre solution décisionnelle en toute confiance.
  • Power BI est une suite d’outils d’analytique métier qui fournit des insights à l’échelle de votre organisation. Connectez-vous à des centaines de sources de données, simplifiez la préparation des données et effectuez des analyses non planifiées. Créez de superbes rapports, puis publiez-les pour que votre organisation les utilise sur le web et sur des appareils mobiles.

Autres solutions

  • Synapse Link est la solution Microsoft par défaut pour l’analyse des données Azure Cosmos DB.

Détails du scénario

Transformez vos données en aperçus actionnables à l’aide des meilleurs outils de Machine Learning. Cette solution vous permet de combiner des données à n’importe quelle échelle, et de créer et déployer des modèles Machine Learning personnalisés à grande échelle. Pour savoir comment les plateformes de données à l’échelle de l’entreprise sont conçues dans le cadre d’une zone d’atterrissage d’entreprise, reportez-vous à la documentation Zone d’atterrissage de données Cloud Adoption Framework .

Cas d’usage potentiels

Les organisations ont la possibilité d’accéder à plus de données que jamais auparavant. L’analytique avancée permet de tirer parti des insights sur les données. Les zones sont les suivantes :

  • Service clients.
  • Maintenance prédictive.
  • Recommandation de produits ou de services.
  • Optimisation du système de tout, des chaînes d’approvisionnement aux opérations du centre de données.
  • Développement de produits et de services.

Considérations

Optimisation des coûts

L’optimisation des coûts consiste à examiner les moyens de réduire les dépenses inutiles et d’améliorer l’efficacité opérationnelle. Pour plus d’informations, consultez Vue d’ensemble du pilier d’optimisation des coûts.

Étapes suivantes

Consultez la documentation suivante sur les services présentés dans cette architecture :