Data Warehousing und Analysen für Vertrieb und MarketingData warehousing and analytics for sales and marketing

In diesem Beispielszenario wird eine Datenpipeline veranschaulicht, die große Datenmengen aus mehreren Quellen in eine einheitliche Analyseplattform in Azure integriert.This example scenario demonstrates a data pipeline that integrates large amounts of data from multiple sources into a unified analytics platform in Azure. Dieses spezielle Szenario basiert zwar auf einer Lösung für Vertrieb und Marketing, die Entwurfsmuster sind jedoch für viele Branchen relevant, in denen erweiterte Analysen von umfangreichen Datasets benötigt werden. Hierzu zählen beispielsweise E-Commerce, Einzelhandel und Gesundheitswesen.This specific scenario is based on a sales and marketing solution, but the design patterns are relevant for many industries requiring advanced analytics of large datasets such as e-commerce, retail, and healthcare.

Das Unternehmen in diesem Beispiel ist im Bereich Vertrieb und Marketing tätig und entwickelt Anreizprogramme.This example demonstrates a sales and marketing company that creates incentive programs. Diese Programme dienen zur Belohnung von Kunden, Lieferanten, Verkäufern und Mitarbeitern.These programs reward customers, suppliers, salespeople, and employees. Die Programme sind auf Daten angewiesen, und das Unternehmen möchte mit Azure die per Datenanalyse gewonnenen Erkenntnisse verbessern.Data is fundamental to these programs, and the company wants to improve the insights gained through data analytics using Azure.

Das Unternehmen benötigt einen modernen Ansatz für die Datenanalyse, um Entscheidungen zur richtigen Zeit und auf der Grundlage der richtigen Daten treffen zu können.The company needs a modern approach to analysis data, so that decisions are made using the right data at the right time. Das Unternehmen hat folgende Ziele:The company's goals include:

  • Kombinieren verschiedene Arten von Datenquellen in einer CloudplattformCombining different kinds of data sources into a cloud-scale platform.
  • Transformieren von Quelldaten in eine allgemeine Taxonomie und Struktur, um die Daten konsistent zu machen und einfach vergleichen zu könnenTransforming source data into a common taxonomy and structure, to make the data consistent and easily compared.
  • Laden von Daten unter Verwendung eines hochgradig parallelisierten Ansatzes, der Tausende von Anreizprogrammen unterstützt, aber ohne die hohen Kosten für die Bereitstellung und Pflege einer lokalen InfrastrukturLoading data using a highly parallelized approach that can support thousands of incentive programs, without the high costs of deploying and maintaining on-premises infrastructure.
  • Deutliches Beschleunigen der Datenerfassung und -transformation, um sich auf die Analyse der Daten konzentrieren zu könnenGreatly reducing the time needed to gather and transform data, so you can focus on analyzing the data.

Relevante AnwendungsfälleRelevant use cases

Dieser Ansatz kann auch für folgende Zwecke verwendet werden:This approach can also be used to:

  • Einrichten eines Data Warehouse als alleingültige Quelle für Ihre DatenEstablish a data warehouse to be a single source of truth for your data.
  • Integrieren relationaler Datenquellen in andere unstrukturierte DatasetsIntegrate relational data sources with other unstructured datasets.
  • Verwenden von Semantikmodellen und leistungsstarken Visualisierungstools zur Vereinfachung der DatenanalyseUse semantic modeling and powerful visualization tools for simpler data analysis.

AufbauArchitecture

Architektur für ein Szenario mit Data Warehouse und Datenanalyse in Azure

Die Daten durchlaufen die Lösung wie folgt:The data flows through the solution as follows:

  1. Aktualisierungen der einzelnen Datenquellen werden in regelmäßigen Abständen in einen Stagingbereich in Azure Blob Storage exportiert.For each data source, any updates are exported periodically into a staging area in Azure Blob storage.
  2. Data Factory lädt die Daten inkrementell aus Blob Storage in Stagingtabellen in Azure Synapse Analytics.Data Factory incrementally loads the data from Blob storage into staging tables in Azure Synapse Analytics. Dabei werden die Daten bereinigt und transformiert.The data is cleansed and transformed during this process. PolyBase kann den Prozess für umfangreiche Datasets parallelisieren.PolyBase can parallelize the process for large datasets.
  3. Nachdem ein neuer Datenbatch in das Warehouse geladen wurde, wird ein zuvor erstelltes Analysis Services-Tabellenmodell aktualisiert.After loading a new batch of data into the warehouse, a previously created Analysis Services tabular model is refreshed. Dieses Semantikmodell vereinfacht die Analyse von Geschäftsdaten und -beziehungen.This semantic model simplifies the analysis of business data and relationships.
  4. Business Analysts verwenden Microsoft Power BI, um Warehouse-Daten unter Verwendung des Analysis Services-Semantikmodells zu analysieren.Business analysts use Microsoft Power BI to analyze warehoused data via the Analysis Services semantic model.

KomponentenComponents

Das Unternehmen verfügt über Datenquellen auf vielen verschiedenen Plattformen:The company has data sources on many different platforms:

  • SQL Server (lokal)SQL Server on-premises
  • Oracle (lokal)Oracle on-premises
  • Azure SQL-DatenbankAzure SQL Database
  • Azure Table StorageAzure table storage
  • Cosmos DBCosmos DB

Daten werden aus diesen unterschiedlichen Datenquellen unter Verwendung verschiedener Azure-Komponenten geladen:Data is loaded from these different data sources using several Azure components:

  • Blob Storage wird verwendet, um Quelldaten vor dem Laden in Azure Synapse bereitzustellen.Blob storage is used to stage source data before it's loaded into Azure Synapse.
  • Data Factory orchestriert die Transformation der bereitgestellten Daten in eine allgemeine Struktur in Azure Synapse.Data Factory orchestrates the transformation of staged data into a common structure in Azure Synapse. Data Factory verwendet PolyBase beim Laden von Daten in Azure Synapse, um den Durchsatz zu maximieren.Data Factory uses PolyBase when loading data into Azure Synapse to maximize throughput.
  • Azure Synapse ist ein verteiltes System zum Speichern und Analysieren umfangreicher Datasets.Azure Synapse is a distributed system for storing and analyzing large datasets. Dank MPP (Massive Parallel Processing) eignet sich diese Komponente für Hochleistungsanalysen.Its use of massive parallel processing (MPP) makes it suitable for running high-performance analytics. In Kombination mit PolyBase kann Azure Synapse Daten mit hoher Geschwindigkeit aus Blob Storage laden.Azure Synapse can use PolyBase to rapidly load data from Blob storage.
  • Analysis Services bietet ein Semantikmodell für Ihre Daten.Analysis Services provides a semantic model for your data. Darüber hinaus kann die Komponente die Systemleistung beim Analysieren Ihrer Daten erhöhen.It can also increase system performance when analyzing your data.
  • Power BI ist eine Suite aus Business Analytics-Tools zum Analysieren von Daten und Teilen von Einblicken.Power BI is a suite of business analytics tools to analyze data and share insights. Power BI kann ein in Analysis Services gespeichertes Semantikmodell oder direkt Azure Synapse abfragen.Power BI can query a semantic model stored in Analysis Services, or it can query Azure Synapse directly.
  • Azure Active Directory (Azure AD) authentifiziert Benutzer, die über Power BI eine Verbindung mit dem Analysis Services-Server herstellen.Azure Active Directory (Azure AD) authenticates users who connect to the Analysis Services server through Power BI. Azure AD kann auch von Data Factory für die Authentifizierung bei Azure Synapse verwendet werden – entweder über einen Dienstprinzipal oder über eine verwaltete Identität für Azure-Ressourcen.Data Factory can also use Azure AD to authenticate to Azure Synapse via a service principal or Managed identity for Azure resources.

AlternativenAlternatives

ÜberlegungenConsiderations

Die Technologien in dieser Architektur wurden gewählt, da sie die Skalier- und Verfügbarkeitsanforderungen des Unternehmens erfüllen und das Unternehmen bei der Kostenkontrolle unterstützen.The technologies in this architecture were chosen because they met the company's requirements for scalability and availability, while helping them control costs.

PreisePricing

Sehen Sie sich über den Azure-Preisrechner ein Preisbeispiel für ein Data Warehouse-Szenario an.Review a pricing sample for a data warehousing scenario via the Azure pricing calculator. Passen Sie die Werte an, um zu ermitteln, wie sich Ihre Anforderungen auf die Kosten auswirken.Adjust the values to see how your requirements affect your costs.

  • Mit Azure Synapse können Sie Ihre Compute- und Ihre Speicherebene unabhängig voneinander skalieren.Azure Synapse allows you to scale your compute and storage levels independently. Computeressourcen werden auf Stundenbasis abgerechnet und können nach Bedarf skaliert oder angehalten werden.Compute resources are charged per hour, and you can scale or pause these resources on demand. Speicherressourcen werden nach Terabyte abgerechnet. Ihre Kosten steigen also, wenn Sie mehr Daten erfassen.Storage resources are billed per terabyte, so your costs will increase as you ingest more data.
  • Die Kosten für Data Factory basieren auf der Anzahl von Lese-/Schreibvorgängen, Überwachungsvorgängen und Orchestrierungsaktivitäten, die in einer Workload ausgeführt werden.Data Factory costs are based on the number of read/write operations, monitoring operations, and orchestration activities performed in a workload. Die Kosten für Ihre Data Factory erhöhen sich mit jedem weiteren Datenstrom und der jeweils verarbeiteten Datenmenge.Your Data Factory costs will increase with each additional data stream and the amount of data processed by each one.
  • Analysis Services ist in den Tarifen „Developer“, „Basic“ und „Standard“ erhältlich.Analysis Services is available in developer, basic, and standard tiers. Die Preise der Instanzen basieren auf QPUs (Query Processing Units) und auf dem verfügbaren Arbeitsspeicher.Instances are priced based on query processing units (QPUs) and available memory. Minimieren Sie die Anzahl ausgeführter Abfragen, den Umfang der durch die Abfragen verarbeiteten Daten sowie die Ausführungshäufigkeit dieser Abfragen, um die Kosten gering zu halten.To keep your costs lower, minimize the number of queries you run, how much data they process, and how often they run.
  • Power BI bietet verschiedene Produktoptionen für unterschiedliche Anforderungen.Power BI has different product options for different requirements. Power BI Embedded bietet eine Azure-basierte Option zum Einbetten von Power BI-Funktionen in Ihre Anwendungen.Power BI Embedded provides an Azure-based option for embedding Power BI functionality inside your applications. Eine Power BI Embedded-Instanz ist im obigen Preisbeispiel enthalten.A Power BI Embedded instance is included in the pricing sample above.

Nächste SchritteNext steps