Oplossingsidee
Als u wilt dat we dit artikel uitbreiden met meer informatie, zoals mogelijke use cases, alternatieve services, implementatieoverwegingen of prijsinformatie, laat het ons dan weten met GitHub Feedback!
Transformeer uw gegevens naar inzichten die kunnen worden gebruikt met behulp van de best-in-class machine learning hulpprogramma's. Met deze oplossing kunt u alle gegevens op elke schaal combineren en aangepaste machine learning modellen op schaal bouwen en implementeren.
Architectuur
Download een SVG van deze architectuur.
Gegevensstroom
- Breng al uw gestructureerde, ongestructureerde en semi-gestructureerde gegevens (logboeken, bestanden en media) samen met behulp van Synapse-pijplijnen naar Azure Data Lake Storage.
- Gebruik Apache Spark om de structuurloze gegevenssets op te schonen en te transformeren en deze te combineren met gestructureerde gegevens uit operationele databases of datawarehouses.
- Gebruik schaalbare machine learning/deep learning-technieken om meer inzicht te krijgen in deze gegevens met behulp van Python, Scala of .NET, met notebookervaringen in Apache Spark pool.
- Pas Apache Spark-pool en Synapse-pijplijnen toe in Azure Synapse Analytics om gegevens op schaal te openen en te verplaatsen.
- Query's uitvoeren en rapporteren over gegevens in Power BI.
- Neem de inzichten van uw Apache Spark naar Cosmos DB om ze toegankelijk te maken via web- en mobiele apps.
Onderdelen
- Azure Synapse Analytics is het snelle, flexibele en vertrouwde clouddatawarehouse waarmee u elastisch en onafhankelijk kunt schalen, berekenen en opslaan met een massively parallel verwerkingsarchitectuur.
- Met de documentatie voor Synapse-pijplijnen kunt u uw ETL-/ELT-werkstromen maken, plannen en beheren.
- Azure Blob Storage is een zeer schaalbare objectopslag voor elk type ongestructureerde gegevensafbeeldingen, video's, audio, documenten en gemakkelijker en rendabeler.
- Azure Synapse Analytics Spark-pools is een snel, eenvoudig en Apache Spark op basis van analyses.
- Azure Cosmos DB is een wereldwijd gedistribueerde databaseservice met meerdere modellen. Meer informatie over het repliceren van uw gegevens in een groot aantal Azure-regio's en het schalen van uw doorvoer onafhankelijk van uw opslag.
- met Azure Synapse Link voor Azure Cosmos DB kunt u bijna realtime analyses uitvoeren op operationele gegevens in Azure Cosmos DB, zonder enige invloed op de prestaties of kosten van uw transactionele workload, met behulp van de twee analyse-engines die beschikbaar zijn vanuit uw Azure Synapse-werkruimte: SQL Serverloze en Spark-pools.
- Azure Analysis Services is een hoogwaardige analyse als een service waarmee u uw BI-oplossing met vertrouwen kunt bepalen, implementeren, testen en leveren.
- Power BI is een suite met hulpprogramma's voor bedrijfsanalyse waarmee u in uw hele organisatie inzichten kunt verkrijgen. Verbinding maken honderden gegevensbronnen, vereenvoudigen gegevensvoorbereiding en maken ongeplande analyse mogelijk. Maak prachtige rapporten en publiceer deze vervolgens voor uw organisatie om te gebruiken op internet en op mobiele apparaten.
Alternatieven
- Synapse Link is de voorkeursoplossing van Microsoft voor analyses boven op Cosmos DB gegevens.