Handleiding voor de Azure-gegevensarchitectuur

Deze handleiding biedt een gestructureerde benadering voor het ontwerpen van gegevensgerichte oplossingen in Microsoft Azure. De handleiding is gebaseerd op bewezen praktijken die we hebben geleerd door interactie met klanten.

Notitie

Meer informatie over het in gebruik nemen van uw systemen voor gegevensgovernance, analyse en gegevensbeheer in Cloud adoption for data management (Cloud adoption for data management).

Inleiding

De cloud verandert de manier waarop toepassingen worden ontworpen en hoe gegevens worden verwerkt en opgeslagen. In plaats van één algemene database waarin alle gegevens van een oplossing worden verwerkt, maken meertalige, persistente oplossingen gebruik van meerdere, gespecialiseerde gegevensarchieven, elk geoptimaliseerd om specifieke mogelijkheden te bieden. Hoe er naar gegevens in de oplossing wordt gekeken, verandert hierdoor. Er zijn niet langer meerdere lagen bedrijfslogica die lezen en schrijven naar één gegevenslaag. Oplossingen worden in plaats daarvan ontworpen rond een gegevenspijplijn die beschrijft hoe gegevens door een oplossing stromen, waar deze worden verwerkt en opgeslagen en hoe de gegevens worden gebruikt door het volgende onderdeel in de pijplijn.

Hoe deze handleiding is opgebouwd

Deze handleiding is opgebouwd rond twee algemene categorieën gegevensoplossingen: traditionele RDBMS-workloads en big data-oplossingen.

Traditionele RDBMS-workloads. Deze workloads omvatten OLTP (Online Transaction Processing) en OLAP (Online Analytical Processing). OLTP-systemen bevatten meestal relationele gegevens met een vooraf gedefinieerd schema en een set beperkingen voor het behouden van de referentiële integriteit. Het komt vaak voor dat gegevens uit meerdere bronnen in de organisatie worden samengevoegd in een datawarehouse met behulp van een ETL-proces voor het verplaatsen en transformeren van de brongegevens.

Traditionele RDBMS-workloads

Big data-oplossingen. Een big data-architectuur is ontworpen voor de opname, verwerking en analyse van gegevens die te groot of complex zijn voor traditionele databasesystemen. De gegevens kunnen in batches of in realtime worden verwerkt. Bij big data-oplossingen gaat het meestal om grote hoeveelheden niet-relationele gegevens, zoals sleutelwaardegegevens, JSON-documenten of tijdreeksgegevens. Traditionele RDBMS-systemen zijn vaak minder geschikt om dit soort gegevens op te slaan. De term NoSQL verwijst naar een familie met databases die zijn ontworpen om niet-relationele gegevens in op te slaan. Deze term is niet helemaal nauwkeurig, omdat veel niet-relationele gegevensarchieven ondersteuning bieden voor query's die compatibel zijn met SQL. De term NoSQL staat voor 'Niet alleen SQL'.

Big data-oplossingen

Deze twee categorieën sluiten elkaar niet uit, overlappen elkaar zelfs, maar in het kader van deze bespreking is het handig om dit onderscheid te maken. In de handleiding worden voor elke categorie algemene scenario's besproken, met inbegrip van de relevante Azure-services en de geschikte architectuur voor elk scenario. Daarnaast worden in de handleiding de technologische keuzes voor gegevensoplossingen in Azure vergeleken, waaronder open-source opties. Binnen elke categorie beschrijven we de belangrijkste selectiecriteria en een mogelijkhedenmatrix om u te helpen kiezen voor de voor uw scenario geschikte technologie.

Deze handleiding is niet bedoeld om u gegevenswetenschap of databasetheorie te leren. U kunt volledige boeken over deze onderwerpen vinden. In plaats daarvan is het doel om u te helpen kiezen voor de geschikte gegevensarchitectuur of gegevenspijplijn voor uw scenario en om vervolgens de Azure-services en -technologieën te selecteren die het beste bij uw vereisten passen. Als u al een architectuur in gedachten hebt, kunt u rechtstreeks naar de technologiekeuzes gaan.