Quickstart: Een nieuwe Lake-database maken met behulp van databasesjablonen
Deze quickstart biedt u een overzicht van een end-2-end scenario over hoe u de databasesjablonen kunt toepassen om een lake-database te maken, gegevens kunt afstemmen op uw nieuwe model en de geïntegreerde ervaring kunt gebruiken om de gegevens te analyseren.
Vereisten
- Er zijn ten minste synapse-gebruikersrolmachtigingen vereist voor het verkennen van een Lake-databasesjabloon vanuit de galerie.
- Machtigingen voor Synapse-beheerder of Synapse-inzender zijn vereist voor de Synapse-werkruimte voor het maken van een lake-database.
- Storage Machtigingen voor Bijdrager voor blobgegevens zijn vereist voor data lake.
Een Lake-database maken op basis van databasesjablonen
Gebruik de nieuwe functionaliteit voor databasesjablonen (preview) om een lake-database te maken die u kunt gebruiken om uw gegevensmodel voor de database te configureren.
Voor ons scenario gebruiken we de databasesjabloon Retail en selecteren we de volgende entiteiten:
- RetailProduct: een product is alles wat kan worden aangeboden aan een markt die kan voldoen aan een behoefte van potentiële klanten. Dat product is de som van alle fysieke, fysieke, symbolische en servicekenmerken die daaraan zijn gekoppeld.
- Transactie: het laagste niveau van uitvoerbare werk- of klantactiviteit. Een transactie bestaat uit een of meer discrete gebeurtenissen.
- TransactionLineItem: de onderdelen van een transactie, onderverdeeld naar Product en Aantal, één per regelitem.
- Partij: een partij is een persoon, organisatie, juridische entiteit, sociale organisatie of bedrijfseenheid die van belang is voor het bedrijf.
- Klant: een klant is een afzonderlijke of juridische entiteit die een product of service heeft gekocht of heeft gekocht.
- Kanaal: een kanaal is een manier waarop producten of services worden verkocht en/of gedistribueerd.
De eenvoudigste manier om ze te vinden is met behulp van het zoekvak boven de verschillende bedrijfsgebieden die de tabellen bevatten.

Lake-database configureren
Nadat u de database hebt gemaakt, moet u ervoor zorgen dat het opslagaccount & bestandspad is ingesteld op een locatie waar u de gegevens wilt opslaan. Het pad wordt standaard ingesteld op het primaire opslagaccount in Synapse Analytics, maar kan naar behoefte worden gewijzigd.

Als u uw indeling wilt opslaan en beschikbaar wilt maken in Synapse, publiceert u alle wijzigingen. Deze stap voltooit de installatie van de lake-database en maakt deze beschikbaar voor alle onderdelen binnen Synapse Analytics buiten de database.
Gegevens opnemen in lake-database
Als u gegevens wilt opnemen in de Lake-database, kunt u pijplijnen uitvoeren met toewijzingen van gegevensstromen zonder code, die een Workspace DB-connector hebben om gegevens rechtstreeks in de databasetabel te laden. U kunt ook de interactieve Spark-notebooks gebruiken om gegevens op te nemen in de lake-databasetabellen:
%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,'2021-02-18',1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);
Query’s uitvoeren voor de gegevens
Nadat de lake-database is gemaakt, zijn er verschillende manieren om query's uit te voeren op de gegevens. Momenteel ondersteunen we SQL-Ondemand synapse die automatisch inzicht krijgt in de nieuwe lake-database-indeling en de gegevens er doorheen beschikbaar maakt.
SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]
De andere manier om toegang te krijgen tot de gegevens in Synapse is door een nieuw Spark-notebook te openen en daar de geïntegreerde ervaring te gebruiken:
df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)
Machine learning-modellen trainen
U kunt Lake Database gebruiken om uw modellen machine learning te trainen en de gegevens te scoren. Voor meer informatie Train machine learning modellen
Volgende stappen
Ga door met het verkennen van de mogelijkheden van de databaseontwerper met behulp van de onderstaande koppelingen.