Gegevens analyseren met een serverloze SQL groep
In deze zelfstudie leert u hoe u gegevens kunt analyseren met serverloze SQL pool.
De ingebouwde serverloze SQL-pool
Met serverloze SQL kunt u SQL gebruiken zonder dat u capaciteit moet reserveren. Facturering voor een serverloze SQL is gebaseerd op de hoeveelheid gegevens die wordt verwerkt om de query uit te voeren en niet het aantal knooppunten dat wordt gebruikt om de query uit te voeren.
Elke werkruimte wordt geleverd met een vooraf geconfigureerde serverloze SQL met de naam Ingebouwde.
NYC Taxi-gegevens analyseren met een serverloze SQL pool
Notitie
Zorg ervoor dat u de voorbeeldgegevens in het primaire opslagaccount hebt geplaatst
Ga Synapse Studio naar de hub Ontwikkelen
Maak een nieuw SQL script.
Plak de volgende code in het script.
SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]Klik op Run.
Gegevensverkenning is slechts een vereenvoudigd scenario waarin u de basiskenmerken van uw gegevens begrijpt. Meer informatie over gegevensverkenning en -analyse in deze zelfstudie.
Database voor gegevensverkenning maken
U kunt rechtstreeks via de database door de inhoud van de bestanden master bladeren. Voor sommige eenvoudige scenario's voor gegevensverkenning hoeft u geen afzonderlijke database te maken.
Als u echter doorgaat met het verkennen van gegevens, kunt u enkele hulpprogrammaobjecten maken, zoals:
- Externe gegevensbronnen die de benoemde verwijzingen voor opslagaccounts vertegenwoordigen.
- Referenties binnen databasebereik waarmee u kunt opgeven hoe u moet verifiëren bij een externe gegevensbron.
- Databasegebruikers met de machtigingen voor toegang tot sommige gegevensbronnen of databaseobjecten.
- Weergaven, procedures en functies van het hulpprogramma die u in de query's kunt gebruiken.
Gebruik de
masterdatabase om een afzonderlijke database voor aangepaste databaseobjecten te maken. Aangepaste databaseobjecten kunnen niet worden gemaakt in demasterdatabase.CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8Belangrijk
Gebruik een collatie met
_UTF8achtervoegsel om ervoor te zorgen dat UTF-8-tekst correct wordt geconverteerd naarVARCHARkolommen.Latin1_General_100_BIN2_UTF8biedt de beste prestaties in de query's die gegevens lezen uit Parquet-bestanden en Cosmos Db-containers.Schakel over
DataExplorationDBnaar waar u hulpprogrammaobjecten kunt maken, zoals referenties en gegevensbronnen.CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')Notitie
Een externe gegevensbron kan worden gemaakt zonder een referentie. Als er geen referentie bestaat, wordt de identiteit van de aanroeper gebruikt voor toegang tot de externe gegevensbron.
U kunt eventueel de hoofddatabase gebruiken om een aanmelding te maken voor een gebruiker in
DataExplorationDBdie toegang heeft tot externe gegevens:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';Maak vervolgens een databasegebruiker in
DataExplorationDBvoor de aanmelding en verleen deADMINISTER DATABASE BULK OPERATIONSmachtiging.CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GOVerken de inhoud van het bestand met behulp van het relatieve pad en de gegevensbron:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
Gegevensverkenningsdatabase is slechts een eenvoudige tijdelijke aanduiding waar u uw hulpprogrammaobjecten kunt opslaan. Met Synapse SQL-pool kunt u veel meer doen en een logische Data Warehouse maken: een relationele laag die is gebouwd op Azure-gegevensbronnen. Meer informatie over het bouwen van logische Data Warehouse in deze zelfstudie.