Analysera data med en serverlös SQL pool
I den här självstudien lär du dig att analysera data med serverlös SQL pool.
Den inbyggda serverlösa SQL poolen
Med serverlösa SQL-pooler kan du använda SQL utan att behöva reservera kapacitet. Faktureringen för en serverlös SQL-pool baseras på mängden data som bearbetas för att köra frågan och inte antalet noder som används för att köra frågan.
Varje arbetsyta levereras med en förkonfigurerad serverlös SQL som kallas inbyggd.
Analysera NYC Taxi-data med en serverlös SQL pool
Anteckning
Kontrollera att du har placerat exempeldata i det primära lagringskontot
I Synapse Studio du till hubben Utveckla
Skapa ett nytt SQL skript.
Klistra in följande kod i skriptet.
SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]Klicka på Kör.
Datagranskning är bara ett förenklat scenario där du kan förstå de grundläggande egenskaperna för dina data. Läs mer om datautforskning och analys i den här självstudien.
Skapa en databas för datautforskning
Du kan bläddra i innehållet i filerna direkt via master databasen. För vissa enkla datagranskningsscenarier behöver du inte skapa en separat databas.
Men när du fortsätter att utforska data kanske du vill skapa några verktygsobjekt, till exempel:
- Externa datakällor som representerar namngivna referenser för lagringskonton.
- Databasomfångsautentiseringsuppgifter som gör att du kan ange hur du autentiserar till en extern datakälla.
- Databasanvändare med behörighet att komma åt vissa datakällor eller databasobjekt.
- Verktygsvyer, procedurer och funktioner som du kan använda i frågorna.
Använd databasen
masterför att skapa en separat databas för anpassade databasobjekt. Anpassade databasobjekt kan inte skapas imasterdatabasen.CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8Viktigt
Använd en sortering med
_UTF8suffix för att säkerställa att UTF-8-text konverteras korrekt tillVARCHARkolumner.Latin1_General_100_BIN2_UTF8ger bästa prestanda i frågor som läser data från Parquet-filer och Cosmos Db-containrar.Växla till
DataExplorationDBden plats där du kan skapa verktygsobjekt som autentiseringsuppgifter och datakällor.CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')Anteckning
En extern datakälla kan skapas utan autentiseringsuppgifter. Om det inte finns några autentiseringsuppgifter används anroparens identitet för att få åtkomst till den externa datakällan.
Du kan också använda huvuddatabasen för att skapa en inloggning för en användare i som
DataExplorationDBkommer åt externa data:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';Skapa sedan en databasanvändare i
DataExplorationDBför inloggningen och geADMINISTER DATABASE BULK OPERATIONSbehörigheten.CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GOUtforska innehållet i filen med hjälp av den relativa sökvägen och datakällan:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
Databasen för datagranskning är bara en enkel platshållare där du kan lagra dina verktygsobjekt. Med Synapse SQL-pool kan du göra mycket mer och skapa en logisk Data Warehouse – ett relationslager som bygger på Azure-datakällor. Läs mer om att skapa logiska Data Warehouse i den här självstudien.