Skapa en Synapse-arbetsyta
I den här självstudien lär du dig att skapa en Synapse-arbetsyta, en dedikerad SQL-pool och en serverlös Apache Spark pool.
Förutsättningar
För att slutföra stegen i den här självstudien måste du ha åtkomst till en resursgrupp som du har tilldelats rollen Ägare för. Skapa Synapse-arbetsytan i den här resursgruppen.
Skapa en Synapse-arbetsyta i Azure Portal
Starta processen
- Öppna Azure Portal, i sökfältet anger du Synapse utan att trycka på Retur.
- I sökresultaten går du till Tjänster och väljer Azure Synapse Analytics.
- Välj Lägg till för att skapa en arbetsyta.
Fliken Grundläggande inställningar > Project information
Fyll i följande fält:
- Prenumeration – Välj valfri prenumeration.
- Resursgrupp – Använd valfri resursgrupp.
- Hanterad resursgrupp – Lämna det tomt.
Fliken Grundläggande inställningar > arbetsyteinformation
Fyll i följande fält:
- Namn på arbetsyta – Välj ett globalt unikt namn. I den här självstudien använder vi myworkspace.
- Region – Välj den region där du har placerat dina klientprogram/tjänster (till exempel virtuella Azure-datorer, Power BI, Azure Analysis Service) och lagringar som innehåller data (till exempel Azure Data Lake-lagring Azure Cosmos DB analyslagring).
Anteckning
En arbetsyta som inte finns i samma miljö som klientprogrammen eller lagringen kan vara grundorsaken till många prestandaproblem. Om dina data eller klienterna placeras i flera regioner kan du skapa separata arbetsytor i olika regioner som är samplacerade med dina data och klienter.
Under Välj Data Lake Storage Gen 2:
- Efter Kontonamn väljer du Skapa nytt och ger det nya lagringskontot namnet contosolake eller liknande eftersom namnet måste vara unikt.
- Efter Filnamn väljer du Skapa ny och ger den namnet användare. Detta skapar en lagringscontainer med namnet users. Arbetsytan använder det här lagringskontot som det "primära" lagringskontot till Spark-tabeller och Spark-programloggar.
- Markera rutan "Tilldela mig Storage rollen Blob Data-deltagare på Data Lake Storage Gen2-kontot".
Slutföra processen
Välj Granska + skapa > Skapa. Arbetsytan är klar om några minuter.
Anteckning
Om du vill aktivera arbetsytefunktioner från en befintlig dedikerad SQL-pool (tidigare SQL DW) kan du gå till Aktivera en arbetsyta för din dedikerade SQL-pool (tidigare SQL DW).
Öppna Synapse Studio
När din Azure Synapse har skapats kan du öppna arbetsytan på två sätt Synapse Studio:
Öppna Synapse-arbetsytan i Azure Portal. I avsnittet Översikt på Synapse-arbetsytan väljer du Öppna i rutan Öppna Synapse Studio.
Gå till och
https://web.azuresynapse.netlogga in på din arbetsyta.
Anteckning
Det finns två metoder för kontoval för att logga in på din arbetsyta. Den ena kommer från Azure-prenumerationen och den andra från Enter manually ( Ange manuellt). Om du har Rollen Synapse Azure eller Azure-roller på högre nivå kan du använda båda metoderna för att logga in på arbetsytan. Om du inte har de relaterade Azure-rollerna och du har beviljats som Synapse RBAC-roll är Enter manuellt det enda sättet att logga in på arbetsytan. Mer information om Synapse RBAC finns i Vad är rollbaserad åtkomstkontroll för Synapse (RBAC).
Placera exempeldata i det primära lagringskontot
Vi kommer att använda en liten datamängd med 100 000 radexempel på NYX Taxi Cab-data för många exempel i den här komma igång-guiden. Vi börjar med att placera den i det primära lagringskonto som du skapade för arbetsytan.
- Ladda ned den här filen till datorn: https://azuresynapsestorage.blob.core.windows.net/sampledata/NYCTaxiSmall/NYCTripSmall.parquet
- I Synapse Studio du till datahubben.
- Välj Länkad.
- Under kategorin Azure Data Lake Storage Gen2 visas ett objekt med ett namn som myworkspace ( Primary - contosolake ).
- Välj containern med namnet användare (primär).
- Välj Upload och välj den
NYCTripSmall.parquetfil som du laddade ned.
När parquet-filen har laddats upp är den tillgänglig via två motsvarande URI:er:
https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquetabfss://users@contosolake.dfs.core.windows.net/NYCTripSmall.parquet
I exemplen som följer i den här självstudien ersätter du contosolake i användargränssnittet med namnet på det primära lagringskonto som du valde för din arbetsyta.