Snabb start: skapa en server lös Apache Spark pool med Synapse Studio

Azure Synapse Analytics erbjuder olika analys verktyg som hjälper dig att mata in, transformera, modellera, analysera och hantera dina data. Apache Spark pool erbjuder Big data Compute-funktioner med öppen källkod. När du har skapat en Apache Spark-pool på din Synapse-arbetsyta kan data läsas in, modelleras, bearbetas och hanteras för att få insikter.

I den här snabb starten beskrivs stegen för att skapa en Apache Spark-pool i en Synapse-arbetsyta med hjälp av Synapse Studio.

Viktigt

Faktureringen för Spark-instanser beräknas per minut, oavsett om du använder dem eller inte. Se till att stänga av Spark-instansen när du är färdig med den, eller ange en kort tids gräns. Mer information finns i avsnittet Rensa resurser i den här artikeln.

Om du inte har en Azure-prenumeration kan du skapa ett kostnads fritt konto innan du börjar.

Förutsättningar

Logga in på Azure Portal

Logga in på Azure-portalen

  1. Gå till arbets ytan Synapse där Apache Spark-poolen skapas genom att skriva tjänst namnet (eller resurs namnet direkt) i Sök fältet.

    Azure Portal Sök fältet med Synapse-arbetsytor som anges i.

  2. I listan över arbets ytor skriver du namnet (eller en del av namnet) på arbets ytan som ska öppnas. I det här exemplet använder vi en arbets yta med namnet contosoanalytics.

    Lista över Synapse-arbetsytor filtrerade för att visa de som innehåller namnet contoso.

Starta Synapse Studio

I översikten för arbets ytan väljer du webb adressen för arbets ytan för att öppna Synapse Studio.

Översikt över Azure Portal Synapse-arbetsyta med starta Synapse Studio markerat.

Skapa Apache Spark-poolen i Synapse Studio

  1. På Start sidan för Synapse Studio navigerar du till hanterings hubben i det vänstra navigerings fönstret genom att välja ikonen Hantera .

    Synapse Studio-start sida med avsnittet hanterings hubb markerat.

  2. I hanterings hubben går du till avsnittet Apache Spark pooler för att se den aktuella listan över Apache Spark pooler som är tillgängliga i arbets ytan.

    Synapse Studio-hanterings hubb med Apache Spark pooler-navigering vald

  3. Välj + ny och guiden Ny Apache Spark pool skapas visas.

  4. Ange följande information på fliken grundläggande :

    Inställning Föreslaget värde Beskrivning 
    Namn på Apache Spark bassäng contosospark Detta är det namn som Apache Spark-poolen kommer att ha.
    Node-storlek Liten (4 vCPU/32 GB) Ange den minsta storleken för att minska kostnaderna för den här snabb starten
    Automatisk skalning Inaktiverad Vi behöver inte autoskalning i den här snabb starten
    Antal noder 8 Begränsa kostnaderna i den här snabb starten med en liten storlek

    Grunderna för Synapse Studio New Apache Spark pool

    Viktigt

    Observera att det finns vissa begränsningar för de namn som Apache Spark pooler kan använda. Namn får bara innehålla bokstäver eller siffror, måste bestå av högst 15 tecken, måste inledas med en bokstav, får inte innehålla reserverade ord och vara unika i arbets ytan.

  5. På nästa flik (ytterligare inställningar) lämnar du alla inställningar som standard.

  6. Vi lägger inte till några taggar nu, så välj Granska + skapa.

  7. På fliken Granska + skapa ser du till att informationen ser korrekt ut baserat på vad som angavs tidigare och tryck på skapa.

    Skapa Synapse Studio New Apache Spark pool

  8. Den Apache Spark poolen startar etablerings processen.

  9. När etableringen är klar visas den nya Apache Spark poolen i listan.

    Synapse Studio New Apache Spark pool List

Rensa Apache Spark pool resurser med Synapse Studio

Följ stegen nedan för att ta bort Apache Spark-poolen från arbets ytan med Synapse Studio.

Varning

Om du tar bort en spark-pool tas analys motorn bort från arbets ytan. Det går inte längre att ansluta till poolen, och alla frågor, pipeliner och antecknings böcker som använder den här Spark-poolen kommer inte längre att fungera.

Gör så här om du vill ta bort Apache Spark poolen:

  1. Navigera till Apache Spark pooler i hanterings hubben i Synapse Studio.

  2. Välj ellipsen bredvid Apache-poolen som ska tas bort (i det här fallet contosospark) för att Visa kommandona för den Apache Spark poolen.

    Lista över Apache Spark pooler med den nyligen skapade poolen vald.

  3. Tryck på ta bort.

  4. Bekräfta borttagningen och tryck på knappen ta bort .

  5. När processen har slutförts visas inte längre den Apache Spark poolen i arbets ytans resurser.

Nästa steg