Snabbstart: Skapa en serverlös Apache Spark med hjälp av Synapse Studio

Azure Synapse Analytics erbjuder olika analysmotorer som hjälper dig att mata in, transformera, modellera, analysera och betjäna dina data. Apache Spark har stordatabearbetningsfunktioner med öppen källkod. När du har Apache Spark en pool i Synapse-arbetsytan kan data läsas in, modelleras, bearbetas och hanteras för att få insikter.

Den här snabbstarten beskriver stegen för att skapa en Apache Spark i en Synapse-arbetsyta med hjälp av Synapse Studio.

Viktigt

Faktureringen för Spark-instanser är prorerad per minut, oavsett om du använder dem eller inte. Se till att stänga av Spark-instansen när du har använt den eller ange en kort tidsgräns. Mer information finns i avsnittet Rensa resurser i den här artikeln.

Om du inte har en Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.

Förutsättningar

Logga in på Azure Portal

Logga in på Azure-portalen

  1. Gå till Synapse-arbetsytan där Apache Spark-poolen skapas genom att skriva namnet på tjänsten (eller resursnamnet direkt) i sökfältet.

    Azure Portal sökfältet med Synapse-arbetsytor in skrivit.

  2. I listan över arbetsytor skriver du namnet (eller en del av namnet) på arbetsytan som ska öppnas. I det här exemplet använder vi en arbetsyta med namnet contosoanalytics.

    Lista över Synapse-arbetsytor filtrerade för att visa de som innehåller namnet Contoso.

Starta Synapse Studio

I arbetsytans översikt väljer du webb-URL för arbetsyta för att öppna Synapse Studio.

Azure Portal översikt över Synapse-arbetsytan med Starta Synapse Studio markerat.

Skapa Apache Spark i Synapse Studio

  1. På startsidan Synapse Studio du till hanteringshubben i det vänstra navigeringsfönstret genom att välja ikonen Hantera.

    Synapse Studio startsida med hanteringshubben markerat.

  2. När du är i hanteringshubben går du till avsnittet Apache Spark pooler för att se den aktuella listan över Apache Spark som är tillgängliga i arbetsytan.

    Synapse Studio hanteringshubb med Apache Spark navigeringspooler valt

  3. Välj + Ny så visas guiden Apache Spark för att skapa en ny pool.

  4. Ange följande information på fliken Grundläggande inställningar:

    Inställning Föreslaget värde Beskrivning 
    Apache Spark namn på pool contosospark Det här är namnet som Apache Spark har.
    Nodstorlek Liten (4 vCPU/32 GB) Ange den minsta storleken för att minska kostnaderna för den här snabbstarten
    Automatisk skalning Inaktiverad Vi behöver inte autoskalning i den här snabbstarten
    Antal noder 8 Använd en liten storlek för att begränsa kostnaderna i den här snabbstarten
    Allokera utförare dynamiskt Inaktiverad Den här inställningen mappar till den dynamiska allokeringsegenskapen i Spark-konfigurationen för allokering av Spark-programskapare. Vi behöver inte autoskalning i den här snabbstarten.

    Grunderna för Synapse Studio ny Apache Spark pool

    Viktigt

    Observera att det finns specifika begränsningar för de namn som Apache Spark kan använda. Namn får bara innehålla bokstäver eller siffror, får innehålla minst 15 tecken, måste börja med en bokstav, får inte innehålla reserverade ord och vara unika på arbetsytan.

  5. Lämna alla inställningar som standard på nästa flik (Ytterligare inställningar).

  6. Vi kommer inte att lägga till några taggar för tillfället, så välj Granska + skapa.

  7. På fliken Granska + skapa kontrollerar du att informationen ser korrekt ut baserat på vad som angavs tidigare och trycker på Skapa.

    Skapa Synapse Studio ny Apache Spark pool

  8. Den Apache Spark poolen startar etableringsprocessen.

  9. När etableringen är klar visas den Apache Spark poolen i listan.

    Synapse Studio ny Apache Spark lista

Rensa Apache Spark poolresurser med hjälp av Synapse Studio

Följ stegen nedan för att ta bort Apache Spark från arbetsytan med hjälp av Synapse Studio.

Varning

Om du tar bort en Spark-pool tas analysmotorn bort från arbetsytan. Det går inte längre att ansluta till poolen, och alla frågor, pipelines och notebook-datorer som använder den här Spark-poolen fungerar inte längre.

Om du vill ta bort Apache Spark-poolen gör du följande:

  1. Gå till Apache Spark i hanteringshubben i Synapse Studio.

  2. Välj ellipsen bredvid Apache-poolen som ska tas bort (i det här fallet contosospark) för att visa kommandona för Apache Spark poolen.

    Lista över Apache Spark pooler med den nyligen skapade poolen vald.

  3. Tryck på Ta bort.

  4. Bekräfta borttagningen och tryck på knappen Ta bort.

  5. När processen har slutförts visas Apache Spark inte längre i arbetsytans resurser.

Nästa steg