Rychlý start: Vytvoření nového bezserverového fondu Apache Spark pomocí webu Azure Portal

Azure Synapse Analytics nabízí různé analytické moduly, které vám pomůžou ingestovat, transformovat, modelovat, analyzovat a distribuovat data. Fond Apache Spark poskytuje opensourcové výpočetní funkce pro velké objemy dat. Po vytvoření fondu Apache Sparku v pracovním prostoru Synapse je možné načíst, modelovat, zpracovávat a distribuovat data pro rychlejší analytické přehledy.

V tomto rychlém startu se dozvíte, jak pomocí webu Azure Portal vytvořit fond Apache Spark v pracovním prostoru Synapse.

Důležité

Fakturace instancí Sparku se účtuje za minutu bez ohledu na to, jestli je používáte, nebo ne. Po dokončení použití nezapomeňte instanci Sparku vypnout nebo nastavit krátký časový limit. Další informace najdete v části Vyčištění prostředků tohoto článku.

Pokud ještě nemáte předplatné Azure, vytvořte si napřed bezplatný účet.

Požadavky

Přihlaste se k portálu Azure Portal.

Přihlaste se k portálu Azure Portal.

  1. Přejděte do pracovního prostoru Synapse, kde se fond Apache Sparku vytvoří zadáním názvu služby (nebo názvu prostředku přímo) do panelu hledání. Screenshot of the Azure portal search bar with Synapse workspaces typed in.

  2. V seznamu pracovních prostorů zadejte název (nebo část názvu) pracovního prostoru, který chcete otevřít. V tomto příkladu používáme pracovní prostor s názvem contosoanalytics. Screenshot from the Azure portal of the list of Synapse workspaces filtered to show those containing the name Contoso.

Vytvoření nového fondu Apache Sparku

Důležité

Modul runtime Azure Synapse pro Apache Spark 2.4 se od září 2023 oficiálně nepodporuje. Vzhledem k tomu , že Spark 3.1 a Spark 3.2 jsou také oznámeny ukončení podpory, doporučujeme zákazníkům migrovat na Spark 3.3.

  1. V pracovním prostoru Synapse, ve kterém chcete vytvořit fond Apache Spark, vyberte Nový fond Apache Sparku. Screenshot from the Azure portal of a Synapse workspace with a red box around the command to create a new Apache Spark pool.

  2. Na kartě Základy zadejte následující podrobnosti:

    Nastavení Navrhovaná hodnota Popis
    Název fondu Apache Sparku Platný název fondu, například contosospark Toto je název, který bude mít fond Apache Spark.
    Velikost uzlu Malý (4 vCPU / 32 GB) Nastavte tuto možnost na nejmenší velikost, abyste snížili náklady na tento rychlý start.
    Automatické škálování Zakázáno Pro účely tohoto rychlého startu nepotřebujeme automatické škálování.
    Počet uzlů 5 Omezení nákladů pro účely tohoto rychlého startu pomocí malé velikosti

    Screenshot from the Azure portal of the Apache Spark pool create flow - basics tab.

    Důležité

    Pro názvy, které fondy Apache Sparku můžou používat, platí určitá omezení. Názvy musí obsahovat pouze písmena nebo číslice, musí mít maximálně 15 znaků, musí začínat písmenem, nesmí obsahovat vyhrazená slova a být v pracovním prostoru jedinečná.

  3. Vyberte Další: Další nastavení a zkontrolujte výchozí nastavení. Neupravujte žádná výchozí nastavení. Screenshot from the Azure portal that shows the 'Create Apache Spark pool' page with the 'Additional settings' tab selected.

  4. Vyberte Další: značky. Zvažte použití značek Azure. Například značka "Owner" nebo "CreatedBy", která identifikuje, kdo prostředek vytvořil, a značku Prostředí, abyste zjistili, jestli se tento prostředek nachází v produkčním prostředí, vývoji atd. Další informace najdete v tématu Vývoj strategie vytváření názvů a označování prostředků Azure. Screenshot from the Azure portal of Apache Spark pool create flow - additional settings tab.

  5. Vyberte Zkontrolovat a vytvořit.

  6. Ujistěte se, že podrobnosti vypadají správně podle toho, co bylo dříve zadáno, a vyberte Vytvořit. Screenshot from the Azure portal of Apache Spark pool create flow - review settings tab.

  7. V tomto okamžiku se spustí tok zřizování prostředků, který indikuje, že je dokončený. Screenshot from the Azure portal of that shows the 'Overview' page with a 'Your deployment is complete' message displayed.

  8. Po dokončení zřizování se po přechodu zpět do pracovního prostoru zobrazí nová položka pro nově vytvořený fond Apache Spark. Screenshot from the Azure portal of Apache Spark pool create flow - resource provisioning.

  9. V tuto chvíli nejsou spuštěné žádné prostředky, žádné poplatky za Spark, vytvořili jste metadata o instancích Sparku, které chcete vytvořit.

Vyčištění prostředků

Následující kroky odstraní fond Apache Sparku z pracovního prostoru.

Upozorňující

Odstraněním fondu Apache Spark odeberete analytický modul z pracovního prostoru. Už se nebude možné připojit k fondu a všechny dotazy, kanály a poznámkové bloky, které tento fond Apache Sparku používají, už nebudou fungovat.

Pokud chcete odstranit fond Apache Sparku, proveďte následující kroky:

  1. V pracovním prostoru přejděte do podokna fondy Apache Sparku.
  2. Vyberte fond Apache Spark, který chcete odstranit (v tomto případě contosospark).
  3. Vyberte Odstranit. Screenshot from the Azure portal of a list of Apache Spark pools, with the recently created pool selected.
  4. Potvrďte odstranění a vyberte tlačítko Odstranit . Screenshot from the Azure portal of the Confirmation dialog to delete the selected Apache Spark pool.
  5. Po úspěšném dokončení procesu už fond Apache Spark nebude uvedený v prostředcích pracovního prostoru.