Beskriva skillnaden mellan otålig och lazy-körning

Slutförd

I den här enheten behöver du slutföra övningarna i en Databricks Notebook. För att börja måste du ha åtkomst till en Azure Databricks arbetsyta. Om du inte har en tillgänglig arbetsyta följer du anvisningarna nedan. Annars kan du gå längst ned på sidan för att klona Databricks-arkivet.

Enhetsförutsättningarna

Microsoft Azure konto: Du behöver ett giltigt och aktivt Azure-konto för Azure Labs. Om du inte har ett sådant kan du registrera dig för en kostnadsfri provperiod

  • Om du är en Visual Studio active-prenumerant är du berättigad till Azure-krediter per månad. Du kan se den här länken om du vill veta mer, inklusive hur du aktiverar och börjar använda din månatliga Azure-kredit.

  • Om du inte är Visual Studio prenumerant kan du registrera dig för det kostnadsfria Visual Studio Dev Essentials-programmet för att skapa ett kostnadsfritt Azure-konto.

Skapa de nödvändiga resurserna

För att slutföra den här labb labben måste du distribuera Azure Databricks arbetsyta i din Azure-prenumeration.

Distribuera en Azure Databricks-arbetsyta

  1. Klicka på följande knapp för att Azure Resource Manager mallen i Azure Portal. Distribuera Databricks från Azure Resource Manager-mallen

  2. Skapa Azure Databricks-arbetsytan genom att ange nödvändiga värden:

    • Prenumeration: Välj den Azure-prenumeration där arbetsytan ska distribueras.
    • Resursgrupp: Lämna skapa ny och ange ett namn för den nya resursgruppen.
    • Plats: Välj en plats nära dig för distributionen. Det finns en lista med regioner som stöds av Azure Databricks i Tillgängliga Azure-tjänster per region.
    • Namn på arbetsyta: Ge arbetsytan ett namn.
    • Prisnivå: Se till premium att är valt.
  3. Godkänn de allmänna villkoren.

  4. Välj Köp.

  5. Det tar några minuter att skapa arbetsytan. När arbetsytan skapas i portalen visas panelen för att skicka distribution för Azure Databricks på höger sida. Du kan behöva rulla åt höger på instrumentpanelen för att se panelen. En förloppsindikator visas även längst upp på skärmen. Båda dessa områden visar förloppet.

Skapa ett kluster

  1. När din Azure Databricks har skapats väljer du länken för att gå till resursen.

  2. Välj Starta arbetsyta för att öppna Databricks-arbetsytan på en ny flik.

  3. Välj Kluster på den vänstra menyn i Databricks-arbetsytan.

  4. Välj Skapa kluster för att lägga till ett nytt kluster.

    Sidan Skapa kluster.

  5. Ange ett namn för klustret. Använd ditt namn eller dina initialer så att du enkelt kan skilja mellan dina och dina medarbetares kluster.

  6. Välj klusterläge: en nod.

  7. Välj Databricks RuntimeVersion: Runtime: 7.3 LTS (Scala 2.12, Spark 3.0.1).

  8. Under Autopilot-alternativ lämnar du kryssrutan markerad och anger i textrutan 45 .

  9. Välj Nodtyp: Standard_DS3_v2.

  10. Välj Skapa kluster.

Klona Databricks-arkivet

  1. Om du för närvarande inte har Azure Databricks arbetsytan öppen: i Azure Portal navigerar du till den distribuerade Azure Databricks arbetsytan och väljer Starta arbetsyta.

  2. I den vänstra rutan väljer du Arbetsyta > Användare och därefter ditt användarnamn (posten med husikonen).

  3. I det fönster som visas väljer du pilen intill ditt namn och väljer sedan Importera.

    Menyalternativet för att importera arkivet.

  4. I dialogrutan Import Notebooks (Importera notebook-filer) markerar du URL:en och klistrar in följande URL:

    https://github.com/solliancenet/microsoft-learning-paths-databricks-notebooks/blob/master/data-engineering/DBC/05-Lazy-Evaluation-and-Performance.dbc?raw=true
    
  5. Välj Importera.

  6. Välj mappen 05-Lazy-Evaluation-and-Performance som visas.

Slutför följande notebook-anteckningsbok

Öppna notebook-programmet 1.Eager-and-Lazy-execution. Se till att du kopplar klustret till anteckningsboken innan du följer instruktionerna och kör cellerna i den.

I anteckningsboken får du lära dig att beskriva skillnaden mellan otålig och lazy-körning.

När du har slutfört anteckningsboken återgår du till den här skärmen och fortsätter till nästa steg.