Introduktion

Slutförd

Imagine arbetar du som datatekniker för ett Företag på Fortune 500. Din organisation har använt Azure Databricks mycket för storskalig databehandling och datavetenskapsarbetsbelastningar i några år. Med tanke på den höga arbetsbelastningen och den exponentiella datatillväxt som medföljer har det blivit uppenbart att din Databricks-miljö kanske inte konfigureras med hjälp av bästa praxis. Varje jobb tar allt längre tid att köra varje månad. Din organisations tekniska ledning har gett ditt team uppgiften att ta fram bästa praxis och att använda dessa principer.

Planering, distribution och körning av Azure Databricks (ADB) i stor skala kräver ett för att fatta många arkitekturbeslut.

Varje ADB-distribution är unik för organisationens behov, men vissa mönster är vanliga i de flesta lyckade ADB-projekt. De här mönstren är inte heller helt i linje med moderna metodtips för molnbaserad utveckling.

I den här modulen sammanfattas dessa mönster i normativa och användbara metodtips för Azure Databricks. I den hittar du vägledning om hur du administrerar arbetsytan, tillämpar metodtips för säkerhet, använder verktyg och integreringar, justerar Databricks Runtime, konfigurerar hög tillgänglighet och haveriberedskap (HA/DR) och skapar och hanterar kluster.

Målgruppen för den här modulen är systemarkitekter, fälttekniker och utvecklingsteam som använder Azure Databricks.

Utbildningsmål

I den här modulen får du lära dig metodtips i följande kategorier:

  • Administration av arbetsyta
  • Säkerhet
  • Verktyg & integrering
  • Databricks-körning
  • HA/DR
  • Kluster

Förutsättningar

Ingen