Skapa ett kluster

Det finns två typer av kluster:

  • Kluster för alla syften kan delas av flera användare. Dessa används vanligtvis för att köra notebook-datorer. All-Purpose är aktiva tills du avslutar dem.
  • Jobbkluster kör ett jobb. Du skapar ett jobbkluster när du skapar ett jobb. Sådana kluster avslutas automatiskt när jobbet har slutförts.

Den här artikeln beskriver hur du skapar ett kluster för alla syften. Information om hur du skapar jobbkluster finns i Skapa ett jobb.

Du kan också skapa ett kluster med hjälp av kluster-API 2.0.

Anteckning

Du måste ha behörighet att skapa ett kluster. Se Konfigurera behörighet att skapa kluster.

Använd knappen Skapa

Det enklaste sättet att skapa ett nytt kluster är att använda knappen Skapa:

  1. Klicka Create Icon Skapa i sidopanelen och välj Kluster på menyn. Sidan Skapa kluster visas.

  2. Namnge och konfigurera klustret.

    Det finns många konfigurationsalternativ för kluster, som beskrivs i detalj i klusterkonfigurationen.

    Cluster configuration

  3. Klicka på knappen Skapa kluster.

    Fliken Klusterkonfiguration visar en snurrande förloppsindikator när klustret är i ett tillstånd. När klustret har startats och är redo att användas omvandlas rotationshjulet till en grön cirkel med en bockmarkering. Detta anger att klustret är i running tillståndet och du kan nu bifoga notebook-filer och börja köra kommandon och frågor.

Använda klustrets användargränssnitt

  1. Klicka compute icon Compute i sidopanelen.

  2. Klicka på knappen Skapa kluster.

    Create cluster

  3. Följ steg 2 och 3 i Använd knappen Skapa.

Terraform-integrering

Du kan hantera kluster i en helt automatiserad konfiguration med hjälp av Databricks Terraform-providernoch databricks_cluster:

data "databricks_node_type" "smallest" {
  local_disk = true
}

data "databricks_spark_version" "latest_lts" {
  long_term_support = true
}

resource "databricks_cluster" "shared_autoscaling" {
  cluster_name            = "Shared Autoscaling"
  spark_version           = data.databricks_spark_version.latest_lts.id
  node_type_id            = data.databricks_node_type.smallest.id
  autotermination_minutes = 20
  autoscale {
    min_workers = 1
    max_workers = 50
  }
}