Ange och använda miljövariabler med init-skript

Init-skript har åtkomst till alla miljövariabler som finns i ett kluster. Azure Databricks anger många standardvariabler som kan vara användbara i init-skriptlogik.

Miljövariabler som anges i Spark-konfigurationen är tillgängliga för init-skript. Se Miljövariabler.

Vilka miljövariabler exponeras som standard för init-skriptet?

Klusteromfattande och globala init-skript stöder följande miljövariabler:

  • DB_CLUSTER_ID: ID för klustret där skriptet körs. Se KLUSTER-API:et.
  • DB_CONTAINER_IP: den privata IP-adressen för containern där Spark körs. Init-skriptet körs i den här containern. Se KLUSTER-API:et.
  • DB_IS_DRIVER: om skriptet körs på en drivrutinsnod.
  • DB_DRIVER_IP: IP-adressen för drivrutinsnoden.
  • DB_INSTANCE_TYPE: instanstypen för den virtuella värddatorn.
  • DB_CLUSTER_NAME: namnet på klustret som skriptet körs på.
  • DB_IS_JOB_CLUSTER: om klustret skapades för att köra ett jobb. Se Skapa ett jobb.

Om du till exempel bara vill köra en del av ett skript på en drivrutinsnod kan du skriva ett skript som:

echo $DB_IS_DRIVER
if [[ $DB_IS_DRIVER = "TRUE" ]]; then
  <run this part only on driver>
else
  <run this part only on workers>
fi
<run this part on both driver and workers>

Använda hemligheter i init-skript

Du kan använda valfritt giltigt variabelnamn när du refererar till en hemlighet. Åtkomst till hemligheter som refereras i miljövariabler bestäms av behörigheterna för den användare som konfigurerade klustret. Hemligheter som lagras i miljövariabler är tillgängliga för alla användare av klustret, men redigeras från klartextvisning.

Se Referera till en hemlighet i en miljövariabel.