Omgevingsvariabelen instellen en gebruiken met init-scripts

Init-scripts hebben toegang tot alle omgevingsvariabelen die aanwezig zijn in een cluster. Azure Databricks stelt veel standaardvariabelen in die nuttig kunnen zijn in init-scriptlogica.

Omgevingsvariabelen die zijn ingesteld in de Spark-configuratie, zijn beschikbaar voor init-scripts. Zie Omgevingsvariabelen.

Welke omgevingsvariabelen worden standaard blootgesteld aan het init-script?

Cluster-scoped en globale init-scripts ondersteunen de volgende omgevingsvariabelen:

  • DB_CLUSTER_ID: de id van het cluster waarop het script wordt uitgevoerd. Zie de Clusters-API.
  • DB_CONTAINER_IP: het privĂ©-IP-adres van de container waarin Spark wordt uitgevoerd. Het init-script wordt uitgevoerd in deze container. Zie de Clusters-API.
  • DB_IS_DRIVER: of het script wordt uitgevoerd op een stuurprogrammaknooppunt.
  • DB_DRIVER_IP: het IP-adres van het stuurprogrammaknooppunt.
  • DB_INSTANCE_TYPE: het exemplaartype van de host-VM.
  • DB_CLUSTER_NAME: de naam van het cluster waarop het script wordt uitgevoerd.
  • DB_IS_JOB_CLUSTER: of het cluster is gemaakt om een taak uit te voeren. Zie Een taak maken.

Als u bijvoorbeeld een deel van een script alleen op een stuurprogrammaknooppunt wilt uitvoeren, kunt u een script schrijven zoals:

echo $DB_IS_DRIVER
if [[ $DB_IS_DRIVER = "TRUE" ]]; then
  <run this part only on driver>
else
  <run this part only on workers>
fi
<run this part on both driver and workers>

Geheimen gebruiken in init-scripts

U kunt elke geldige variabelenaam gebruiken wanneer u naar een geheim verwijst. Toegang tot geheimen waarnaar wordt verwezen in omgevingsvariabelen, wordt bepaald door de machtigingen van de gebruiker die het cluster heeft geconfigureerd. Geheimen die zijn opgeslagen in omgevingsvariabelen, zijn toegankelijk voor alle gebruikers van het cluster, maar worden opnieuw uitgevoerd vanuit de weergave van tekst zonder opmaak.

Zie Verwijzen naar een geheim in een omgevingsvariabele.