Verwenden von globalen Initialisierungsskripts

Wichtig

Globale Initialisierungsskripts werden nur auf Clustern ausgeführt, die mit einem einzelnen Benutzer oder älteren Modus ohne Isolation für gemeinsam genutzten Zugriff konfiguriert sind. Daher empfiehlt Databricks, alle Initialisierungsskripts als clusterbezogene Initialisierungsskripts zu konfigurieren und mithilfe von Clusterrichtlinien im gesamten Arbeitsbereich zu verwalten.

Ein globales Initialisierungsskript wird auf jedem Cluster ausgeführt, der in Ihrem Arbeitsbereich erstellt wurde. Globale Initialisierungsskripts sind nützlich, wenn Sie Bibliothekskonfigurationen oder Sicherheitsbildschirme für die gesamte Organisation erzwingen möchten. Globale Initialisierungsskripts können nur von Arbeitsbereichsadministratoren erstellt werden. Sie können entweder über die Benutzeroberfläche oder über die REST-API erstellt werden.

Wichtig

Da globale Initialisierungsskripts auf allen Clustern ausgeführt werden, sollten Sie mögliche Auswirkungen wie die folgenden berücksichtigen:

  • Es ist schnell passiert, dass hinzugefügte Bibliotheken oder andere Änderungen unerwartete Auswirkungen besitzen. Verwenden Sie stattdessen nach Möglichkeit clusterspezifische Initialisierungsskripts.
  • Jeder Benutzer, der einen Cluster erstellt und die Übermittlung von Clusterprotokollen aktiviert, kann die Ausgaben stderr und stdout von globalen Initialisierungsskripts anzeigen. Stellen Sie daher sicher, dass die Ausgaben Ihrer globalen Initialisierungsskripts keine vertraulichen Informationen enthalten.

Konfigurieren Sie zur Behebung von Problemen mit globalen Initialisierungsskripts die Übermittlung von Clusterprotokollen, und überprüfen Sie das Initialisierungsskriptprotokoll. Weitere Informationen finden Sie unter Protokolle für Initialisierungsskripts.

Hinweis

Globale Initialisierungsskripts können nicht in Modellbereitstellungsclustern ausgeführt werden.

Hinzufügen eines globalen Initialisierungsskripts mithilfe der Benutzeroberfläche

Führen Sie die folgenden Schritte aus, um globale Initialisierungsskripts mithilfe der Administratoreinstellungen zu konfigurieren:

  1. Wechseln Sie zu den Administratoreinstellungen, und klicken Sie auf die Registerkarte Compute.

  2. Klicken Sie neben Globale Initialisierungsskripts auf Verwalten.

  3. Klicken Sie auf + Hinzufügen.

  4. Benennen Sie das Skript, und stellen Sie eine Beschreibung bereit, indem Sie eine Textdatei eingeben, einfügen oder in das Feld Skript ziehen.

    Hinweis

    Das Initialisierungsskript darf nicht größer als 64 KB sein. Überschreitet das Skript diese Größe, wird beim Speichern eine Fehlermeldung angezeigt.

  5. Wenn Sie für Ihren Arbeitsbereich mehrere globale Initialisierungsskripts konfiguriert haben, legen Sie die Reihenfolge fest, in der die Skripts ausgeführt werden sollen.

  6. Wenn Sie das Skript nach dem Speichern für alle neuen und neu gestarteten Cluster aktivieren möchten, verwenden Sie die Umschaltfläche Aktiviert.

    Wichtig

    Wenn Sie ein globales Initialisierungsskript hinzufügen oder Änderungen am Namen, der Ausführungsreihenfolge oder der Aktivierung von Initialisierungsskripts vornehmen, werden diese Änderungen erst wirksam, wenn Sie den Cluster neu starten.

  7. Klicken Sie auf Hinzufügen.

Hinzufügen eines globalen Initialisierungsskripts mithilfe von Terraform

Sie können ein globales Initialisierungsskript mithilfe des Databricks Terraform-Anbieters und databricks_global_init_script hinzufügen.

Bearbeiten eines globalen Initialisierungsskripts mithilfe der Benutzeroberfläche

  1. Wechseln Sie zu den Administratoreinstellungen, und klicken Sie auf die Registerkarte Compute.
  2. Klicken Sie neben Globale Initialisierungsskripts auf Verwalten.
  3. Klicken Sie auf ein Skript.
  4. Bearbeiten Sie das Skript.
  5. Klicken Sie auf Confirm (Bestätigen).

Konfigurieren eines globalen Initialisierungsskripts mithilfe der API

Mithilfe der API für globale Initialisierungsskripts können Arbeitsbereichsadministratoren Informationen zu den globalen Initialisierungsskripts in Ihrem Arbeitsbereich hinzufügen, löschen, neu anordnen und abrufen.