Häufig gestellte Fragen zu Azure Databricks

In diesem Artikel sind die wichtigsten Fragen im Zusammenhang mit Azure Databricks aufgeführt. Außerdem werden einige häufige Probleme aufgelistet, die bei der Verwendung von Databricks auftreten können. Weitere Informationen finden Sie unter Was ist Azure Databricks?.

Kann ich Schlüssel/Geheimnisse zur Verwendung in Azure Databricks in Azure Key Vault speichern?

Ja. Sie können Azure Key Vault verwenden, um Schlüssel/Geheimnisse für den Einsatz in Azure Databricks speichern. Weitere Informationen finden Sie bei den von Azure Key Vault unterstützten Bereichen.

Kann ich virtuelle Azure-Netzwerke mit Databricks verwenden?

Ja. Sie können ein virtuelles Azure-Netzwerk (VNET) mit Azure Databricks verwenden. Weitere Informationen finden Sie unter Bereitstellen von Azure Databricks in Ihrem virtuellen Azure-Netzwerk.

Wie greife ich von einem Notebook aus auf Azure Data Lake Storage zu?

Führen Sie folgende Schritte aus:

  1. Stellen Sie in Microsoft Entra ID (früher Azure Active Directory) einen Dienstprinzipal bereit, und erfassen Sie dessen Schlüssel.
  2. Weisen Sie dem Dienstprinzipal in Data Lake Storage die erforderlichen Berechtigungen zu.
  3. Verwenden Sie zum Zugreifen auf eine Datei in Data Lake Storage die Anmeldeinformationen für den Dienstprinzipal in Notebook.

Weitere Informationen finden Sie unter Verwenden von Azure Data Lake Storage mit Azure Databricks.

Beheben allgemeiner Probleme

Hier folgen einige Probleme, die mit Databricks auftreten können.

Problem: Dieses Abonnement ist nicht für die Verwendung des Namespace „Microsoft.Databricks“ registriert.

Fehlermeldung

„Dieses Abonnement ist nicht für die Verwendung des Namespace „Microsoft.Databricks“ registriert. Informationen zum Registrieren von Abonnements finden Sie unter https://aka.ms/rps-not-found. (Code: MissingSubscriptionRegistration)“

Lösung

  1. Öffnen Sie das Azure-Portal.
  2. Wählen Sie Abonnements und das von Ihnen verwendete Abonnement aus. Wählen Sie anschließend Ressourcenanbieter aus.
  3. Wählen Sie in der Liste der Ressourcenanbieter für Microsoft.Databricks die Option Registrieren aus. Sie müssen über die Rolle „Mitwirkender“ oder „Besitzer“ für das Abonnement verfügen, um den Ressourcenanbieter zu registrieren.

Problem: Ihr Konto {E-Mail} weist nicht die Rolle „Besitzer“ oder „Mitwirkender“ für die Databricks-Arbeitsbereichsressource im Azure-Portal auf.

Fehlermeldung

„Ihr Konto {E-Mail} weist nicht die Rolle „Besitzer“ oder „Mitwirkender“ für die Databricks-Arbeitsbereichsressource im Azure-Portal auf. Dieser Fehler kann auch auftreten, wenn Sie ein Gastbenutzer im Mandanten sind. Bitten Sie Ihren Administrator, Ihnen den Zugriff zu gewähren oder Sie als einen Benutzer direkt im Databricks-Arbeitsbereich hinzuzufügen.“ (Code: AADSTS90015)

Lösung

Nachfolgend sind einige Lösungen für dieses Problem aufgeführt:

Wenn Sie ein Azure Databricks-Benutzer ohne die Rolle „Besitzer“ oder „Mitwirkender“ für die Databricks-Arbeitsbereichsressource sind und einfach nur auf den Arbeitsbereich zugreifen möchten:

  • Greifen Sie direkt über die URL (beispielsweise https://adb-5555555555555555.19.azuredatabricks.net) darauf zu. Verwenden Sie nicht die Schaltfläche „Arbeitsbereich starten“ im Azure-Portal.

Wenn Sie erwartet haben, dass Sie als Besitzer oder Mitwirkender für die Arbeitsbereichsressource erkannt werden:

  • Um den Mandanten zu initialisieren, müssen Sie als ein regulärer Benutzer des Mandanten und nicht als Gastbenutzer angemeldet sein. Außerdem müssen Sie über die Rolle „Mitwirkender“ oder „Besitzer“ für die Databricks-Arbeitsbereichsressource verfügen. Ein Administrator kann einem Benutzer im Azure-Portal über die Registerkarte Zugriffssteuerung (IAM) des Azure Databricks-Arbeitsbereichs eine Rolle zuweisen.

  • Dieser Fehler kann auch auftreten, wenn Ihr E-Mail-Domänenname mehreren Verzeichnissen in Microsoft Entra ID (ehemals Azure Active Directory) zugewiesen ist. Um dieses Problem zu umgehen, erstellen Sie einen neuen Benutzer in dem Verzeichnis, das das Abonnement mit Ihrem Databricks-Arbeitsbereich enthält.

    a. Wechseln Sie im Azure-Portal zu Microsoft Entra ID (früher Azure Active Directory). Wählen Sie Benutzer und Gruppen>Benutzer hinzufügen aus.

    b. Fügen Sie einen Benutzer mit einer E-Mail-Adresse vom Typ @<tenant-name>.onmicrosoft.com anstelle einer E-Mail-Adresse vom Typ @<your-domain> hinzu. Diese Option finden Sie unter Benutzerdefinierte Domänen unter „Microsoft Entra ID“ (ehemals Azure Active Directory) im Azure-Portal.

    c. Gewähren Sie diesem neuen Benutzer die Rolle Mitwirkender für die Databricks-Arbeitsbereichsressource.

    d. Melden Sie sich beim Azure-Portal mit dem neuen Benutzer an, und suchen Sie den Databricks-Arbeitsbereich.

    e. Starten Sie den Databricks-Arbeitsbereich als dieser Benutzer.

Problem: Ihr Konto {E-Mail} wurde nicht in Databricks registriert.

Lösung

Wenn Sie den Arbeitsbereich nicht erstellt haben und als Benutzer hinzugefügt werden, wenden Sie sich an die Person, die den Arbeitsbereich erstellt hat. Lassen Sie sich von dieser Person hinzufügen, indem Sie die Azure Databricks Admin Console verwenden. Anweisungen hierzu finden Sie unter Hinzufügen und Verwalten von Benutzern. Wenn Sie den Arbeitsbereich erstellt haben und weiterhin diese Fehlermeldung erhalten, wählen Sie im Azure-Portal erneut Arbeitsbereich initialisieren aus.

Problem: Startfehler des Cloudanbieters beim Einrichten des Clusters (PublicIPCountLimitReached)

Fehlermeldung

„Startfehler des Cloudanbieters: Beim Einrichten des Clusters ist ein unerwarteter Cloudanbieterfehler aufgetreten. Weitere Informationen finden Sie im Databricks-Handbuch. Azure-Fehlercode: PublicIPCountLimitReached. Azure-Fehlermeldung: Es können maximal 10 öffentliche IP-Adressen für dieses Abonnement in dieser Region erstellt werden.

Hintergrund

Databricks-Cluster verwenden jeweils eine öffentliche IP-Adresse pro Knoten (einschließlich des Treiberknotens). Für Azure-Abonnements gelten regionsspezifische Grenzwerte für öffentliche IP-Adressen. Daher kann es vorkommen, dass Vorgänge für die Clustererstellung oder für die zentrale Hochskalierung nicht erfolgreich sind, wenn sie dazu führen, dass die Anzahl öffentlicher IP-Adressen, die diesem Abonnement in dieser Region zugeordnet sind, den Grenzwert übersteigen. Dieser Grenzwert gilt auch für öffentliche IP-Adressen, die für eine Databricks-fremde Verwendung zugeordnet werden (etwa für benutzerdefinierte virtuelle Computer).

Generell werden öffentliche IP-Adressen nur von aktiven Clustern genutzt. Fehler vom Typ PublicIPCountLimitReached können jedoch noch eine Zeitlang auftreten, auch wenn bereits andere Cluster beendet wurden. Das liegt daran, dass Azure-Ressourcen vorübergehend von Databricks zwischengespeichert werden, wenn ein Cluster beendet wird. Das Zwischenspeichern von Ressourcen ist beabsichtigt, da es die Wartezeit beim Clusterstart sowie bei der automatischen Skalierung in vielen Szenarien erheblich verkürzt.

Lösung

Wenn bei Ihrem Abonnement in einer bestimmten Region bereits der Grenzwert für öffentliche IP-Adressen erreicht wurde, können Sie eine der folgenden Aktionen ausführen:

  • Erstellen Sie neue Cluster in einem anderen Databricks-Arbeitsbereich. Der andere Arbeitsbereich muss sich in einer Region befinden, in der der Grenzwert für öffentliche IP-Adressen Ihres Abonnements noch nicht erreicht wurde.
  • Fordern Sie eine Erhöhung Ihres Grenzwerts für öffentliche IP-Adressen an. Wählen Sie Kontingent als Problemtyp und Netzwerk: ARM als Kontingenttyp aus. Fordern Sie in Details eine Erhöhung des Kontingents für öffentliche IP-Adressen an. Wenn Ihr aktueller Grenzwert beispielsweise bei 60 liegt und ein Cluster mit 100 Knoten erstellt werden soll, fordern Sie eine Erhöhung auf 160 an.

Problem: Zweite Art von Startfehler des Cloudanbieters beim Einrichten des Clusters (MissingSubscriptionRegistration)

Fehlermeldung

„Startfehler des Cloudanbieters: Beim Einrichten des Clusters ist ein unerwarteter Cloudanbieterfehler aufgetreten. Weitere Informationen finden Sie im Databricks-Handbuch. Azure-Fehlercode: MissingSubscriptionRegistration Azure-Fehlermeldung: Das Abonnement ist nicht zur Verwendung von Namespace "Microsoft.Compute" registriert. Informationen zum Registrieren von Abonnements finden Sie unter https://aka.ms/rps-not-found.“

Lösung

  1. Öffnen Sie das Azure-Portal.
  2. Wählen Sie Abonnements und das von Ihnen verwendete Abonnement aus. Wählen Sie anschließend Ressourcenanbieter aus.
  3. Wählen Sie in der Liste der Ressourcenanbieter für Microsoft.Compute die Option Registrieren aus. Sie müssen über die Rolle „Mitwirkender“ oder „Besitzer“ für das Abonnement verfügen, um den Ressourcenanbieter zu registrieren.

Ausführlichere Anweisungen finden Sie unter Ressourcenanbieter und -typen.

Problem: Azure Databricks benötigt Berechtigungen zum Zugreifen auf Ressourcen in Ihrer Organisation, die nur ein Administrator erteilen kann.

Hintergrund

Azure Databricks ist in Microsoft Entra ID (früher Azure Active Directory) integriert. Sie können durch Angabe von Benutzer*innen aus Microsoft Entra ID (ehemals Azure Active Directory) Berechtigungen innerhalb von Azure Databricks festlegen (z. B. für Notebooks oder Cluster). Um in Azure Databricks die Namen der Benutzer*innen aus Microsoft Entra ID (ehemals Azure Active Directory) aufzulisten, sind eine Leseberechtigung für diese Informationen und eine Einwilligung erforderlich. Wenn noch keine Zustimmung vorliegt, wird die Fehlermeldung angezeigt.

Lösung

Melden Sie sich als globaler Administrator beim Azure-Portal an. Navigieren Sie in Microsoft Entra ID (ehemals Azure Active Directory) zur Registerkarte Einstellungen, und stellen Sie sicher, dass Benutzer können Apps den Zugriff auf Unternehmensdaten in ihrem Namen gestatten auf Ja festgelegt ist.

Problem: Azure Databricks unterstützt die Erstellung von Arbeitsbereichen nicht unter Azure-Ressourcengruppen, die mit chinesischen Zeichen erstellt werden.

Lösung

Die Unterstützung für die Validierung dieses Szenarios als Teil der Arbeitsbereichserstellung wird in einer späteren Version hinzugefügt.

Nächste Schritte