Veelgestelde vragen over Azure Databricks

In dit artikel vindt u de belangrijkste vragen die mogelijk betrekking hebben op Azure Databricks. Er worden ook enkele veelvoorkomende problemen vermeld die u mogelijk hebt tijdens het gebruik van Databricks. Zie Wat is Azure Databricks voor meer informatie.

Kan ik Azure Key Vault gebruiken om sleutels/geheimen op te slaan die moeten worden gebruikt in Azure Databricks?

Ja. U kunt Azure Key Vault gebruiken om sleutels/geheimen op te slaan voor gebruik met Azure Databricks. Zie Bereiken met Azure Key Vault-ondersteuning voor meer informatie.

Kan ik Azure Virtual Networks gebruiken met Databricks?

Ja. U kunt een Azure Virtual Network (VNET) gebruiken met Azure Databricks. Zie Azure Databricks implementeren in uw virtuele Azure-netwerk voor meer informatie.

Hoe kan ik toegang tot Azure Data Lake Storage vanuit een notebook?

Volg vervolgens deze stappen:

  1. Richt in Microsoft Entra ID (voorheen Azure Active Directory) een service-principal in en noteer de sleutel.
  2. Wijs de benodigde machtigingen toe aan de service-principal in Data Lake Storage.
  3. Als u toegang wilt krijgen tot een bestand in Data Lake Storage, gebruikt u de referenties van de service-principal in Notebook.

Zie Azure Data Lake Storage gebruiken met Azure Databricks voor meer informatie.

Veelvoorkomende problemen oplossen

Hier volgen enkele problemen die u kunt tegenkomen met Databricks.

Probleem: dit abonnement is niet geregistreerd voor gebruik van de naamruimte Microsoft.Databricks

Foutmelding

"Dit abonnement is niet geregistreerd voor het gebruik van de naamruimte Microsoft.Databricks. Zie voor meer informatie https://aka.ms/rps-not-found over het registreren van abonnementen. (Code: MissingSubscriptionRegistration)"

Oplossing

  1. Ga naar de Azure Portal.
  2. Selecteer Abonnementen, het abonnement dat u gebruikt en vervolgens Resourceproviders.
  3. Selecteer Registreren in de lijst met resourceproviders voor Microsoft.Databricks. U moet de rol inzender of eigenaar voor het abonnement hebben om de resourceprovider te registreren.

Probleem: Uw account {email} heeft geen rol van eigenaar of inzender voor de Databricks-werkruimteresource in Azure Portal

Foutmelding

'Uw account {email} heeft geen rol Eigenaar of Inzender voor de Databricks-werkruimteresource in Azure Portal. Deze fout kan ook optreden als u een gastgebruiker in de tenant bent. Vraag uw beheerder u toegang te verlenen of u als gebruiker rechtstreeks toe te voegen aan de Databricks-werkruimte. (Code: AADSTS90015)

Oplossing

Hier volgen enkele oplossingen voor dit probleem:

Als u een Azure Databricks-gebruiker bent zonder de rol Eigenaar of Inzender voor de Databricks-werkruimteresource en u gewoon toegang wilt krijgen tot de werkruimte:

  • U moet deze rechtstreeks openen met behulp van de URL (bijvoorbeeld https://adb-5555555555555555.19.azuredatabricks.net). Gebruik de knop Werkruimte starten niet in Azure Portal.

Als u verwacht dat deze wordt herkend als eigenaar of inzender voor de werkruimteresource:

  • Als u de tenant wilt initialiseren, moet u zijn aangemeld als gewone gebruiker van de tenant, niet als gastgebruiker. U moet ook de rol Inzender of Eigenaar hebben voor de Databricks-werkruimteresource. Een beheerder kan een gebruiker een rol verlenen via het tabblad Toegangsbeheer (IAM) in de Azure Databricks-werkruimte in Azure Portal.

  • Deze fout kan ook optreden als uw e-maildomeinnaam is toegewezen aan meerdere mappen in Microsoft Entra-id (voorheen Azure Active Directory). Als u dit probleem wilt omzeilen, maakt u een nieuwe gebruiker in de map die het abonnement bevat met uw Databricks-werkruimte.

    a. Ga in Azure Portal naar Microsoft Entra ID (voorheen Azure Active Directory). Selecteer Gebruikers en groepen>Een gebruiker toevoegen.

    b. Voeg een gebruiker toe met een @<tenant-name>.onmicrosoft.com e-mail in plaats van @<your-domain> e-mail. U vindt deze optie in Aangepaste domeinen, onder Microsoft Entra ID (voorheen Azure Active Directory) in Azure Portal.

    c. Verdeel deze nieuwe gebruiker de rol Inzender voor de Databricks-werkruimteresource.

    d. Meld u aan bij Azure Portal met de nieuwe gebruiker en zoek de Databricks-werkruimte.

    e. Start de Databricks-werkruimte als deze gebruiker.

Probleem: Uw account {email} is niet geregistreerd in Databricks

Oplossing

Als u de werkruimte niet hebt gemaakt en u als gebruiker wordt toegevoegd, neemt u contact op met de persoon die de werkruimte heeft gemaakt. Laat die persoon u toevoegen met behulp van de Azure Databricks Beheer Console. Zie Gebruikers toevoegen en beheren voor instructies. Als u de werkruimte hebt gemaakt en nog steeds deze fout krijgt, selecteert u De werkruimte opnieuw initialiseren vanuit Azure Portal.

Probleem: fout bij het starten van de cloudprovider tijdens het instellen van het cluster (PublicIPCountLimitReached)

Foutmelding

"Fout bij het starten van de cloudprovider: Er is een fout met de cloudprovider opgetreden tijdens het instellen van het cluster. Zie de Databricks-handleiding voor meer informatie. Azure-foutcode: PublicIPCountLimitReached. Azure-foutbericht: Er kunnen niet meer dan 10 openbare IP-adressen worden gemaakt voor dit abonnement in deze regio.

Achtergrond

Databricks-clusters gebruiken één openbaar IP-adres per knooppunt (inclusief het stuurprogrammaknooppunt). Azure-abonnementen hebben openbare IP-adreslimieten per regio. Het maken en opschalen van clusters kan dus mislukken als dit ertoe zou leiden dat het aantal openbare IP-adressen dat aan dat abonnement in die regio is toegewezen, de limiet overschrijdt. Deze limiet omvat ook openbare IP-adressen die zijn toegewezen voor niet-Databricks-gebruik, zoals aangepaste door de gebruiker gedefinieerde VM's.

In het algemeen verbruiken clusters alleen openbare IP-adressen terwijl ze actief zijn. Fouten PublicIPCountLimitReached kunnen echter gedurende korte tijd blijven optreden, zelfs nadat andere clusters zijn beëindigd. Dit komt doordat Databricks Azure-resources tijdelijk in cache slaat wanneer een cluster wordt beëindigd. Resourcecaching is standaard, omdat dit de latentie van het opstarten en automatisch schalen van clusters aanzienlijk vermindert in veel veelvoorkomende scenario's.

Oplossing

Als uw abonnement de limiet voor het openbare IP-adres voor een bepaalde regio al heeft bereikt, moet u een of meer van de volgende handelingen uitvoeren.

  • Maak nieuwe clusters in een andere Databricks-werkruimte. De andere werkruimte moet zich bevinden in een regio waarin u de limiet voor het openbare IP-adres van uw abonnement niet hebt bereikt.
  • Vraag om de limiet voor uw openbare IP-adres te verhogen. Kies Quota als probleemtype en netwerken: ARM als quotumtype. In Details vraagt u een verhoging van het quotum voor openbare IP-adressen aan. Als uw limiet bijvoorbeeld momenteel 60 is en u een cluster met 100 knooppunten wilt maken, vraagt u een limietverhoging aan tot 160.

Probleem: Een tweede type fout bij het starten van de cloudprovider tijdens het instellen van het cluster (MissingSubscriptionRegistration)

Foutmelding

"Fout bij het starten van de cloudprovider: Er is een fout met de cloudprovider opgetreden tijdens het instellen van het cluster. Zie de Databricks-handleiding voor meer informatie. Azure-foutcode: MissingSubscriptionRegistration Azure-foutbericht: het abonnement is niet geregistreerd voor het gebruik van naamruimte 'Microsoft.Compute'. Zie voor meer informatie https://aka.ms/rps-not-found over het registreren van abonnementen.

Oplossing

  1. Ga naar de Azure Portal.
  2. Selecteer Abonnementen, het abonnement dat u gebruikt en vervolgens Resourceproviders.
  3. Selecteer Registreren in de lijst met resourceproviders bij Microsoft.Compute. U moet de rol inzender of eigenaar voor het abonnement hebben om de resourceprovider te registreren.

Zie Resourceproviders en -typen voor meer gedetailleerde instructies.

Probleem: Azure Databricks heeft machtigingen nodig voor toegang tot resources in uw organisatie die alleen een beheerder kan verlenen.

Achtergrond

Azure Databricks is geïntegreerd met Microsoft Entra ID (voorheen Azure Active Directory). U kunt machtigingen instellen in Azure Databricks (bijvoorbeeld in notebooks of clusters) door gebruikers op te geven van Microsoft Entra ID (voorheen Azure Active Directory). Azure Databricks kan alleen de namen van de gebruikers van uw Microsoft Entra-id (voorheen Azure Active Directory) vermelden. Hiervoor is leesmachtiging vereist voor die informatie en toestemming. Als de toestemming nog niet beschikbaar is, ziet u de fout.

Oplossing

Meld u aan als globale beheerder bij Azure Portal. Ga voor Microsoft Entra-id (voorheen Azure Active Directory) naar het tabblad Instellingen en zorg ervoor dat gebruikers namens hen toestemming kunnen geven voor apps die bedrijfsgegevens openen, is ingesteld op Ja.

Probleem: Azure Databricks biedt geen ondersteuning voor het maken van werkruimten onder Azure-resourcegroepen, die worden gemaakt met Chinese tekens.

Oplossing

Ondersteuning voor validatie voor dit scenario als onderdeel van het maken van een werkruimte wordt toegevoegd in latere release.

Volgende stappen