Verbinding maken met gegevensbronnen

In dit artikel vindt u aanbevelingen voor de wijze waarop beheerders en andere hoofdgebruikers verbindingen tussen Azure Databricks en gegevensbronnen kunnen configureren. Als u probeert te bepalen of u toegang hebt tot het lezen van gegevens vanuit een extern systeem, controleert u eerst de gegevens waartoe u toegang hebt in uw werkruimte. Zie Gegevens ontdekken.

U kunt uw Azure Databricks-account verbinden met gegevensbronnen zoals opslag van cloudobjecten, relationele databasebeheersystemen, streaminggegevensservices en bedrijfsplatforms zoals CRL's. De specifieke bevoegdheden die nodig zijn om verbindingen te configureren, zijn afhankelijk van de gegevensbron, hoe machtigingen in uw Azure Databricks-werkruimte worden geconfigureerd, de vereiste machtigingen voor interactie met gegevens in de bron, uw gegevensbeheermodel en de gewenste methode voor het maken van verbinding.

Voor de meeste methoden zijn verhoogde bevoegdheden vereist voor zowel de gegevensbron als de Azure Databricks-werkruimte om de benodigde machtigingen te configureren voor het integreren van systemen. Gebruikers zonder deze machtigingen moeten hulp vragen. Zie Toegang tot gegevensbronnen aanvragen.

Objectopslagverbindingen configureren

Cloudobjectopslag biedt de basis voor het opslaan van de meeste gegevens in Azure Databricks. Zie Waar schrijft Azure Databricks gegevens voor meer informatie over opslag van cloudobjecten en waar Azure Databricks gegevens opslaat.

Databricks raadt het gebruik van Unity Catalog aan om toegang tot cloudobjectopslag te configureren. Unity Catalog biedt gegevensbeheer voor gestructureerde en ongestructureerde gegevens in de opslag van cloudobjecten. Zie Verbinding maken naar cloudobjectopslag met behulp van Unity Catalog.

Klanten die geen Unity Catalog gebruiken, moeten verbindingen configureren met behulp van verouderde methoden. Zie Toegang tot cloudobjectopslag configureren voor Azure Databricks.

Zie Netwerken als u netwerken wilt configureren voor cloudobjectopslag.

Verbindingen met externe gegevenssystemen configureren

Databricks raadt verschillende opties aan voor het configureren van verbindingen met externe gegevenssystemen, afhankelijk van uw behoeften. De volgende tabel bevat een algemeen overzicht van deze opties:

Optie Omschrijving
Lakehouse Federation Biedt alleen-lezentoegang tot gegevens in bedrijfsgegevenssystemen. Verbinding maken ions worden geconfigureerd via Unity Catalog op catalogus- of schemaniveau, waarbij meerdere tabellen worden gesynchroniseerd met één configuratie. Zie Wat is Lakehouse Federation.
Partner Verbinding maken Maakt gebruik van oplossingen van technologiepartner om verbinding te maken met externe gegevensbronnen en het automatiseren van het opnemen van gegevens naar het lakehouse. Sommige oplossingen omvatten ook omgekeerde ETL en directe toegang tot lakehouse-gegevens van externe systemen. Wat is Databricks Partner Verbinding maken?
Stuurprogramma's Azure Databricks bevat stuurprogramma's voor externe gegevenssystemen in elke Databricks Runtime. U kunt desgewenst stuurprogramma's van derden installeren voor toegang tot gegevens in andere systemen. U moet verbindingen voor elke tabel configureren. Sommige stuurprogramma's bevatten schrijftoegang. Zie Verbinding maken naar externe systemen.
JDBC Verschillende meegeleverde stuurprogramma's voor externe systemen zijn gebaseerd op systeemeigen JDBC-ondersteuning en de JDBC-optie biedt uitbreidbare opties voor het configureren van verbindingen met andere systemen. U moet verbindingen voor elke tabel configureren. Zie Querydatabases met behulp van JDBC.

Verbinding maken naar streaminggegevensbronnen

Azure Databricks biedt geoptimaliseerde connectors voor veel streaminggegevenssystemen.

Voor alle streaminggegevensbronnen moet u referenties genereren die toegang bieden en deze referenties laden in Azure Databricks. Databricks raadt aan referenties op te slaan met behulp van geheimen, omdat u geheimen kunt gebruiken voor alle configuratieopties en in alle toegangsmodi.

Alle gegevensconnectors voor streamingbronnen ondersteunen het doorgeven van referenties met behulp van opties bij het definiëren van streamingquery's. Zie Streaminggegevensbronnen configureren.

Toegang tot gegevensbronnen aanvragen

In veel organisaties hebben de meeste gebruikers onvoldoende bevoegdheden voor Azure Databricks of externe gegevensbronnen om gegevensverbindingen te configureren.

Uw organisatie heeft mogelijk al toegang tot een gegevensbron geconfigureerd met behulp van een van de patronen die worden beschreven in de artikelen die op deze pagina zijn gekoppeld. Als uw organisatie een goed gedefinieerd proces heeft voor het aanvragen van toegang tot gegevens, raadt Databricks aan dat proces te volgen.

Als u niet zeker weet hoe u toegang krijgt tot een gegevensbron, kan deze procedure u helpen:

  1. Gebruik Catalog Explorer om de tabellen en volumes weer te geven waartoe u toegang hebt. Zie Wat is Catalog Explorer?
  2. Vraag uw teamleden of managers over de gegevensbronnen waartoe ze toegang hebben.
    • De meeste organisaties gebruiken groepen die zijn gesynchroniseerd vanaf hun id-provider (bijvoorbeeld Okta of Microsoft Entra ID (voorheen Azure Active Directory)) om machtigingen voor werkruimtegebruikers te beheren. Als andere leden van uw team toegang hebben tot gegevensbronnen waartoe u toegang nodig hebt, moet u een werkruimtebeheerder aan de juiste groep toevoegen om u toegang te verlenen.
    • Als een bepaalde tabel, volume of gegevensbron is geconfigureerd door een collega, moet die persoon machtigingen hebben om u toegang te verlenen tot de gegevens.
  3. Sommige organisaties configureren machtigingen voor gegevenstoegang via instellingen voor rekenclusters en SQL-warehouses.
    • De toegang tot gegevensbronnen kan per rekenproces variëren.
    • U kunt de maker van de rekenkracht bekijken op het tabblad Compute . Neem contact op met de maker om te vragen over gegevensbronnen die toegankelijk moeten zijn.