Kapcsolódás adatforrásokhoz

Ez a cikk véleményezett javaslatokat tartalmaz arra vonatkozóan, hogy a rendszergazdák és más energiafelhasználók hogyan konfigurálhatják az Azure Databricks és az adatforrások közötti kapcsolatokat. Ha azt szeretné megállapítani, hogy rendelkezik-e hozzáféréssel egy külső rendszer adatainak olvasásához, először tekintse át a munkaterületen elérhető adatokat. Lásd: Adatok felderítése.

Azure Databricks-fiókját olyan adatforrásokhoz csatlakoztathatja, mint a felhőobjektum-tárolás, a relációs adatbázis-kezelő rendszerek, a streamelési adatszolgáltatások és a vállalati platformok, például a CRM-ek. A kapcsolatok konfigurálásához szükséges speciális jogosultságok az adatforrástól, az Azure Databricks-munkaterület engedélyeinek konfigurálásától, a forrásban lévő adatok kezeléséhez szükséges engedélyektől, az adatszabályozási modelltől és a kapcsolódáshoz előnyben részesített módszertől függenek.

A legtöbb módszer emelt szintű jogosultságokat igényel mind az adatforráson, mind az Azure Databricks-munkaterületen a rendszerek integrálásához szükséges engedélyek konfigurálásához. Az engedélyekkel nem rendelkező felhasználóknak segítséget kell kérniük. Lásd: Hozzáférés kérése adatforrásokhoz.

Objektumtároló-kapcsolatok konfigurálása

A felhőalapú objektumtárolás biztosítja a legtöbb adat Azure Databricksen való tárolásának alapját. Ha többet szeretne megtudni a felhőalapú objektumtárolásról és az Azure Databricks adatainak tárolásáról, olvassa el a Hol ír adatokat az Azure Databricks?

A Databricks azt javasolja, hogy a Unity Catalog használatával konfigurálja a felhőobjektum-tárolóhoz való hozzáférést. A Unity Catalog strukturált és strukturálatlan adatokhoz is biztosít adatszabályozást a felhőobjektum-tárolókban. Lásd: Csatlakozás felhőbeli objektumtárba a Unity Catalog használatával.

A Unity-katalógust nem használó ügyfeleknek régi módszerekkel kell konfigurálnia a kapcsolatokat. Lásd: Az Azure Databricks felhőalapú objektumtárolóhoz való hozzáférésének konfigurálása.

A felhőalapú objektumtárolóba való hálózatkezelés konfigurálásához lásd: Hálózatkezelés.

Külső adatrendszerek kapcsolatainak konfigurálása

A Databricks számos lehetőséget ajánl a külső adatrendszerek kapcsolatainak konfigurálására az igényeitől függően. Az alábbi táblázat az alábbi lehetőségek magas szintű áttekintését tartalmazza:

Lehetőség Leírás
Lakehouse Federation Csak olvasható hozzáférést biztosít a vállalati adatrendszerek adataihoz. Csatlakozás konfigurálása a Unity Katalóguson keresztül történik a katalógus vagy séma szintjén, több tábla egyetlen konfigurációval való szinkronizálásával. Lásd : Mi az a Lakehouse Federation.
Partner Csatlakozás Technológiai partnermegoldásokat használ a külső adatforrásokhoz való csatlakozáshoz és az adatok tóházba való betöltésének automatizálásához. Egyes megoldások közé tartozik a fordított ETL és a tóházi adatokhoz való közvetlen hozzáférés külső rendszerekből. Mi az a Databricks-partner Csatlakozás?
Illesztőprogramok Az Azure Databricks minden Databricks-futtatókörnyezetben külső adatrendszerek illesztőprogramjait tartalmazza. Külső illesztőprogramokat is telepíthet, hogy más rendszerek adataihoz férhessen hozzá. Minden táblához konfigurálnia kell a kapcsolatokat. Egyes illesztőprogramok írási hozzáférést is tartalmaznak. Lásd: Csatlakozás külső rendszerekhez.
JDBC A külső rendszerek számos illesztőprogramja natív JDBC-támogatásra épül, és a JDBC lehetőség bővíthető lehetőségeket biztosít a más rendszerekhez való kapcsolatok konfigurálásához. Minden táblához konfigurálnia kell a kapcsolatokat. Lásd: Adatbázisok lekérdezése JDBC használatával.

Csatlakozás streamelő adatforrásokhoz

Az Azure Databricks számos streamelési adatrendszerhez biztosít optimalizált összekötőket.

Minden streamelési adatforráshoz olyan hitelesítő adatokat kell létrehoznia, amelyek hozzáférést biztosítanak, és betöltik ezeket a hitelesítő adatokat az Azure Databricksbe. A Databricks a hitelesítő adatok titkos kulcsok használatával történő tárolását javasolja, mivel a titkos kulcsokat minden konfigurációs beállításhoz és minden hozzáférési módhoz használhatja.

A streamelési források összes adatösszekötője támogatja a hitelesítő adatok átadását a streamelési lekérdezések definiálásakor megadott beállításokkal. Lásd: Streamelési adatforrások konfigurálása.

Hozzáférés kérése adatforrásokhoz

Számos szervezetben a felhasználók többsége nem rendelkezik megfelelő jogosultságokkal sem az Azure Databricksben, sem külső adatforrásokban az adatkapcsolatok konfigurálásához.

Előfordulhat, hogy a szervezet már konfigurálta az adatforráshoz való hozzáférést az ezen a lapon hivatkozott cikkekben ismertetett minták egyikével. Ha a szervezet jól meghatározott folyamattal rendelkezik az adatokhoz való hozzáférés igényléséhez, a Databricks azt javasolja, hogy kövesse ezt a folyamatot.

Ha nem tudja, hogyan férhet hozzá egy adatforráshoz, ez az eljárás segíthet:

  1. A Katalóguskezelővel megtekintheti az elérhető táblákat és köteteket. Lásd: Mi az a Katalóguskezelő?.
  2. Kérdezze meg csapattársait vagy vezetőit az általuk elérhető adatforrásokról.
    • A legtöbb szervezet az identitásszolgáltatótól szinkronizált csoportokat (például: Okta vagy Microsoft Entra ID (korábbi nevén Azure Active Directory) használja a munkaterület-felhasználók engedélyeinek kezeléséhez. Ha a csapat más tagjai hozzáférhetnek azokhoz az adatforrásokhoz, amelyekhez hozzáférésre van szüksége, a munkaterület rendszergazdája adja hozzá Önt a megfelelő csoporthoz, hogy hozzáférést biztosítson Önnek.
    • Ha egy adott táblát, kötetet vagy adatforrást egy munkatárs állított be, az adott személynek rendelkeznie kell az adatokhoz való hozzáférés engedélyezéséhez szükséges engedélyekkel.
  3. Egyes szervezetek adathozzáférési engedélyeket konfigurálnak a számítási fürtök és az SQL-raktárak beállításain keresztül.
    • Az adatforrásokhoz való hozzáférés számításonként eltérő lehet.
    • A számítási létrehozót a Számítás lapon tekintheti meg. Forduljon a létrehozóhoz, és kérdezze meg azokat az adatforrásokat, amelyeknek elérhetőnek kell lenniük.