Sdílet prostřednictvím


Přístup k datům sdíleným s vámi pomocí rozdílového sdílení (pro příjemce)

Tento článek ukazuje, jak získat přístup k datům sdíleným s vámi pomocí rozdílového sdílení.

Rozdílové sdílení a příjemci dat

Rozdílové sdílení je otevřený standard pro zabezpečené sdílení dat. Uživatel Databricks, kterému se říká poskytovatel dat, může pomocí funkce Delta Sharing sdílet data s osobou nebo skupinou mimo organizaci, která se nazývá příjemce dat.

Sdílení databricks-to-Databricks a otevřené sdílení

Způsob přístupu k datům závisí na tom, jestli jste uživatel Databricks a jestli váš poskytovatel dat nakonfiguroval data, která s vámi někdo sdílí, pro sdílení Databricks do Databricks nebo na otevřeném sdílení.

V modelu Databricks-to-Databricks musíte být uživatelem v pracovním prostoru Databricks, který je povolený pro Katalog Unity. Člen vašeho týmu poskytne poskytovateli dat jedinečný identifikátor metastoru katalogu Unity a zprostředkovatel dat ho použije k vytvoření zabezpečeného připojení ke sdílení. Sdílená data budou k dispozici pro přístup ve vašem pracovním prostoru. V případě potřeby člen vašeho týmu nakonfiguruje podrobné řízení přístupu k datům.

V otevřeném modelu sdílení můžete pro přístup ke sdíleným datům použít libovolný nástroj, který se vám líbí (včetně Databricks). Poskytovatel dat vám pošle adresu URL aktivace přes zabezpečený kanál. Postupujte podle něj a stáhněte si soubor s přihlašovacími údaji, který vám umožní získat přístup k datům, která s vámi někdo sdílí.

Podmínky použití

Sdílená data neposkytuje Databricks přímo, ale poskytovatelé dat spuštěné v Azure Databricks.

Poznámka:

Když jako příjemce dat přistupujete ke sdíleným datům poskytovatele dat, představuje příjemce dat, že má oprávnění k přístupu ke sdíleným složkám dat poskytnutým poskytovatelem dat a bere na vědomí, že (1) Databricks nemá žádnou odpovědnost za používání těchto sdílených dat nebo příjemce dat, a (2) Databricks může shromažďovat informace o používání sdílených dat a přístup ke sdíleným datům (včetně identifikace jednotlivých nebo společností, které k těmto údajům přistupují). data používající soubor přihlašovacích údajů v souvislosti s těmito informacemi) a mohou je sdílet s příslušným poskytovatelem dat.

Získání přístupu k datům sdíleným s vámi

Způsob přístupu k datům závisí na tom, jestli s vámi váš poskytovatel dat sdílel data pomocí otevřeného protokolu pro sdílení, nebo na protokolu pro sdílení Databricks do Databricks. Viz sdílení Databricks-to-Databricks a otevřené sdílení.

Získání přístupu v modelu Databricks-to-Databricks

V modelu Databricks-to-Databricks:

  1. Zprostředkovatel dat vám pošle pokyny k vyhledání jedinečného identifikátoru metastoru katalogu Unity přidruženého k vašemu pracovnímu prostoru Databricks a odešlete ho jim.

    Identifikátor sdílení je řetězec skládající se z cloudu, oblasti a UUID metastoru (jedinečný identifikátor metastoru) ve formátu <cloud>:<region>:<uuid>. Například aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Pokud chcete získat identifikátor sdílení pomocí Průzkumníka katalogu:

    1. V pracovním prostoru Azure Databricks klikněte na Ikona kataloguKatalog.
    2. V levém podokně rozbalte nabídku Rozdílové sdílení a vyberte Sdílí se se mnou.
    3. Nad kartou Poskytovatelé klikněte na ikonu kopírování identifikátoru sdílení.

    Pokud chcete získat identifikátor sdílení pomocí poznámkového bloku nebo dotazu SQL Databricks, použijte výchozí funkci CURRENT_METASTORESQL . Pokud používáte poznámkový blok, musí být spuštěný ve sdíleném clusteru nebo clusteru s jedním uživatelem v pracovním prostoru, který použijete pro přístup ke sdíleným datům.

    SELECT CURRENT_METASTORE();
    
  2. Zprostředkovatel dat vytvoří:

    • Příjemce ve svém účtu Databricks, který bude představovat vás a uživatele ve vaší organizaci, kteří budou k datům přistupovat.
    • Sdílená složka, která představuje tabulky, svazky a zobrazení, které se s vámi mají sdílet.
  3. Máte přístup k datům sdíleným s vámi. Vy nebo někdo z vašeho týmu můžete v případě potřeby nakonfigurovat podrobný přístup k datům pro vaše uživatele. Viz Čtení dat sdílených pomocí Sdílení Databricks-to-Databricks Delta (pro příjemce).

Získání přístupu v otevřeném modelu sdílení

V otevřeném modelu sdílení:

  1. Zprostředkovatel dat vytvoří:

    • Příjemce ve svém účtu Databricks, který bude představovat vás a uživatele ve vaší organizaci, kteří budou k datům přistupovat. V rámci této konfigurace se vygeneruje token a soubor přihlašovacích údajů.
    • Sdílená složka, která představuje tabulky a oddíly, které se s vámi mají sdílet.
  2. Poskytovatel dat vám pošle adresu URL aktivace přes zabezpečený kanál. Postupujte podle něj a stáhněte si soubor s přihlašovacími údaji, který vám umožní získat přístup k datům, která s vámi někdo sdílí.

    Důležité

    Nesdílejte aktivační odkaz s kýmkoli. Soubor s přihlašovacími údaji si můžete stáhnout jenom jednou. Pokud po stažení souboru přihlašovacích údajů znovu navštívíte aktivační odkaz, tlačítko Stáhnout soubor přihlašovacích údajů je zakázané.

    Pokud před použitím ztratíte aktivační odkaz, obraťte se na poskytovatele dat.

  3. Uložte soubor přihlašovacích údajů do zabezpečeného umístění.

    Nesdílejte soubor přihlašovacích údajů s kýmkoli mimo skupinu uživatelů, kteří by měli mít přístup ke sdíleným datům. Pokud ho potřebujete sdílet s někým ve vaší organizaci, databricks doporučuje použít správce hesel.

Čtení sdílených dat

Způsob, jakým čtete data sdílená bezpečně s vámi pomocí rozdílového sdílení, závisí na tom, jestli jste dostali soubor přihlašovacích údajů (otevřený model sdílení), nebo používáte pracovní prostor Databricks a zadali jste zprostředkovatele dat identifikátor sdílení (model Databricks-to-Databricks).

Čtení sdílených dat pomocí souboru přihlašovacích údajů (otevřené sdílení)

Pokud s vámi data sdílíte pomocí otevřeného protokolu sdílení delta, použijete soubor přihlašovacích údajů, který jste stáhli, k ověření účtu Databricks poskytovatele dat a čtení sdílených dat. Přístup přetrvává, dokud je základní token platný a poskytovatel bude dál sdílet data. Zprostředkovatelé spravují vypršení platnosti a obměně tokenů. Aktualizace k datům máte k dispozici téměř v reálném čase. Můžete číst a vytvářet kopie sdílených dat, ale nemůžete upravovat zdrojová data.

Informace o přístupu ke sdíleným datům a jejich čtení pomocí souboru přihlašovacích údajů v Azure Databricks, Apache Sparku, knihovně pandas a Power BI najdete v tématu Čtení dat sdílených pomocí otevřeného sdílení delta (pro příjemce).

Čtení sdílených dat pomocí sdílení Databricks do Databricks

Pokud s vámi data sdílíte pomocí modelu Databricks-to-Databricks, není pro přístup ke sdíleným datům potřeba žádný soubor s přihlašovacími údaji. Databricks se postará o zabezpečené připojení a sdílená data se v pracovním prostoru Databricks dají automaticky zjistit.

Informace o tom, jak najít, číst a spravovat sdílená data v pracovním prostoru Databricks, najdete v tématu Čtení dat sdílených pomocí sdílení Databricks-to-Databricks Delta (pro příjemce).

Auditování využití sdílených dat

Pokud máte přístup k pracovnímu prostoru Azure Databricks, můžete pomocí protokolů auditu Azure Databricks zjistit, kdo ve vaší organizaci přistupuje k datům pomocí rozdílového sdílení. Viz Audit a monitorování sdílení dat.

Další kroky