Udostępnianie danych przy użyciu protokołu udostępniania otwartego udostępniania różnicowego (dla dostawców)

Ten artykuł zawiera omówienie sposobu, w jaki dostawcy mogą używać protokołu udostępniania otwartego udostępniania usługi Delta do udostępniania danych z obszaru roboczego usługi Azure Databricks z obsługą wykazu aparatu Unity z dowolnym użytkownikiem na dowolnej platformie obliczeniowej, w dowolnym miejscu.

Uwaga

Jeśli jesteś adresatem danych (użytkownik lub grupa użytkowników, którym są udostępniane dane), zobacz zamiast tego Uzyskiwanie dostępu do danych udostępnionych Tobie przy użyciu funkcji Udostępniania różnicowego (dla adresatów).

KtoTo należy używać protokołu udostępniania otwartego udostępniania różnicowego?

Istnieją trzy sposoby udostępniania danych przy użyciu funkcji udostępniania różnicowego:

  1. Otwarty protokół udostępniania usługi Databricks, opisany w tym artykule, umożliwia udostępnianie danych zarządzanych w obszarze roboczym usługi Databricks z obsługą wykazu aparatu Unity użytkownikom na dowolnej platformie obliczeniowej.

    To podejście korzysta z serwera udostępniania różnicowego wbudowanego w usługę Azure Databricks i jest przydatne podczas zarządzania danymi przy użyciu wykazu aparatu Unity i udostępniania go użytkownikom, którzy nie korzystają z usługi Databricks lub nie mają dostępu do obszaru roboczego usługi Databricks z obsługą wykazu aparatu Unity. Integracja z katalogiem aparatu Unity po stronie dostawcy upraszcza konfigurowanie dostawców i zarządzanie nimi.

  2. Implementacja zarządzana przez klienta serwera udostępniania różnicowego typu open source umożliwia udostępnianie z dowolnej platformy do dowolnej platformy, niezależnie od tego, czy usługa Databricks, czy nie.

    Zobacz github.com/delta-io/delta-sharing.

  3. Protokół udostępniania usługi Databricks-to-Databricks umożliwia udostępnianie danych z obszaru roboczego z obsługą wykazu aparatu Unity użytkownikom, którzy mają również dostęp do obszaru roboczego usługi Databricks z obsługą wykazu aparatu Unity.

    Zobacz Udostępnianie danych przy użyciu protokołu Delta Sharing Databricks-to-Databricks (dla dostawców).

Aby zapoznać się z wprowadzeniem do udostępniania różnicowego i uzyskać więcej informacji o tych trzech podejściach, zobacz Bezpieczne udostępnianie danych i zasobów sztucznej inteligencji przy użyciu funkcji udostępniania różnicowego.

Przepływ pracy udostępniania otwartego udostępniania usługi Delta

Ta sekcja zawiera ogólne omówienie przepływu pracy otwierania udostępniania z linkami do szczegółowej dokumentacji dla każdego kroku.

W modelu udostępniania różnicowego otwórz udostępnianie:

  1. Dostawca danych tworzy adresata, który jest nazwanym obiektem reprezentującym użytkownika lub grupę użytkowników, którym dostawca danych chce udostępniać dane.

    Gdy dostawca danych tworzy adresata, usługa Azure Databricks generuje token, plik poświadczeń zawierający token i link aktywacji, który dostawca danych może wysłać do adresata w celu uzyskania dostępu do pliku poświadczeń.

    Aby uzyskać szczegółowe informacje, zobacz Krok 1. Tworzenie adresata.

  2. Dostawca danych tworzy udział, który jest nazwanym obiektem zawierającym kolekcję tabel zarejestrowanych w magazynie metadanych wykazu aparatu Unity na koncie dostawcy.

    Aby uzyskać szczegółowe informacje, zobacz Tworzenie udziałów i zarządzanie nimi na potrzeby udostępniania różnicowego.

  3. Dostawca danych udziela adresatowi dostępu do udziału.

    Aby uzyskać szczegółowe informacje, zobacz Zarządzanie dostępem do udziałów danych usługi Delta Sharing (dla dostawców).

  4. Dostawca danych wysyła link aktywacji do odbiorcy za pośrednictwem bezpiecznego kanału wraz z instrukcjami dotyczącymi korzystania z linku aktywacji w celu pobrania pliku poświadczeń, który odbiorca będzie używać do nawiązania bezpiecznego połączenia z dostawcą danych w celu odbierania udostępnionych danych.

    Aby uzyskać szczegółowe informacje, zobacz Krok 2. Uzyskiwanie linku aktywacji.

  5. Odbiorca danych jest zgodny z linkiem aktywacji, aby pobrać plik poświadczeń, a następnie używa pliku poświadczeń do uzyskiwania dostępu do udostępnionych danych.

    Udostępnione dane są dostępne tylko do odczytu. Użytkownicy mogą uzyskiwać dostęp do danych przy użyciu wybranej platformy lub narzędzi.

    Aby uzyskać szczegółowe informacje, zobacz Odczytywanie danych udostępnionych przy użyciu udostępniania otwartego udostępniania różnicowego (dla adresatów).

Zagadnienia dotyczące konfigurowania i zabezpieczeń otwierania udostępniania

Dobre zarządzanie tokenami jest kluczem do bezpiecznego udostępniania danych w przypadku korzystania z modelu otwierania udostępniania:

Dostawcy danych mogą zapewnić dodatkowe zabezpieczenia, przypisując listy dostępu ip w celu ograniczenia dostępu adresata do określonych lokalizacji sieciowych. Zobacz Ograniczanie dostępu adresata do udostępniania różnicowego przy użyciu list dostępu do adresów IP (otwieranie udostępniania).