Delta-megosztás

A következőkre vonatkozik:jelölje be az igennel jelölt jelölőnégyzetet Databricks SQL jelölje be az igennel jelölt jelölőnégyzetet Databricks Runtime 10.4 LTS és a Unity Catalog felett csak jelölje be az igennel jelölt jelölőnégyzetet

A Delta Sharing egy nyílt protokoll a más szervezetekkel való adatmegosztáshoz, függetlenül attól, hogy melyik számítási platformot használják. A Unity Catalog metaadattárában lévő táblázatgyűjteményeket valós időben oszthatja meg másolás nélkül, így az adat címzettjei azonnal megkezdhetik a közös adatok legújabb verziójának használatát.

A Delta Sharing három összetevőből áll:

  • Szolgáltatók

    A szolgáltató olyan entitás, amely adatokat tett elérhetővé megosztásra.

  • Részvények

    A megosztás logikai csoportosítást határoz meg a megosztani kívánt táblákhoz.

  • Címzettek

    A címzett azonosítja azt a szervezetet, amellyel bármilyen számú megosztást meg szeretne osztani.

A Delta Sharing használatának részletes útmutatója: Adatok és AI-eszközök biztonságos megosztása a Delta Sharing használatával.

Szolgáltatók

A következőkre vonatkozik:jelölje be az igennel jelölt jelölőnégyzetet Databricks SQL jelölje be az igennel jelölt jelölőnégyzetet Databricks Runtime 11.3 LTS és újabb

Az adatszolgáltató egy olyan objektum, amely az adatokat megosztó szervezetet képviseli a valós világban. A szolgáltató olyan megosztásokat tartalmaz, amelyek tovább tartalmazzák a megosztott adatokat. Miután egy szolgáltató felvette Önt címzettként,

  • A szolgáltató helyi nevének testreszabása az ALTER PROVIDER használatával.
  • Listázhatja azOkat az adatkészleteket, amelyek megosztottak Önnel a SHOW SHARES IN PROVIDER szolgáltatással.
  • Hozzon létre egy katalógust a CREATE CATALOG szolgáltatással önnek fontos megosztások használatával.

Példák

-- Change the data provider name locally.
> ALTER PROVIDER `Center for Disease Control` RENAME TO cdc;

-- List the shares the provider has granted you access too.
> SHOW SHARES IN PROVIDER cdc;
 vaccinedata

-- Make the share accessible locally as a catalog.
> CREATE CATALOG cdcdata USING cdc.vaccinedata;

-- Use the data.
> USE CATALOG cdcdata;
> SELECT COUNT(*) FROM information_schema.tables;
  10

Megosztások

A megosztás a CREATE SHARE paranccsal példányosított tároló. A létrehozás után iteratív módon regisztrálhatja a metaadattárban definiált meglévő táblák gyűjteményét az ALTER SHARE paranccsal. A táblákat az eredeti nevük alatt regisztrálhatja, az eredeti sémájuk szerint minősítheti, vagy alternatív közzétett neveket adhat meg.

A megosztások létrehozásához, módosításához és elvetéséhez metaadattár-rendszergazdának vagy fiókadminisztrátornak kell lennie.

Példák

-- Create share `customer_share` only if share with same name doesn't exist, with a comment.
> CREATE SHARE IF NOT EXISTS customer_share COMMENT 'This is customer share';

-- Add 2 tables to the share.
-- Expose my_schema.tab1 a different name.
-- Expose only two partitions of other_schema.tab2
> ALTER SHARE customer_share ADD TABLE my_schema.tab1 AS their_schema.tab1;
> ALTER SHARE customer_share ADD TABLE other_schema.tab2 PARTITION (c1 = 5), (c1 = 7);

-- List the content of the share
> SHOW ALL IN SHARE customer_share;
  name              type  shared_object           added_at                     added_by                   comment partitions
  ----------------- ----  ---------------------- ---------------------------- -------------------------- ------- -----------------
  other_schema.tab2 TABLE main.other_schema.tab2 2022-01-01T00:00:01.000+0000 alwaysworks@databricks.com NULL
  their_schema.tab1 TABLE main.myschema.tab2     2022-01-01T00:00:00.000+0000 alwaysworks@databricks.com NULL   (c1 = 5), (c1 = 7)

Címzettek

A címzett egy olyan objektum, amelyet a CREATE RECIPIENT használatával hoz létre, és amely egy olyan szervezetet jelöl, amelyet engedélyezni szeretne a hozzáférési megosztások számára. Amikor létrehoz egy címzett Databricks SQL-t, létrehoz egy aktiválási hivatkozást, amit elküldhet a szervezetnek. Az aktiválási hivatkozás lekéréséhez a létrehozás után a DESCRIBE RECIPIENT parancsot kell használnia.

Miután létrehozott egy címzettet, a GRANT ON SHARE használatával jogosultságokat adhat neki SELECT az Ön által választott megosztásokra.

A címzettek létrehozásához, a címzettek elvetéséhez és a megosztásokhoz való hozzáférés biztosításához metaadattár-rendszergazdának kell lennie.

Példák

-- Create a recipient.
> CREATE RECIPIENT IF NOT EXISTS other_org COMMENT 'other.org';

-- Retrieve the activation link to send to other.org
> DESCRIBE RECIPIENT other_org;
  name      created_at                   created_by                 comment   activation_link active_token_id                      active_token_expiration_time rotated_token_id rotated_token_expiration_time
  --------- ---------------------------- -------------------------- --------- --------------- ------------------------------------ ---------------------------- ---------------- -----------------------------
  other_org 2022-01-01T00:00:00.000+0000 alwaysworks@databricks.com other.org https://....    0160c81f-5262-40bb-9b03-3ee12e6d98d7 9999-12-31T23:59:59.999+0000 NULL              NULL

-- Choose shares that other.org has access to
> GRANT SELECT ON SHARE customer_share TO RECIPIENT other_org;