Sdílet prostřednictvím


Publikování dat z delta živých tabulek do metastoru Hive

Výstupní data kanálu můžete zjistit a zpřístupnit k dotazování publikováním datových sad do metastoru Hive. Pokud chcete publikovat datové sady do metastoru, zadejte název schématu do pole Cíl při vytváření kanálu. Můžete také přidat cílovou databázi do existujícího kanálu.

Ve výchozím nastavení jsou všechny tabulky a zobrazení vytvořené v rozdílových živých tabulkách místní pro kanál. Tabulky musíte publikovat do cílového schématu pro dotazování nebo použít datové sady Delta Live Tables mimo kanál, ve kterém jsou deklarovány.

Pokud chcete publikovat tabulky z kanálů do katalogu Unity, přečtěte si téma Použití katalogu Unity s kanály Delta Live Tables.

Publikování datových sad Delta Live Tables do schématu

Můžete deklarovat cílové schéma pro všechny tabulky v kanálu Delta Live Tables pomocí pole Cílové schéma v nastavení kanálu a vytvořit uživatelská rozhraní kanálu.

Schéma můžete také zadat v konfiguraci JSON nastavením target hodnoty.

Aby kanál publikoval výsledky do cílového schématu, musíte spustit aktualizaci.

Tuto funkci můžete použít s několika konfiguracemi prostředí k publikování do různých schémat na základě prostředí. Můžete například publikovat do schématu dev pro vývoj a prod schéma pro produkční data.

Dotazování datových sad v dynamických tabulkách Delta

Po dokončení aktualizace můžete zobrazit schéma a tabulky, dotazovat se na data nebo použít data v podřízených aplikacích.

Po publikování se tabulky Delta Live Tables dají dotazovat z libovolného prostředí s přístupem k cílovému schématu. To zahrnuje Databricks SQL, poznámkové bloky a další kanály Delta Live Tables.

Důležité

Při vytváření target konfigurace se publikují pouze tabulky a přidružená metadata. Zobrazení se nepublikují do metastoru.

Vyloučení tabulek z cílového schématu

Pokud potřebujete vypočítat zprostředkující tabulky, které nejsou určené pro externí spotřebu, můžete zabránit jejich publikování do schématu pomocí klíčového TEMPORARY slova. Dočasné tabulky stále ukládají a zpracovávají data podle sémantiky Delta Live Tables, ale neměly by být přístupné mimo aktuální kanál. Dočasná tabulka zůstane po celou dobu životnosti kanálu, který ji vytvoří. K deklaraci dočasných tabulek použijte následující syntaxi:

SQL

CREATE TEMPORARY LIVE TABLE temp_table
AS SELECT ... ;

Python

@dlt.table(
  temporary=True)
def temp_table():
  return ("...")