Příručka pro Delta Lake a Delta Engine
Delta Lake je open source vrstva úložiště, která zajišťuje spolehlivost datových jezer. Delta Lake nabízí transakce ACID a škálovatelné zpracování metadat a sjednocuje streamování a dávkové zpracování dat. Delta Lake funguje nad stávajícím datovým jezerem a je plně kompatibilní s rozhraními Apache Spark API. Delta Lake v Azure Databricks umožňuje konfigurovat Delta Lake na základě vzorů vašich úloh.
Azure Databricks zahrnuje také modul Delta Engine, který poskytuje optimalizovaná rozložení a indexy pro rychlé interaktivní dotazy.
Tato příručka popisuje Delta Lake v Azure Databricks a Delta Engine.
- Úvod
- Rychlé zprovoznění Delta Lake
- Úvodní poznámkové bloky
- Příjem dat do Delta Lake
- Dávkové čtení z tabulek a zápisy do tabulek
- Streamování čtení z tabulek a zápisů do tabulek
- Odstraňování, aktualizace a slučování tabulek
- Příkazy tabulkových nástrojů
- Omezení
- Správa verzí tabulek
- Reference k rozhraní API Delta Lake
- Řízení souběžnosti
- Průvodce migrací
- Osvědčené postupy: rozdílový Lake
- Nejčastější dotazy
- Prostředky služby Delta Lake
- Delta Engine