Synchronizace Apache Sparku pro Azure Synapse definic externích tabulek v bezserverovém fondu SQL

Článek
06/01/2023

Bezserverový fond SQL může automaticky synchronizovat metadata z Apache Sparku. Pro každou databázi existující v bezserverových fondech Apache Sparku se vytvoří bezserverová databáze fondu SQL.

Pro každou externí tabulku Sparku založenou na Parquet nebo CSV a umístěnou ve službě Azure Storage se v bezserverové databázi fondu SQL vytvoří externí tabulka. Proto můžete fondy Sparku vypnout a stále se dotazovat na externí tabulky Sparku z bezserverového fondu SQL.

Když je tabulka ve Sparku rozdělená na oddíly, jsou soubory v úložišti uspořádané podle složek. Bezserverový fond SQL bude používat metadata oddílů a bude pro váš dotaz cílit jenom na relevantní složky a soubory.

Synchronizace metadat se automaticky nakonfiguruje pro každý bezserverový fond Apache Sparku zřízený v pracovním prostoru Azure Synapse. Okamžitě můžete začít dotazovat externí tabulky Sparku.

Každá externí tabulka Spark Parquet nebo CSV umístěná ve službě Azure Storage je reprezentovaná externí tabulkou ve schématu dbo, která odpovídá bezserverové databázi fondu SQL.

V případě dotazů na externí tabulky Sparku spusťte dotaz, který cílí na externí [spark_table]. Před spuštěním následujícího příkladu se ujistěte, že máte správný přístup k účtu úložiště , ve kterém jsou soubory umístěné.

SELECT * FROM [db].dbo.[spark_table]

Mapování datových typů Apache Sparku na datové typy SQL

Další informace o mapování datových typů Apache Sparku na datové typy SQL najdete v tématu tabulky sdílených metadat Azure Synapse Analytics.

Další kroky

Další informace o řízení přístupu k úložišti najdete v článku Access Control úložiště.

Sdílet prostřednictvím

Synchronizace Apache Sparku pro Azure Synapse definic externích tabulek v bezserverovém fondu SQL

Mapování datových typů Apache Sparku na datové typy SQL

Další kroky

Váš názor

Váš názor

Další materiály