Analýza dat s využitím bezserverového fondu SQL
V tomto kurzu se naučíte analyzovat data pomocí bezserverového fondu SQL.
Integrovaný bezserverový fond SQL
Bezserverové fondy SQL umožňují používat SQL bez nutnosti rezervovat kapacitu. Fakturace bezserverového fondu SQL je založená na množství dat zpracovaných při spuštění dotazu, a ne na počtu uzlů použitých ke spuštění dotazu.
Každý pracovní prostor má předem nakonfigurovaný bezserverový fond SQL s názvem Integrovaný.
Analýza dat newyordické taxislužby pomocí bezserverového fondu SQL
Poznámka
Ujistěte se, že jste ukázková data umístili do primárního účtu úložiště.
V Synapse Studio přejděte do centra Vývoj.
Vytvořte nový skript SQL.
Do skriptu vložte následující kód.
SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]
Vyberte Run (Spustit).
Zkoumání dat je jen zjednodušený scénář, ve kterém můžete porozumět základním charakteristikám dat. Další informace o zkoumání a analýze dat najdete v tomto kurzu.
Vytvoření databáze pro zkoumání dat
Obsah souborů můžete procházet přímo prostřednictvím master
databáze. U některých jednoduchých scénářů zkoumání dat nemusíte vytvářet samostatnou databázi.
Při dalším zkoumání dat ale můžete chtít vytvořit některé objekty nástrojů, například:
- Externí zdroje dat, které představují pojmenované odkazy pro účty úložiště.
- Přihlašovací údaje v oboru databáze, které umožňují určit způsob ověřování u externího zdroje dat.
- Uživatelé databáze s oprávněními pro přístup k některým zdrojům dat nebo databázovým objektům
- Zobrazení nástrojů, procedury a funkce, které můžete použít v dotazech.
master
Databázi použijte k vytvoření samostatné databáze pro vlastní databázové objekty. Vlastní databázové objekty nelze vmaster
databázi vytvořit.CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8
Důležité
Pomocí kolace s
_UTF8
příponou zajistěte, aby byl text UTF-8 správně převeden naVARCHAR
sloupce.Latin1_General_100_BIN2_UTF8
poskytuje nejlepší výkon v dotazech, které čtou data ze souborů Parquet a kontejnerů Azure Cosmos DB. Další informace o změně kolací najdete v tématu Typy kolace podporované pro Synapse SQL.Pomocí následujícího příkazu přepněte kontext databáze z
master
naDataExplorationDB
. K přepnutí aktuální databáze můžete použít také ovládací prvek uživatelského rozhraní s použitím databáze :USE DataExplorationDB
V
DataExplorationDB
nástroji vytvořte objekty nástrojů, jako jsou přihlašovací údaje a zdroje dat.CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
Poznámka
Externí zdroj dat je možné vytvořit bez přihlašovacích údajů. Pokud přihlašovací údaje neexistují, použije se pro přístup k externímu zdroji dat identita volajícího.
Volitelně můžete nově vytvořenou
DataExplorationDB
databázi použít k vytvoření přihlášení pro uživatele,DataExplorationDB
který bude přistupovat k externím datům:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
Dále v souboru vytvořte uživatele
DataExplorationDB
databáze pro výše uvedené přihlášení a udělteADMINISTER DATABASE BULK OPERATIONS
mu oprávnění.CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GO
Prozkoumejte obsah souboru pomocí relativní cesty a zdroje dat:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
Publikujte změny do pracovního prostoru.
Databáze pro zkoumání dat je jednoduchý zástupný symbol, do kterého můžete ukládat objekty nástrojů. Fond Synapse SQL umožňuje mnohem více a vytvořit logickou Data Warehouse – relační vrstvu postavenou na zdrojích dat Azure. Další informace o vytvoření logického datového skladu najdete v tomto kurzu.