Analýza dat s využitím bezserverového fondu SQL

V tomto kurzu se naučíte analyzovat data pomocí bezserverového fondu SQL.

Integrovaný bezserverový fond SQL

Bezserverové fondy SQL umožňují používat SQL bez nutnosti rezervovat kapacitu. Fakturace bezserverového fondu SQL je založená na množství dat zpracovaných při spuštění dotazu, a ne na počtu uzlů použitých ke spuštění dotazu.

Každý pracovní prostor má předem nakonfigurovaný bezserverový fond SQL s názvem Integrovaný.

Analýza dat newyordické taxislužby pomocí bezserverového fondu SQL

  1. V Synapse Studio přejděte do centra Vývoj.

  2. Vytvořte nový skript SQL.

  3. Do skriptu vložte následující kód.

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Vyberte Run (Spustit).

Zkoumání dat je jen zjednodušený scénář, ve kterém můžete porozumět základním charakteristikám dat. Další informace o zkoumání a analýze dat najdete v tomto kurzu.

Vytvoření databáze pro zkoumání dat

Obsah souborů můžete procházet přímo prostřednictvím master databáze. U některých jednoduchých scénářů zkoumání dat nemusíte vytvářet samostatnou databázi. Při dalším zkoumání dat ale můžete chtít vytvořit některé objekty nástrojů, například:

  • Externí zdroje dat, které představují pojmenované odkazy pro účty úložiště.
  • Přihlašovací údaje v oboru databáze, které umožňují určit způsob ověřování u externího zdroje dat.
  • Uživatelé databáze s oprávněními pro přístup k některým zdrojům dat nebo databázovým objektům
  • Zobrazení nástrojů, procedury a funkce, které můžete použít v dotazech.
  1. master Databázi použijte k vytvoření samostatné databáze pro vlastní databázové objekty. Vlastní databázové objekty nelze v master databázi vytvořit.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Důležité

    Pomocí kolace s _UTF8 příponou zajistěte, aby byl text UTF-8 správně převeden na VARCHAR sloupce. Latin1_General_100_BIN2_UTF8 poskytuje nejlepší výkon v dotazech, které čtou data ze souborů Parquet a kontejnerů Azure Cosmos DB. Další informace o změně kolací najdete v tématu Typy kolace podporované pro Synapse SQL.

  2. Pomocí následujícího příkazu přepněte kontext databáze z master na DataExplorationDB . K přepnutí aktuální databáze můžete použít také ovládací prvek uživatelského rozhraní s použitím databáze :

    USE DataExplorationDB
    
  3. V DataExplorationDBnástroji vytvořte objekty nástrojů, jako jsou přihlašovací údaje a zdroje dat.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Poznámka

    Externí zdroj dat je možné vytvořit bez přihlašovacích údajů. Pokud přihlašovací údaje neexistují, použije se pro přístup k externímu zdroji dat identita volajícího.

  4. Volitelně můžete nově vytvořenou DataExplorationDB databázi použít k vytvoření přihlášení pro uživatele, DataExplorationDB který bude přistupovat k externím datům:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Dále v souboru vytvořte uživatele DataExplorationDB databáze pro výše uvedené přihlášení a udělte ADMINISTER DATABASE BULK OPERATIONS mu oprávnění.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  5. Prozkoumejte obsah souboru pomocí relativní cesty a zdroje dat:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    
  6. Publikujte změny do pracovního prostoru.

Databáze pro zkoumání dat je jednoduchý zástupný symbol, do kterého můžete ukládat objekty nástrojů. Fond Synapse SQL umožňuje mnohem více a vytvořit logickou Data Warehouse – relační vrstvu postavenou na zdrojích dat Azure. Další informace o vytvoření logického datového skladu najdete v tomto kurzu.

Další kroky