analýza dat pomocí SQLho fondu bez serveru

v tomto kurzu se naučíte analyzovat data pomocí SQLho fondu bez serveru.

integrovaný fond SQL bez serveru

fondy SQL serverů vám umožňují používat SQL bez nutnosti rezervovat kapacitu. faktura za SQL fond bez serveru je založena na množství zpracovaných dat pro spuštění dotazu, nikoli na počtu uzlů použitých ke spuštění dotazu.

každý pracovní prostor obsahuje předem konfigurovaný SQL fond bez serveru s názvem integrovaný.

analýza dat NYC taxislužby pomocí SQLho fondu bez serveru

  1. V synapse studiu přejdete do centra pro vývoj .

  2. vytvořte nový skript SQL.

  3. Do skriptu vložte následující kód.

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Klikněte na Spustit.

Zkoumání dat je jenom zjednodušený scénář, kde můžete pochopit základní charakteristiky vašich dat. Přečtěte si další informace o zkoumání a analýze dat v tomto kurzu.

Vytvořit databázi průzkumu dat

Obsah souborů můžete procházet přímo prostřednictvím master databáze. U některých jednoduchých scénářů pro zkoumání dat nemusíte vytvářet samostatnou databázi. Po pokračování průzkumu dat však můžete chtít vytvořit některé objekty nástrojů, například:

  • Externí zdroje dat, které reprezentují pojmenované odkazy pro účty úložiště.
  • Přihlašovací údaje v oboru databáze, které umožňují určit způsob ověřování pro externí zdroj dat.
  • Uživatelé databáze s oprávněními pro přístup k některým zdrojům dat nebo databázovým objektům.
  • Zobrazení nástrojů, procedury a funkce, které můžete použít v dotazech.
  1. Databázi použijte master k vytvoření samostatné databáze pro vlastní databázové objekty. Vlastní databázové objekty nelze v master databázi vytvořit.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Důležité

    Pomocí kolace s _UTF8 příponou zajistěte, aby byl text UTF-8 správně převeden na VARCHAR sloupce. Latin1_General_100_BIN2_UTF8 poskytuje nejlepší výkon v dotazech, které čtou data ze souborů Parquet a kontejnerů Cosmos DB.

  2. Přepněte na DataExplorationDB místo, kde můžete vytvářet pomocné objekty, jako jsou například přihlašovací údaje a zdroje dat.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Poznámka

    Externí zdroj dat lze vytvořit bez pověření. Pokud přihlašovací údaje neexistují, použije se k přístupu k externímu zdroji dat Identita volajícího.

  3. Volitelně můžete pomocí hlavní databáze vytvořit přihlašovací jméno uživatele v DataExplorationDB , který bude mít přístup k externím datům:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Pak vytvořte uživatele databáze v nástroji DataExplorationDB pro přihlášení a udělte mu ADMINISTER DATABASE BULK OPERATIONS oprávnění.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  4. Prozkoumejte obsah souboru pomocí relativní cesty a zdroje dat:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    

Databáze zkoumání dat je pouze jednoduchý zástupný symbol, kam můžete ukládat objekty nástrojů. Synapse SQL fond vám umožní dělat mnohem víc a vytvářet logické datové sklady – relační vrstvu postavenou nad zdroji dat Azure. Přečtěte si další informace o vytváření logických datových skladů v tomto kurzu.

Další kroky