Gegevens analyseren met een serverloze SQL groep

In deze zelfstudie leert u hoe u gegevens kunt analyseren met serverloze SQL pool.

De ingebouwde serverloze SQL-pool

Met serverloze SQL kunt u SQL gebruiken zonder dat u capaciteit moet reserveren. Facturering voor een serverloze SQL is gebaseerd op de hoeveelheid gegevens die wordt verwerkt om de query uit te voeren en niet het aantal knooppunten dat wordt gebruikt om de query uit te voeren.

Elke werkruimte wordt geleverd met een vooraf geconfigureerde serverloze SQL met de naam Ingebouwde.

NYC Taxi-gegevens analyseren met een serverloze SQL pool

  1. Ga Synapse Studio naar de hub Ontwikkelen

  2. Maak een nieuw SQL script.

  3. Plak de volgende code in het script.

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Klik op Run.

Gegevensverkenning is slechts een vereenvoudigd scenario waarin u de basiskenmerken van uw gegevens begrijpt. Meer informatie over gegevensverkenning en -analyse in deze zelfstudie.

Database voor gegevensverkenning maken

U kunt rechtstreeks via de database door de inhoud van de bestanden master bladeren. Voor sommige eenvoudige scenario's voor gegevensverkenning hoeft u geen afzonderlijke database te maken. Als u echter doorgaat met het verkennen van gegevens, kunt u enkele hulpprogrammaobjecten maken, zoals:

  • Externe gegevensbronnen die de benoemde verwijzingen voor opslagaccounts vertegenwoordigen.
  • Referenties binnen databasebereik waarmee u kunt opgeven hoe u moet verifiëren bij een externe gegevensbron.
  • Databasegebruikers met de machtigingen voor toegang tot sommige gegevensbronnen of databaseobjecten.
  • Weergaven, procedures en functies van het hulpprogramma die u in de query's kunt gebruiken.
  1. Gebruik de master database om een afzonderlijke database voor aangepaste databaseobjecten te maken. Aangepaste databaseobjecten kunnen niet worden gemaakt in de master database.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Belangrijk

    Gebruik een collatie met _UTF8 achtervoegsel om ervoor te zorgen dat UTF-8-tekst correct wordt geconverteerd naar VARCHAR kolommen. Latin1_General_100_BIN2_UTF8 biedt de beste prestaties in de query's die gegevens lezen uit Parquet-bestanden en Cosmos Db-containers.

  2. Schakel over DataExplorationDB naar waar u hulpprogrammaobjecten kunt maken, zoals referenties en gegevensbronnen.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Notitie

    Een externe gegevensbron kan worden gemaakt zonder een referentie. Als er geen referentie bestaat, wordt de identiteit van de aanroeper gebruikt voor toegang tot de externe gegevensbron.

  3. U kunt eventueel de hoofddatabase gebruiken om een aanmelding te maken voor een gebruiker in DataExplorationDB die toegang heeft tot externe gegevens:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Maak vervolgens een databasegebruiker in DataExplorationDB voor de aanmelding en verleen de ADMINISTER DATABASE BULK OPERATIONS machtiging.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  4. Verken de inhoud van het bestand met behulp van het relatieve pad en de gegevensbron:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    

Gegevensverkenningsdatabase is slechts een eenvoudige tijdelijke aanduiding waar u uw hulpprogrammaobjecten kunt opslaan. Met Synapse SQL-pool kunt u veel meer doen en een logische Data Warehouse maken: een relationele laag die is gebouwd op Azure-gegevensbronnen. Meer informatie over het bouwen van logische Data Warehouse in deze zelfstudie.

Volgende stappen