Analisar dados com o pool de SQL sem servidor no Azure Synapse AnalyticsAnalyze data with serverless SQL pool in Azure Synapse Analytics

Neste tutorial, você aprenderá a analisar dados com o pool de SQL sem servidor usando dados localizados em bancos de dados do Spark.In this tutorial, you'll learn how to analyze data with serverless SQL pool using data located in Spark databases.

Analisar dados de táxis de Nova York no armazenamento de blobs usando o pool de SQL sem servidorAnalyze NYC Taxi data in blob storage using serverless SQL pool

  1. No hub Dados em Vinculado, clique com o botão direito do mouse em Armazenamento de Blobs do Azure > Conjuntos de Dados de Exemplo > nyc_tlc_yellow e selecione SELECIONAR AS 100 PRIMEIRAS LINHASIn the Data hub under Linked, right-click on Azure Blob Storage > Sample Datasets > nyc_tlc_yellow and select SELECT TOP 100 rows

  2. Isso criará um script SQL com o seguinte código:This will create a new SQL script with the following code:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK     'https://azureopendatastorage.blob.core.windows.net/nyctlc/yellow/puYear=*/puMonth=*/*.parquet',
            FORMAT = 'parquet'
        ) AS [result];
    
  3. Clique em ExecutarClick Run

Analisar dados de táxi de NYC em bancos de dados do Spark usando o pool de SQL sem servidorAnalyze NYC Taxi data in Spark databases using serverless SQL pool

As tabelas em bancos de dados do Spark são automaticamente visíveis e podem ser consultadas pelo pool de SQL sem servidor.Tables in Spark databases are automatically visible, and they can be queried by serverless SQL pool.

  1. No Synapse Studio, acesse o hub Desenvolver e crie um script de SQL.In Synapse Studio, go to the Develop hub and create a new SQL script.

  2. Defina Conectar-se ao como pool de SQL sem servidor.Set Connect to to serverless SQL pool.

  3. Cole o texto a seguir no script e execute-o.Paste the following text into the script and run the script.

    SELECT *
    FROM nyctaxi.dbo.passengercountstats
    

    Observação

    Na primeira vez que você executar uma consulta que usa o pool de SQL sem servidor, levará cerca de dez segundos para que o pool de SQL sem servidor reúna os recursos de SQL necessários para executar suas consultas.The first time you run a query that uses serverless SQL pool, it takes about 10 seconds for serverless SQL pool to gather the SQL resources needed to run your queries. As consultas subsequentes serão muito mais rápidas.Subsequent queries will be much faster.

Próximas etapasNext steps