Analisar dados com pools de SQL dedicadosAnalyze data with dedicated SQL pools

O Azure Synapse Analytics fornece a capacidade de analisar dados com o pool de SQL dedicado.Azure Synapse Analytics provides you with the capability to analyze data with a dedicated SQL pool. Neste tutorial, você usará os dados de táxis de Nova York para explorar as funcionalidades do pool de SQL dedicado.In this tutorial, you'll use the NYC Taxi data to explore a dedicated SQL pool's capabilities.

Carregar os dados de Táxi de Nova York no SQLPOOL1Load the NYC Taxi Data into SQLPOOL1

  1. No Synapse Studio, navegue até o hub Desenvolver e crie um script de SQLIn Synapse Studio, navigate to the Develop hub and then create new SQL script
  2. Selecione o pool 'SQLPOOL1' (pool criado na ETAPA 1 deste tutorial) na seção 'Conectar-se a' do script.Select the pool 'SQLPOOL1' (pool created in STEP 1 of this tutorial) in 'Connect to' section of the script.
  3. Insira o seguinte código:Enter the following code:
    CREATE TABLE [dbo].[Trip]
    (
        [DateID] int NOT NULL,
        [MedallionID] int NOT NULL,
        [HackneyLicenseID] int NOT NULL,
        [PickupTimeID] int NOT NULL,
        [DropoffTimeID] int NOT NULL,
        [PickupGeographyID] int NULL,
        [DropoffGeographyID] int NULL,
        [PickupLatitude] float NULL,
        [PickupLongitude] float NULL,
        [PickupLatLong] varchar(50) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,
        [DropoffLatitude] float NULL,
        [DropoffLongitude] float NULL,
        [DropoffLatLong] varchar(50) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,
        [PassengerCount] int NULL,
        [TripDurationSeconds] int NULL,
        [TripDistanceMiles] float NULL,
        [PaymentType] varchar(50) COLLATE SQL_Latin1_General_CP1_CI_AS NULL,
        [FareAmount] money NULL,
        [SurchargeAmount] money NULL,
        [TaxAmount] money NULL,
        [TipAmount] money NULL,
        [TollsAmount] money NULL,
        [TotalAmount] money NULL
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    );
    
    COPY INTO [dbo].[Trip]
    FROM 'https://nytaxiblob.blob.core.windows.net/2013/Trip2013/QID6392_20171107_05910_0.txt.gz'
    WITH
    (
        FILE_TYPE = 'CSV',
        FIELDTERMINATOR = '|',
        FIELDQUOTE = '',
        ROWTERMINATOR='0X0A',
        COMPRESSION = 'GZIP'
    )
    OPTION (LABEL = 'COPY : Load [dbo].[Trip] - Taxi dataset');
    
  4. Esse script será concluído em cerca de 60 segundos.This script will finish in around 60 seconds. Ele carrega 2 milhões linhas de dados de Táxi de Nova York em uma tabela chamada dbo.TripIt loads 2 million rows of NYC Taxi data into a table called dbo.Trip

Explorar os dados de táxis de Nova York no pool de SQL dedicadoExplore the NYC Taxi data in the dedicated SQL pool

  1. No Synapse Studio, acesse o hub Dados.In Synapse Studio, go to the Data hub.

  2. Acesse SQLPOOL1 > Tabelas.Go to SQLPOOL1 > Tables. Você verá várias tabelas carregadas.You'll see several tables loaded.

  3. Clique com o botão direito do mouse na tabela dbo.Trip e selecione Novo Script de SQL > Selecionar as Primeiras 100 Linhas.Right-click the dbo.Trip table and select New SQL Script > Select TOP 100 Rows.

  4. Aguarde enquanto um novo script SQL é criado e executado.Wait while a new SQL script is created and runs.

  5. Observe na parte superior do script de SQL que Conectar-se ao é automaticamente definido como o pool de SQL chamado SQLPOOL1.Notice that at the top of the SQL script Connect to is automatically set to the SQL pool called SQLPOOL1.

  6. Substitua o texto do script de SQL por esse código e execute-o.Replace the text of the SQL script with this code and run it.

    SELECT PassengerCount,
          SUM(TripDistanceMiles) as SumTripDistance,
          AVG(TripDistanceMiles) as AvgTripDistance
    FROM  dbo.Trip
    WHERE TripDistanceMiles > 0 AND PassengerCount > 0
    GROUP BY PassengerCount
    ORDER BY PassengerCount
    

    Essa consulta mostra como as distâncias totais de viagem e a distância média da viagem estão relacionadas ao número de passageiros.This query shows how the total trip distances and average trip distance relate to the number of passengers.

  7. Na janela de resultados do script de SQL, altere a opção Exibição para Gráfico para uma visualização dos resultados como um gráfico de linhas.In the SQL script result window, change the View to Chart to see a visualization of the results as a line chart.

    Observação

    Um pool de SQL dedicado habilitado para workspace (antigo SQL DW) pode ser identificado por meio da dica de ferramenta no hub de dados.A workspace enabled dedicated SQL pool (formerly SQL DW) can be identified via the tool tip in the Data hub.

Próximas etapasNext steps