Analysera data med dedikerade SQL pooler

I den här självstudien använder du nyc-taxidata för att utforska SQL en dedikerad pool.

Skapa en dedikerad SQL pool

  1. I Synapse Studio fönstret till vänster väljer du Hantera SQL > under Analytics-pooler .
  2. Välj Ny
  3. För Namn på SQL dedikerad serverpool väljer du SQLPOOL1
  4. För Prestandanivå väljer du DW100C
  5. Välj Granska + skapa > Skapa. Din dedikerade SQL-pool är klar på några minuter.

Din dedikerade SQL-pool är associerad SQL en databas som även kallas SQLPOOL1.

  1. Gå till Dataarbetsyta. >
  2. Du bör se en databas med namnet SQLPOOL1. Om du inte ser det klickar du på Uppdatera.

En dedikerad SQL-pool förbrukar fakturerbara resurser så länge den är aktiv. Du kan pausa poolen senare för att minska kostnaderna.

Anteckning

När du skapar en SQL dedikerad pool (tidigare SQL DW) på din arbetsyta öppnas den dedikerade SQL-poolens etableringssida. Etablering sker på den logiska SQL servern.

Läsa in NYC-taxidata i SQLPOOL1

  1. I Synapse Studio du till hubben Utveckla, klickar på knappen för att lägga till en ny resurs och + skapar sedan ett nytt SQL skript.

  2. Välj poolen "SQLPOOL1" (pool som skapades i STEG 1 i den här självstudien) i Anslut att listrutan ovanför skriptet.

  3. Ange följande kod:

    IF NOT EXISTS (SELECT * FROM sys.objects O JOIN sys.schemas S ON O.schema_id = S.schema_id WHERE O.NAME = 'NYCTaxiTripSmall' AND O.TYPE = 'U' AND S.NAME = 'dbo')
    CREATE TABLE dbo.NYCTaxiTripSmall
        (
         [DateID] int,
         [MedallionID] int,
         [HackneyLicenseID] int,
         [PickupTimeID] int,
         [DropoffTimeID] int,
         [PickupGeographyID] int,
         [DropoffGeographyID] int,
         [PickupLatitude] float,
         [PickupLongitude] float,
         [PickupLatLong] nvarchar(4000),
         [DropoffLatitude] float,
         [DropoffLongitude] float,
         [DropoffLatLong] nvarchar(4000),
         [PassengerCount] int,
         [TripDurationSeconds] int,
         [TripDistanceMiles] float,
         [PaymentType] nvarchar(4000),
         [FareAmount] numeric(19,4),
         [SurchargeAmount] numeric(19,4),
         [TaxAmount] numeric(19,4),
         [TipAmount] numeric(19,4),
         [TollsAmount] numeric(19,4),
         [TotalAmount] numeric(19,4)
        )
    WITH
        (
        DISTRIBUTION = ROUND_ROBIN,
         CLUSTERED COLUMNSTORE INDEX
         -- HEAP
        )
    GO
    
    COPY INTO dbo.NYCTaxiTripSmall
    (DateID 1, MedallionID 2, HackneyLicenseID 3, PickupTimeID 4, DropoffTimeID 5,
    PickupGeographyID 6, DropoffGeographyID 7, PickupLatitude 8, PickupLongitude 9, 
    PickupLatLong 10, DropoffLatitude 11, DropoffLongitude 12, DropoffLatLong 13, 
    PassengerCount 14, TripDurationSeconds 15, TripDistanceMiles 16, PaymentType 17, 
    FareAmount 18, SurchargeAmount 19, TaxAmount 20, TipAmount 21, TollsAmount 22, 
    TotalAmount 23)
    FROM 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet'
    WITH
    (
        FILE_TYPE = 'PARQUET'
        ,MAXERRORS = 0
        ,IDENTITY_INSERT = 'OFF'
    )
    
  4. Klicka på knappen Kör för att köra skriptet.

  5. Det här skriptet slutförs på mindre än 60 sekunder. Den läser in 2 miljoner rader med data från taxibilar i en tabell med namnet dbo.NYCTaxiTripSmall .

Utforska nyc-taxidata i den dedikerade SQL poolen

  1. I Synapse Studio du till datahubben.

  2. Gå till SQLPOOL1-tabeller > .

  3. Högerklicka på dbo. NYCTripSmall-tabellen och välj Nytt SQL Skript Välj DE > 100 översta raderna.

  4. Vänta medan ett nytt SQL-skript skapas och körs.

  5. Observera att längst upp i SQL-Anslut automatiskt anges till den SQL poolen SQLPOOL1.

  6. Ersätt texten i SQL med den här koden och kör den.

    SELECT PassengerCount,
          SUM(TripDistanceMiles) as SumTripDistance,
          AVG(TripDistanceMiles) as AvgTripDistance
    FROM  dbo.NYCTaxiTripSmall
    WHERE TripDistanceMiles > 0 AND PassengerCount > 0
    GROUP BY PassengerCount
    ORDER BY PassengerCount;
    

    Den här frågan visar hur det totala reseavståndet och det genomsnittliga reseavståndet relaterar till antalet passagerare.

  7. I fönstret SQL för skript ändrar du Visa till Diagram för att se en visualisering av resultatet som ett linjediagram.

Nästa steg