analýza dat pomocí vyhrazených fondů SQL
v tomto kurzu použijete data NYC taxislužby k prozkoumání možností vyhrazeného fondu SQL.
vytvoření vyhrazeného fondu SQL
- v Synapse studiu v levém podokně vyberte spravovat > fondy SQL pod položkou analytické fondy.
- Vybrat Nový
- jako název vyhrazeného fondu SQL vyberte SQLPOOL1
- Pro úroveň výkonu vyberte DW100C
- Vyberte Zkontrolovat a vytvořit > Vytvořit. vyhrazený fond SQL bude připraven během několika minut.
vyhrazený fond SQL je přidružený k databázi SQL, která se také označuje jako SQLPOOL1.
- Přejděte do > pracovního prostoru data.
- Měla by se zobrazit databáze s názvem SQLPOOL1. Pokud ji nevidíte, klikněte na aktualizovat.
vyhrazený fond SQL spotřebovává fakturovatelné prostředky, pokud jsou aktivní. Fond můžete později pozastavit a snížit tak náklady.
Poznámka
při vytváření nového vyhrazeného fondu SQL (dřív SQL DW) ve vašem pracovním prostoru se otevře vyhrazená stránka pro zřizování fondu SQL. zřizování bude provedeno na logickém serveru SQL.
Načtení dat taxislužby NYC do SQLPOOL1
v Synapse studiu přejděte do centra pro vývoj , kliknutím na + tlačítko přidejte nový prostředek a pak vytvořte nový SQL skript.
vyberte fond SQLPOOL1 (fond vytvořený v kroku 1 tohoto kurzu) v části Připojení k rozevíracímu seznamu nad tímto skriptem.
Zadejte následující kód:
IF NOT EXISTS (SELECT * FROM sys.objects O JOIN sys.schemas S ON O.schema_id = S.schema_id WHERE O.NAME = 'NYCTaxiTripSmall' AND O.TYPE = 'U' AND S.NAME = 'dbo') CREATE TABLE dbo.NYCTaxiTripSmall ( [DateID] int, [MedallionID] int, [HackneyLicenseID] int, [PickupTimeID] int, [DropoffTimeID] int, [PickupGeographyID] int, [DropoffGeographyID] int, [PickupLatitude] float, [PickupLongitude] float, [PickupLatLong] nvarchar(4000), [DropoffLatitude] float, [DropoffLongitude] float, [DropoffLatLong] nvarchar(4000), [PassengerCount] int, [TripDurationSeconds] int, [TripDistanceMiles] float, [PaymentType] nvarchar(4000), [FareAmount] numeric(19,4), [SurchargeAmount] numeric(19,4), [TaxAmount] numeric(19,4), [TipAmount] numeric(19,4), [TollsAmount] numeric(19,4), [TotalAmount] numeric(19,4) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX -- HEAP ) GO COPY INTO dbo.NYCTaxiTripSmall (DateID 1, MedallionID 2, HackneyLicenseID 3, PickupTimeID 4, DropoffTimeID 5, PickupGeographyID 6, DropoffGeographyID 7, PickupLatitude 8, PickupLongitude 9, PickupLatLong 10, DropoffLatitude 11, DropoffLongitude 12, DropoffLatLong 13, PassengerCount 14, TripDurationSeconds 15, TripDistanceMiles 16, PaymentType 17, FareAmount 18, SurchargeAmount 19, TaxAmount 20, TipAmount 21, TollsAmount 22, TotalAmount 23) FROM 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet' WITH ( FILE_TYPE = 'PARQUET' ,MAXERRORS = 0 ,IDENTITY_INSERT = 'OFF' )Kliknutím na tlačítko Spustit spusťte skript.
Tento skript se dokončí za méně než 60 sekund. Načte 2 000 000 řádků taxislužby dat NYC do tabulky s názvem
dbo.NYCTaxiTripSmall.
prozkoumejte data NYC taxislužby ve vyhrazeném fondu SQL.
V synapse studiu přejdete do centra dat .
Přejít na > tabulky SQLPOOL1.
Klikněte pravým tlačítkem na dbo. NYCTaxiTripSmall tabulku a vyberte nový SQL skript > vybrat horní 100 řádků.
počkejte, než se vytvoří nový skript SQL a spustí se.
všimněte si, že v horní části SQL skriptu Připojení se automaticky nastaví do fondu SQL s názvem SQLPOOL1.
nahraďte text SQL skriptu tímto kódem a spusťte ho.
SELECT PassengerCount, SUM(TripDistanceMiles) as SumTripDistance, AVG(TripDistanceMiles) as AvgTripDistance FROM dbo.NYCTaxiTripSmall WHERE TripDistanceMiles > 0 AND PassengerCount > 0 GROUP BY PassengerCount ORDER BY PassengerCount;Tento dotaz ukazuje, jak celková vzdálenost cest a Průměrná doba odezvy se vztahují k počtu cestujících.
v okně SQL výsledek skriptu změňte zobrazení na graf , aby se zobrazila vizualizace výsledků jako spojnicový graf.