ayrılmış SQL havuzlarıyla verileri analiz etme
bu öğreticide, özel bir SQL havuzunun yeteneklerini araştırmak için nyc taxı verilerini kullanacaksınız.
adanmış bir SQL havuzu oluşturma
- Synapse Studio 'da, sol taraftaki bölmede > analiz havuzları altında SQL havuzlarını yönet ' i seçin.
- Yeni ' yi seçin
- adanmış SQL havuzu adı için SQLPOOL1 seçin
- Performans düzeyi için DW100C seçin
- Gözden geçir ve oluştur > Oluştur'u seçin. adanmış SQL havuzunuz birkaç dakika içinde hazırlanacaktır.
adanmış SQL havuzunuz, SQLPOOL1 olarak da bilinen bir SQL veritabanıyla ilişkilendirilir.
- Veri > çalışma alanına gidin.
- SQLPOOL1 adlı bir veritabanı görmeniz gerekir. Bunu görmüyorsanız Yenile' ye tıklayın.
ayrılmış bir SQL havuzu, etkin olduğu sürece faturalanabilir kaynakları kullanır. Daha sonra maliyetleri azaltmak için havuzu duraklatabilirsiniz.
Not
çalışma alanınızda yeni bir adanmış SQL havuzu (eski adıyla SQL DW) oluştururken, adanmış SQL havuzu sağlama sayfası açılır. sağlama, mantıksal SQL sunucusu üzerinde gerçekleşmeyecektir.
NYC TAXI verilerini SQLPOOL1 'e yükleme
Synapse Studio 'da geliştirme merkezine gidin, + yeni kaynak eklemek için düğmeye tıklayın ve sonra yeni SQL betiği oluşturun.
betiğin üzerinde aşağı açılan listeyi Bağlan için ' SQLPOOL1 ' havuzunu (bu öğreticinin 1. adımında oluşturulan havuz) seçin.
Aşağıdaki kodu girin:
IF NOT EXISTS (SELECT * FROM sys.objects O JOIN sys.schemas S ON O.schema_id = S.schema_id WHERE O.NAME = 'NYCTaxiTripSmall' AND O.TYPE = 'U' AND S.NAME = 'dbo') CREATE TABLE dbo.NYCTaxiTripSmall ( [DateID] int, [MedallionID] int, [HackneyLicenseID] int, [PickupTimeID] int, [DropoffTimeID] int, [PickupGeographyID] int, [DropoffGeographyID] int, [PickupLatitude] float, [PickupLongitude] float, [PickupLatLong] nvarchar(4000), [DropoffLatitude] float, [DropoffLongitude] float, [DropoffLatLong] nvarchar(4000), [PassengerCount] int, [TripDurationSeconds] int, [TripDistanceMiles] float, [PaymentType] nvarchar(4000), [FareAmount] numeric(19,4), [SurchargeAmount] numeric(19,4), [TaxAmount] numeric(19,4), [TipAmount] numeric(19,4), [TollsAmount] numeric(19,4), [TotalAmount] numeric(19,4) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX -- HEAP ) GO COPY INTO dbo.NYCTaxiTripSmall (DateID 1, MedallionID 2, HackneyLicenseID 3, PickupTimeID 4, DropoffTimeID 5, PickupGeographyID 6, DropoffGeographyID 7, PickupLatitude 8, PickupLongitude 9, PickupLatLong 10, DropoffLatitude 11, DropoffLongitude 12, DropoffLatLong 13, PassengerCount 14, TripDurationSeconds 15, TripDistanceMiles 16, PaymentType 17, FareAmount 18, SurchargeAmount 19, TaxAmount 20, TipAmount 21, TollsAmount 22, TotalAmount 23) FROM 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet' WITH ( FILE_TYPE = 'PARQUET' ,MAXERRORS = 0 ,IDENTITY_INSERT = 'OFF' )Betiği yürütmek için Çalıştır düğmesine tıklayın.
Bu betik 60 saniyeden daha az bir süre içinde sona acaktır. NYC TAXI verilerinin 2.000.000 satırlarını adlı bir tabloya yükler
dbo.NYCTaxiTripSmall.
özel SQL havuzundaki nyc taxı verilerini keşfet
SYNAPSE Studio 'da veri merkezine gidin.
SQLPOOL1 > Tables bölümüne gidin.
Dbo öğesine sağ tıklayın . NYCTaxiTripSmall tablo ve yeni SQL betiği seçin > en üstteki 100 satırları seçin.
yeni bir SQL betiği oluşturulup çalışırken bekleyin.
SQL betiğinin en üstünde Bağlan olarak adlandırılan SQL havuzuna otomatik olarak ayarlandığını unutmayın.
SQL betiğin metnini bu kodla değiştirin ve çalıştırın.
SELECT PassengerCount, SUM(TripDistanceMiles) as SumTripDistance, AVG(TripDistanceMiles) as AvgTripDistance FROM dbo.NYCTaxiTripSmall WHERE TripDistanceMiles > 0 AND PassengerCount > 0 GROUP BY PassengerCount ORDER BY PassengerCount;Bu sorgu, toplam seyahat mesafeleri ve ortalama seyahat mesafesinin, pascların sayısıyla ilişkisini gösterir.
SQL betik sonucu penceresinde, sonuçları çizgi grafik olarak görüntülemek için görünümü grafik olarak değiştirin.