NYC TAXI & Limousine Komisyonu-yeşil TAXI seyahat kayıtları

Yeşil taksi yolculuk kayıtları, yolcu alma ve bırakma tarihlerini/saatlerini, yolcu alma ve bırakma konumlarını, yolculuk mesafelerini, listeli tarifeleri, fiyat türlerini, ödeme türlerini ve sürücü tarafından bildirilen yolcu sayılarını yakalayan alanları içerir.

Not

Microsoft, Azure Açık Veri Kümeleri "olduğu gibi" temel alan bir hizmet sağlar. Microsoft, veri kümelerini kullanımınıza yönelik açık veya zımni garantiler veya koşullar vermez. Microsoft, yerel yasalarınız kapsamında izin verilen ölçüde, veri kümelerini kullanımınız sonucunda ortaya çıkan doğrudan, sonuçsal, özel, dolaylı, arızi veya ceza da dahil olmak üzere tüm zararlar veya kayıplar için tüm sorumluluğu kabulmektedir.

Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.

Birim ve bekletme

Bu veri kümesi Parquet biçiminde depolanır. Toplam 2018 itibariyle 80 milyon satır (2 GB) vardır.

Bu veri kümesi 2009 ile 2018 arasında birikmiş geçmiş kayıtları içermektedir. Belirli bir zaman aralığı içindeki verileri getirmek için SDK’mızdaki parametre ayarlarını kullanabilirsiniz.

Depolama konumu

Bu veri kümesi Doğu ABD Azure bölgesinde depolanır. Benzeşim için Doğu ABD’deki işlem kaynaklarının ayrılması önerilir.

Ek bilgiler

NYC Taksi ve Limuzin Komisyonu (TLC):

Veriler Taksi ve Kiralık Taksi Yolcu Geliştirme Programları (TPEP/LPEP) kapsamında yetkilendirilmiş teknoloji sağlayıcıları tarafından toplanıp NYC Taksi ve Limuzin Komisyonu’na (TLC) sunulmuştur. Yolculuk veirleri TLC tarafından oluşturulmamıştır ve TLC bu verilerin doğruluğu hakkında bir taahhütte bulunmaz.

Özgün veri kümesi konumunu ve özgün kullanım koşullarınıgörüntüleyin.

Sütunlar

Name Veri türü Benzersiz Değerler (örnek) Açıklama
Dolocationıd string 264 74 42 Taksimetrenin devre dışı olduğu DOLocationID TLC Taksi Bölgesi.
Açılan Enlem double 109.721 40.7743034362793 40.77431869506836 2016.07’den itibaren kullanım dışı bırakıldı
Açılan Boylam double 75.502 -73.95272827148438 -73.95274353027344 2016.07’den itibaren kullanım dışı bırakıldı
ına double 202 0,5 1,0 Çeşitli ekstralar ve ek ücretler. Şu anda buna yalnızca 0,50 ABD doları ve 1 ABD doları yoğun saat ve gecelik ücretler dahildir.
fareAmount double 10.367 6,0 5,5 Ölçüm cihazı tarafından hesaplanan saat-mesafe tarifesi.
improvementSurcharge string 92 0,3 0 Bayrak indirildiği zaman çağrılan yolculuklarda değerlendirilen 0,30 ABD doları iyileştirme ek ücreti. İyileştirme ek ücreti 2015 yılında toplanmaya başlamıştır.
lpepDropoffDatetime timestamp 58.100.713 2016-05-22 00:00:00 2016-05-09 00:00:00 Ölçümün devre dışı olduğu tarih ve saat.
lpepPickupDatetime timestamp 58.157.349 2013-10-22 12:40:36 2014-08-09 15:54:25 Ölçümün devreye girdiği tarih ve saat.
Mtavergisi double 34 0,5-0,5 Kullanımdaki tarifeli fiyata göre otomatik olarak tetiklenen 0,50 ABD doları MTA vergisi.
passengerCount int 10 1 2 Araçtaki yolcu sayısı. Bu değer sürücü tarafından girilir.
paymentType int 5 2 1 Yolcunun seyahat ücretini nasıl ödediğini belirten sayısal kod. 1 = kredi kartı 2 = nakit 3 = ücretsiz 4 = Itiraz 5 = bilinmeyen 6 = hükümsüz seyahat
Pickupenlem double 95.110 40.721351623535156 40.721336364746094 2016.07’den itibaren kullanım dışı bırakıldı
Pickupboylam double 55.722 -73.84429931640625 -73.84429168701172 2016.07’den itibaren kullanım dışı bırakıldı
Pulocationıd string 264 74 41 Taksimetrenin devreye girdiği TLC Taksi Bölgesi.
puMonth int 12 3 5
puYear int 14 2015 2016
rateCodeID int 7 1 5 Yolculuğun sonunda geçerli olan son fiyat kodu. 1= Standart ücret 2= JFK 3= Newark 4= Nassau veya Westchester 5= Anlaşmalı ücret 6= Grup yolculuğu
storeAndFwdFlag string 2 N Y Bu bayrak, aracın sunucuyla bağlantısı olmadığı için yolculuk kaydının satıcıya göndermeden önce araç belleğinde tutularak tutulıp tutulmayacak olduğunu belirtir. Y= mağaza ve iletme yolculuğu N= mağaza ve seyahat değil
tipAmount double 6,206 1.0 2.0 Bahşiş tutarı – Kredi kartı bahşişleri için bu alan otomatik olarak doldurulur. Nakit bahşişler dahil değildir.
tollsAmount double 2,150 5.54 5.76 Yolculukta ödenen tüm ücretlerin toplam tutarı.
totalAmount double 20,188 7.8 6.8 Yolculardan alınan toplam ücret. Nakit bahşişler dahil değildir.
tripDistance double 7,060 0.9 1.0 Taksimetrenin mil cinsinden bildirdiği geçen yolculuk mesafesi.
tripType int 3 1 2 Yolculuğun sokaktan çevirme veya kullanımdaki tarifeli fiyata göre otomatik olarak atanan ancak sürücü tarafından değiştirilebilen bir gönderme olduğunu gösteren kod. 1= Sokak-selamlama 2= Gönderme
Vendorıd int 2 2 1 Kaydı oluşturan LPEP sağlayıcısını gösteren kod. 1= Creative Mobile Technologies, LLC; 2= VeriFone Inc.

Önizleme

Vendorıd lpepPickupDatetime lpepDropoffDatetime yolcu Say tripDistance puLocationId doLocationId rateCodeID storeAndFwdFlag paymentType fareAmount Ekstra mtaTax improvementSurcharge tipAmount tollsAmount totalAmount tripType puYear puMonth
2 24.06.2081 17:40:37 24.06.2081 18:42:47 1 16.95 93 117 1 N 1 52 1 0,5 0.3 0 2.16 55.96 1 2081 6
2 28.11.2030 12:19:29 28.11.2030 12:25:37 1 1.08 42 247 1 N 2 6.5 0 0,5 0.3 0 0 7.3 1 2030 11
2 28.11.2030 12:14:50 28.11.2030 12:14:54 1 0.03 42 42 5 N 2 5 0 0 0 0 0 5 2 2030 11
2 14.11.2020 11:38:07 14.11.2020 11:42:22 1 0.63 129 129 1 N 2 4,5 1 0,5 0.3 0 0 6.3 1 2020 11
2 14.11.2020 09:55:36 14.11.2020 10:04:54 1 3.8 82 138 1 N 2 12,5 1 0,5 0.3 0 0 14.3 1 2020 11
2 26.08.2019 16:18:37 26.08.2019 16:19:35 1 0 264 264 1 N 2 1 0 0,5 0.3 0 0 1.8 1 2019 8
2 01.07.2019 08:28:33 01.07.2019 08:32:33 1 0.71 7 7 1 N 1 5 0 0,5 0.3 1.74 0 7.54 1 2019 7
2 01.07.2019 12:04:53 01.07.2019 12:21:56 1 2.71 223 145 1 N 2 13 0,5 0,5 0.3 0 0 14.3 1 2019 7
2 01.07.2019 12:04:11 01.07.2019 12:21:15 1 3.14 166 142 1 N 2 14.5 0,5 0,5 0.3 0 0 18.55 1 2019 7
2 01.07.2019 12:03:37 01.07.2019 12:09:27 1 0,78 74 74 1 N 1 6 0,5 0,5 0.3 1.46 0 8.76 1 2019 7

Veri erişimi

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()

nyc_tlc_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://docs.microsoft.com/en-us/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

display(nyc_tlc_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

# Display top 5 rows
display(nyc_tlc_df.limit(5))

# Display data statistic information
display(nyc_tlc_df, summary = True)

Sonraki adımlar

Açık Veri Kümeleri kataloğunda veri kümelerinin geri kalanını görüntüleme.