NYC Taxi & Commission – zöld taxis utazások rekordjai

A zöld taxis utazások rekordjai az utasfelvétel és -kiadás dátumát és idejét, a felvétel és -kiadás helyét, az út hosszát, a tételes viteldíjakat, a díjszabás típusát, a fizetési módot, valamint a sofőr által bejelentett utasszámot tartalmazzák.

Megjegyzés

A Microsoft Azure Open Datasets "a megfelelő" alapon biztosítja a hozzáférést. A Microsoft nem vállal semmilyen kifejezett vagy hallgatólagos garanciát vagy feltételt az adatkészletek használatára. A Microsoft az Ön helyi törvénye által megengedett mértékig felelősséget vállal az adatkészletek használatának közvetlen, következményes, különleges, közvetett, véletlen vagy költségkisértésből eredő károkért és veszteségekért.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Kötet és megőrzés

Az adatkészlet Parketta formátumban van tárolva. 2018-ban körülbelül 80 millió sort (2 GB) tartalmaz.

Az adatkészlet 2009. és 2018. között összegyűjtött adatokat tartalmaz. Adott időtartomány adatainak beolvasásához az általunk biztosított SDK paraméterbeállításait használhatja.

Tárolási hely

Az adatkészlet tárolási helye a Kelet-USA Azure-régió. Az affinitás érdekében a Kelet-USA régión belüli számítási erőforrások lefoglalását javasoljuk.

További információ

NYC Taxi and Limousine Commission (TLC):

Az adatokat a Taxicab & Livery Passenger Enhancement Programs (TPEP/LPEP) keretében technológiai szolgáltatók szolgáltatták az NYC Taxi and Limousine Commission (TLC) számára. Az utazások adatait nem a TLC hozta létre, amely így nem is vállal felelősséget ezek pontosságáért.

Tekintse meg az adatkészlet eredeti helyét és az eredeti használati feltételeket.

Oszlopok

Name Adattípus Egyedi Értékek (minta) Leírás
doLocationId (doLocationId) sztring 264 74 42 A taxióra kikapcsolásának DOLocationID TLC taxizónája.
dropoffLatitude double 109,721 40.7743034362793 40.77431869506836 2016 júliusától elavult
dropoffLongitude (DropoffLongitude) double 75,502 -73.95272827148438 -73.95274353027344 2016 júliusától elavult
Extra double 202 0.5 1.0 Egyéb pótdíjak. Ez jelenleg csak a 0,50, illetve 1 USD-s csúcsidős és éjszakai díjakat tartalmazza.
fareAmount (fareAmount) double 10,367 6.0 5.5 Az óra által mért díj az idő és a megtett út függvényében.
improvementSurcharge sztring 92 0.3 0 0,30 USD-s pótdíj leintéses utasfelvételnél. A pótdíjat 2015-ben vezették be.
lpepDropoffDatetime időbélyeg 58,100,713 2016-05-22 00:00:00 2016-05-09 00:00:00 Az óra leállításának dátuma és ideje.
lpepPickupDatetime időbélyeg 58,157,349 2013-10-22 12:40:36 2014-08-09 15:54:25 Az óra indításának dátuma és ideje.
mtaTax double 34 0.5 -0.5 Az ár 0,50 USD MTA- (városi közlekedési hatósági) adót tartalmaz, amely a mért díjnak megfelelően automatikusan hozzáadódik az összeghez.
passengerCount (utasszám) int 10 1 2 A járműben tartózkodó utasok száma. Az értéket a sofőr adja meg.
paymentType (fizetési típus) int 5 2 1 Numerikus kód, amely azt jelzi, hogy az utas hogyan fizetett az útért. 1= Hitelkártya 2= Pénz 3= Díjmentes 4= Vitatás 5= Ismeretlen 6= Érvénytelenített utazás
pickupLatitude double 95,110 40.721351623535156 40.721336364746094 2016 júliusától elavult
pickupLongitude double 55,722 -73.84429931640625 -73.84429168701172 2016 júliusától elavult
puLocationId sztring 264 74 41 A taxióra indításának TLC-taxizónája.
puMonth int 12 3 5
puYear int 14 2015 2016
rateCodeID int 7 1 5 Az utazás végén érvényben lévő utolsó díjszabás-azonosító. 1= Standard rate 2= JFK 3= Newark 4= Nassau or Westchester 5= Negotiated fare 6 = Group utazás
storeAndFwdFlag sztring 2 N Y Ez a jelző jelzi, hogy az útrekord a jármű memóriájában volt-e tárolva a szállítónak való küldés előtt, más néven "tárolás és továbbítás", mert a járműnek nem volt kapcsolata a kiszolgálóval. Y = az utazás tárolása és továbbítása N= nem tároló és továbbítási út
tipAmount (tipp: Amount) double 6,206 1.0 2.0 Borravaló összege – Ez a mező automatikusan kitöltésre kerül hitelkártyás borravaló-fizetésnél. A készpénzben fizetett borravalókat nem tartalmazza.
tollsAmount double 2,150 5.54 5.76 Az utazás során fizetett összes úthasználati díj összege.
totalAmount (összeg) double 20,188 7.8 6.8 Az utasok által térítendő teljes összeg. Nem tartalmazza a készpénzben fizetett borravalók összegét.
tripDistance (tripDistance) double 7,060 0.9 1.0 A utazás során megtett távolság mérföldben a taxióra adatai alapján.
tripType (tripType) int 3 1 2 Kód amely azt jelzi, hogy az utazás utcai leintés volt-e, vagy kiosztott, amelyet a rendszer automatikusan rendel hozzá a taxióra által alkalmazott díj alapján, de amelyet a sofőr megváltoztathat. 1 = Street-hail 2= Dispatch
vendorID (szállítóazonosító) int 2 2 1 A rekordot szolgáltató LPEP-szolgáltató kódja. 1= Creative Mobile Technologies, LLC; 2 = VeriFone Inc.

Előnézet

vendorID (szállítóazonosító) lpepPickupDatetime lpepDropoffDatetime passengerCount (utasszám) tripDistance (tripDistance) puLocationId doLocationId (doLocationId) rateCodeID storeAndFwdFlag paymentType (fizetési típus) fareAmount (fareAmount) Extra mtaTax improvementSurcharge tipAmount (tipp: Amount) tollsAmount totalAmount (összeg) tripType (tripType) puYear puMonth
2 2081.06.24., 17:40:37 2081.06.24., 18:42:47 1 16.95 93 117 1 N 1 52 1 0,5 0.3 0 2.16 55.96 1 2081 6
2 2030.11.28., 12:19:29 2030.11.28., 12:25:37 1 1.08 42 247 1 N 2 6.5 0 0,5 0.3 0 0 7.3 1 2030 11
2 2030.11.28., 12:14:50 2030.11.28., 12:14:54 1 0.03 42 42 5 N 2 5 0 0 0 0 0 5 2 2030 11
2 2020.11.14., 11:38:07 2020.11.14., 11:42:22 1 0.63 129 129 1 N 2 4,5 1 0,5 0.3 0 0 6.3 1 2020 11
2 2020.11.14., 9:55:36 2020.11.14., 10:04:54 1 3,8 82 138 1 N 2 12.5 1 0,5 0.3 0 0 14,3 1 2020 11
2 2019.08.26., 16:18:37 2019.08.26., 16:19:35 1 0 264 264 1 N 2 1 0 0,5 0.3 0 0 1.8 1 2019 8
2 2019.07.1., 8:28:33 2019.07.1. 8:32:33 1 0.71 7 7 1 N 1 5 0 0,5 0.3 1.74 0 7.54 1 2019 7
2 2019.07.1., 12:04:53 2019.07.1., 12:21:56 1 2.71 223 145 1 N 2 13 0,5 0,5 0.3 0 0 14,3 1 2019 7
2 2019.07.1., 12:04:11 2019.07.1., 12:21:15 1 3.14 166 142 1 N 2 14,5 0,5 0,5 0.3 0 0 18.55 1 2019 7
2 2019.07.1., 12:03:37 2019.07.1., 12:09:27 1 0,78 74 74 1 N 1 6 0,5 0,5 0.3 1.46 0 8.76 1 2019 7

Az adatok elérése

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()

nyc_tlc_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://docs.microsoft.com/en-us/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

display(nyc_tlc_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

# Display top 5 rows
display(nyc_tlc_df.limit(5))

# Display data statistic information
display(nyc_tlc_df, summary = True)

Következő lépések

Tekintse meg a katalógusban található többi Open Datasets.