NycTlcFhv Classe

Rappresenta il set di dati pubblico nyc Taxi & Lim Commission.

Questo set di dati contiene For-Hire record di viaggio di Vechicle (FHV), che includono i campi che acquisisce il numero di licenza di base di invio e l'ID della posizione della zona di pick-up, ora e taxi (file di forma riportato di seguito). Questi record sono generati dagli invii dei record delle corse FHV effettuati dalle basi. Per altre informazioni su questo set di dati, incluse le descrizioni delle colonne, diversi modi per accedere al set di dati ed esempi, vedere Nyc Taxi & Lim Commission - For-Hire Vehicle (FHV) trip records nel catalogo di Microsoft Azure Open Datasets.

Inizializzare i campi di filtro.

Ereditarietà
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcFhv

Costruttore

NycTlcFhv(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 2, 7, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parametri

start_date
datetime
valore predefinito: 2015-01-01 00:00:00

Data in cui iniziare il caricamento dei dati, inclusi. Se Nessuno, viene utilizzato .default_start_date

end_date
datetime
valore predefinito: 2024-02-07 00:00:00

Data in cui terminare il caricamento dei dati, inclusi. Se Nessuno, viene utilizzato .default_end_date

cols
list[str]
valore predefinito: None

Elenco di nomi di colonne da caricare dal set di dati. Se Nessuno, tutte le colonne vengono caricate. Per informazioni sulle colonne disponibili in questo set di dati, vedere NYC Taxi & Lim Commission - For-Hire Vehicle (FHV).

limit
int
valore predefinito: -1

Valore che indica il numero di giorni di dati da caricare con to_pandas_dataframe(). Se non specificato, il valore predefinito di -1 indica che non è previsto alcun limite per i giorni caricati.

enable_telemetry
bool
valore predefinito: True

Indica se abilitare i dati di telemetria in questo set di dati.

start_date
datetime
Necessario

Data di inizio che si vuole eseguire una query in modo inclusivo.

end_date
datetime
Necessario

Data di fine che si vuole eseguire una query in modo inclusivo.

cols
Optional[List[str]]
Necessario

Elenco di nomi di colonna da recuperare. Nessuno otterrà tutte le colonne.

limit
int
Necessario

to_pandas_dataframe() caricherà solo i mesi di dati "limite". -1 indica che non è presente alcun limite.

enable_telemetry
bool
Necessario

Indica se inviare dati di telemetria.

Commenti

L'esempio seguente illustra come accedere al set di dati.


   from azureml.opendatasets import NycTlcFhv
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()