NycTlcFhv Classe

Représente le jeu de données public NYC Taxi & Limousine Commission.

Ce jeu de données contient des enregistrements relatifs aux trajets des VTC. Ils comportent des champs incluant le numéro de licence de la base de répartition, la date et l’heure de prise en charge ainsi que l’ID de localisation de la zone des taxis (fichier de forme ci-dessous). Ces enregistrements sont générés à partir des envois de relevés de trajets VTC présentés par bases. Pour plus d’informations sur ce jeu de données, y compris les descriptions des colonnes, les différentes façons d’accéder au jeu de données et des exemples, consultez NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records dans le catalogue Microsoft Azure Open Datasets.

Initialiser les champs de filtrage.

Héritage
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcFhv

Constructeur

NycTlcFhv(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 2, 7, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Paramètres

start_date
datetime
valeur par défaut: 2015-01-01 00:00:00

Date de début (incluse) du chargement des données. Si None est spécifié, default_start_date est utilisé.

end_date
datetime
valeur par défaut: 2024-02-07 00:00:00

Date de fin (incluse) du chargement des données. Si None est spécifié, default_end_date est utilisé.

cols
list[str]
valeur par défaut: None

Liste des noms de colonnes à charger à partir du jeu de données. Si None est spécifié, toutes les colonnes sont chargées. Pour plus d’informations sur les colonnes disponibles dans ce jeu de données, consultez NyC Taxi & Limousine Commission - For-Hire Vehicle (FHV).

limit
int
valeur par défaut: -1

Valeur indiquant le nombre de jours de données à charger avec to_pandas_dataframe(). En l’absence d’indication, la valeur par défaut -1 signifie qu’il n’existe aucune limite au nombre de jours à charger.

enable_telemetry
bool
valeur par défaut: True

Indique s’il est nécessaire d’activer la télémétrie pour ce jeu de données.

start_date
datetime
Obligatoire

Date de début que vous souhaitez interroger de manière inclusive.

end_date
datetime
Obligatoire

Date de fin que vous souhaitez interroger de manière inclusive.

cols
Optional[List[str]]
Obligatoire

Liste des noms de colonnes que vous souhaitez récupérer. La valeur None permet d’obtenir toutes les colonnes.

limit
int
Obligatoire

to_pandas_dataframe() ne charge que des mois de données « limités ». -1 signifie illimité.

enable_telemetry
bool
Obligatoire

Indique s’il est nécessaire d’envoyer des données de télémétrie.

Remarques

L’exemple ci-dessous montre comment accéder au jeu de données.


   from azureml.opendatasets import NycTlcFhv
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()