Share via


NycTlcGreen 類別

代表 NYC 計程車 & Limousine Commission 綠色計程車車程公用數據集。

綠色計程車車程記錄包括各種欄位:用以擷取上車和下車日期/時間、上車和下車地點、車程距離、列舉車資、費率類型、付款類型和司機回報的乘客數。 如需此數據集的詳細資訊,包括數據行描述、存取數據集的不同方式,以及範例,請參閱 NYC 計程車 & Limousine Commission - Microsoft Azure 開放數據集目錄中的綠色計程車車程記錄。

如需使用 NycTlcGreen 類別的範例,請參閱 教學課程使用自動化機器學習來預測計程車車資

初始化篩選欄位。

繼承
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

建構函式

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 5, 1, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

參數

名稱 Description
start_date

開始載入資料的日期,包含。 如果為 None,則會 default_start_date 使用 。

預設值: 2015-01-01 00:00:00
end_date

結束載入資料的日期,包含。 如果為 None,則會 default_end_date 使用 。

預設值: 2024-05-01 00:00:00
cols

要從數據集載入的數據列名稱清單。 如果為 None,則會載入所有數據行。 如需此數據集中可用數據行的資訊,請參閱 NYC Taxi & Limousine Commission - 綠色計程車車程記錄

預設值: None
limit
int

值,表示使用 載入 to_pandas_dataframe()的數據天數。 如果未指定,預設值為 -1 表示載入天數沒有限制。

預設值: -1
enable_telemetry

是否要在此數據集上啟用遙測。

預設值: True
start_date
必要

您想要以包容性方式查詢的開始日期。

end_date
必要

您想要以包容性方式查詢的結束日期。

cols
必要

您想要擷取的數據行名稱清單。 無會取得所有數據行。

limit
必要
int

to_pandas_dataframe () 只會載入「限制」的數據月份。 -1 表示沒有限制。

enable_telemetry
必要

指出是否要傳送遙測。

備註

下列範例示範如何存取數據集。


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()