TimeIndexFeaturizer Kelas
Kelas transformasi untuk fitur komputasi (kebanyakan kategoris).
Kelas ini dimaksudkan untuk digunakan sebagai langkah fiturisasi di dalam alur prakiraan.
Transformasi ini mengembalikan TimeSeriesDataSet baru dengan semua kolom asli, ditambah tambahan 18 kolom dengan fitur berbasis tanggalwaktu. Fitur berikut akan dibuat:
- tahun - tahun kalender
- year_iso - tahun ISO, lihat detailnya nanti
- paruh - paruh tahun, 1 jika tanggal sebelum 1 Juli, 2 jika sebaliknya
- kuartal - kuartal kalender, 1 hingga 4
- bulan - bulan kalender, 1 hingga 12
- month_lbl - bulan kalender sebagai string, 'Januari' hingga 'Desember'
- hari - hari kalender dalam sebulan, 1 hingga 31
- jam - jam dalam sehari, 0 hingga 23
- menit - menit sehari, 0 sampai 59
- detik - detik sehari, 0 hingga 59
- am_pm - 0 jika jam sebelum tengah hari (12:00), 1 jika sebaliknya
- am_pm_lbl - 'am' jika jam sebelum tengah hari (12:00), 'pm' jika sebaliknya
- hour12 - jam sehari dengan sistem 12 jam, tanpa pembagi AM/PM
- wday - hari dalam seminggu, 0 (Senin) hingga 6 (Minggu)
- wday_lbl - hari dalam seminggu sebagai string
- qday - hari kuartal, 1 sampai 92
- yday - hari dalam setahun, 1 hingga 366
- minggu - minggu ISO, lihat di bawah untuk detailnya
Tahun dan minggu ISO didefinisikan dalam ISO 8601, lihat Wikipedia.ISO untuk detailnya. Singkatnya, minggu ISO selalu dimulai pada hari Senin dan berlangsung selama 7 hari. Tahun ISO dimulai pada minggu pertama tahun yang memiliki hari Kamis. Hal ini berarti jika 1 Januari jatuh pada hari Jumat, tahun ISO hanya akan dimulai pada 4 Januari. Dengan demikian, tahun ISO bisa jadi berbeda dari tahun kalender.
- Warisan
-
TimeIndexFeaturizer
Konstruktor
TimeIndexFeaturizer(overwrite_columns=False, prune_features=True, correlation_cutoff=0.99, country_or_region=None, force_feature_list=None, freq=None, datetime_columns=None, holiday_start_time=None, holiday_end_time=None)
Parameter
- overwrite_columns
- bool
Bendera yang memungkinkan transformasi untuk menimpa kolom yang ada di input TimeSeriesDataSet untuk fitur yang sudah ada di dalamnya. Jika True, cetak kolom peringatan dan timpa. Jika False, buat RuntimeError. Default ke False untuk melindungi data pengguna. Daftar lengkap kolom yang akan dibuat disimpan dalam atribut time_index_feature_names_full.
- prune_features
- bool
Bendera yang memanggil metode untuk memangkas fitur yang jelas tidak berguna. Strategi pemangkasan berikut digunakan:
Membuang semua fitur 'string', seperti
month_lbl.Jika input indeks waktu TimeSeriesDataSet hanya memiliki tanggal, dan
tidak ada komponen waktu, semua fitur jam/menit/dll dihapus.
Setiap fitur dengan varians nol di dalamnya dihapus.
Terakhir, matriks korelasi dibangun untuk semua sisa
fitur. Dari setiap pasangan yang nilai absolutnya dari korelasi silang di seluruh fitur melebihi
correlation_cutoff, salah satu fitur akan dibuang. Contohnya adalah kuartal tahun dan bulan tahun untuk data deret waktu triwulanan - kedua fitur ini berkorelasi sempurna.
- correlation_cutoff
- float
Jika prune_features adalah True, fitur yang memiliki abs(correlation) dari correlation_cutoff atau lebih tinggi akan dibuang. Misalnya, untuk deret waktu triwulanan, baik kuartal tahun maupun bulan dapat dibangun, tetapi mereka akan berkorelasi sempurna. Hanya satu dari fitur-fitur ini yang akan dipertahankan.
Perhatikan bahwa correlation_cutoff harus antara 0 dan 1, tanda-tanda korelasi dibuang. Korelasi dengan target tidak dihitung untuk menghindari overfitting dan kebocoran target. Nilai default adalah 0,99, yang mempertahankan sebagian besar fitur, nilai yang lebih rendah akan memangkas fitur lebih agresif.
- force_feature_list
- list
Daftar fitur indeks waktu yang akan dibuat. Harus merupakan bagian dari daftar fitur lengkap. Jika force_feature_list ditentukan, pengaturan prune_features dan correlation_cutoff diabaikan.
- force_feature_list
- freq
- datetime_columns
- holiday_start_time
- holiday_end_time
Metode
| fit |
Sesuaikan dengan transformasi. Tentukan fitur mana, jika ada, yang harus dipangkas. |
| fit_transform |
Terapkan metode fit dan transform secara berurutan. Tentukan fitur mana, jika ada, yang harus dipangkas. |
| get_params |
Dapatkan parameter untuk penghitung ini. |
| preview_datetime_column_featured_names |
Dapatkan nama fitur waktu yang dihasilkan pada kolom tanggalwaktu lain (bukan indeks waktu). |
| preview_non_holiday_feature_names |
Dapatkan nama fitur waktu non-Holiday yang akan dibuat jika transformasi diterapkan ke X. |
| preview_time_feature_names |
Dapatkan nama fitur waktu yang akan dibuat jika transformasi diterapkan ke X. |
| transform |
Buat fitur indeks waktu untuk bingkai data input. |
fit
Sesuaikan dengan transformasi.
Tentukan fitur mana, jika ada, yang harus dipangkas.
fit(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime.featurizer.transformer.timeseries.time_index_featurizer.TimeIndexFeaturizer
Parameter
- X
- <xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Data input
- y
Diteruskan ke sklearn transformator fit
Mengembalikan
Transformasi yang dipasang
Tipe hasil
fit_transform
Terapkan metode fit dan transform secara berurutan.
Tentukan fitur mana, jika ada, yang harus dipangkas.
fit_transform(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet
Parameter
- X
- <xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Data input
- y
Diteruskan ke sklearn transformator fit
Mengembalikan
Bingkai data dengan fitur indeks waktu
Tipe hasil
get_params
Dapatkan parameter untuk penghitung ini.
get_params(deep=True)
Parameter
- deep
- bool, <xref:default=True>
Jika True, akan menampilkan parameter untuk penghitung ini dan berisi sub-objek yang merupakan penghitung.
Mengembalikan
params – Nama parameter dipetakan ke nilainya.
Tipe hasil
preview_datetime_column_featured_names
Dapatkan nama fitur waktu yang dihasilkan pada kolom tanggalwaktu lain (bukan indeks waktu).
preview_datetime_column_featured_names() -> List[str]
Mengembalikan
nama fitur waktu
Tipe hasil
preview_non_holiday_feature_names
Dapatkan nama fitur waktu non-Holiday yang akan dibuat jika transformasi diterapkan ke X.
preview_non_holiday_feature_names(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet) -> List[str]
Parameter
- X
- <xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Data input
Mengembalikan
nama fitur waktu
Tipe hasil
preview_time_feature_names
Dapatkan nama fitur waktu yang akan dibuat jika transformasi diterapkan ke X.
preview_time_feature_names(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet) -> List[str]
Parameter
- X
- <xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Data input
Mengembalikan
nama fitur waktu
Tipe hasil
transform
Buat fitur indeks waktu untuk bingkai data input.
transform(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet) -> azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet
Parameter
- X
- <xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Data input
Mengembalikan
Bingkai data dengan fitur indeks waktu
Tipe hasil
Atribut
FEATURE_COLUMN_NAMES
Kumpulan kolom fitur baru lengkap yang dapat dibuat oleh transformasi ini.
correlation_cutoff
Lihat parameter correlation_cutoff.
feature_name_mapper
force_feature_list
Daftar eksplisit kolom fitur yang harus dibuat, terlepas dari pengaturan pemangkasan.
holiday_column_name
overwrite_columns
Lihat parameter overwrite_columns.
paid_timeoff_column_name
prune_features
Lihat parameter prune_features.
time_index_feature_names_full
Saran dan Komentar
Kirim dan lihat umpan balik untuk