TimeIndexFeaturizer Kelas

Kelas transformasi untuk fitur komputasi (kebanyakan kategoris).

Kelas ini dimaksudkan untuk digunakan sebagai langkah fiturisasi di dalam alur prakiraan.

Transformasi ini mengembalikan TimeSeriesDataSet baru dengan semua kolom asli, ditambah tambahan 18 kolom dengan fitur berbasis tanggalwaktu. Fitur berikut akan dibuat:

  • tahun - tahun kalender
  • year_iso - tahun ISO, lihat detailnya nanti
  • paruh - paruh tahun, 1 jika tanggal sebelum 1 Juli, 2 jika sebaliknya
  • kuartal - kuartal kalender, 1 hingga 4
  • bulan - bulan kalender, 1 hingga 12
  • month_lbl - bulan kalender sebagai string, 'Januari' hingga 'Desember'
  • hari - hari kalender dalam sebulan, 1 hingga 31
  • jam - jam dalam sehari, 0 hingga 23
  • menit - menit sehari, 0 sampai 59
  • detik - detik sehari, 0 hingga 59
  • am_pm - 0 jika jam sebelum tengah hari (12:00), 1 jika sebaliknya
  • am_pm_lbl - 'am' jika jam sebelum tengah hari (12:00), 'pm' jika sebaliknya
  • hour12 - jam sehari dengan sistem 12 jam, tanpa pembagi AM/PM
  • wday - hari dalam seminggu, 0 (Senin) hingga 6 (Minggu)
  • wday_lbl - hari dalam seminggu sebagai string
  • qday - hari kuartal, 1 sampai 92
  • yday - hari dalam setahun, 1 hingga 366
  • minggu - minggu ISO, lihat di bawah untuk detailnya

Tahun dan minggu ISO didefinisikan dalam ISO 8601, lihat Wikipedia.ISO untuk detailnya. Singkatnya, minggu ISO selalu dimulai pada hari Senin dan berlangsung selama 7 hari. Tahun ISO dimulai pada minggu pertama tahun yang memiliki hari Kamis. Hal ini berarti jika 1 Januari jatuh pada hari Jumat, tahun ISO hanya akan dimulai pada 4 Januari. Dengan demikian, tahun ISO bisa jadi berbeda dari tahun kalender.

Warisan
TimeIndexFeaturizer

Konstruktor

TimeIndexFeaturizer(overwrite_columns=False, prune_features=True, correlation_cutoff=0.99, country_or_region=None, force_feature_list=None, freq=None, datetime_columns=None, holiday_start_time=None, holiday_end_time=None)

Parameter

overwrite_columns
bool
nilai default: False

Bendera yang memungkinkan transformasi untuk menimpa kolom yang ada di input TimeSeriesDataSet untuk fitur yang sudah ada di dalamnya. Jika True, cetak kolom peringatan dan timpa. Jika False, buat RuntimeError. Default ke False untuk melindungi data pengguna. Daftar lengkap kolom yang akan dibuat disimpan dalam atribut time_index_feature_names_full.

prune_features
bool
nilai default: True

Bendera yang memanggil metode untuk memangkas fitur yang jelas tidak berguna. Strategi pemangkasan berikut digunakan:

  1. Membuang semua fitur 'string', seperti month_lbl.

  2. Jika input indeks waktu TimeSeriesDataSet hanya memiliki tanggal, dan

    tidak ada komponen waktu, semua fitur jam/menit/dll dihapus.

  3. Setiap fitur dengan varians nol di dalamnya dihapus.

  4. Terakhir, matriks korelasi dibangun untuk semua sisa

    fitur. Dari setiap pasangan yang nilai absolutnya dari korelasi silang di seluruh fitur melebihi correlation_cutoff, salah satu fitur akan dibuang. Contohnya adalah kuartal tahun dan bulan tahun untuk data deret waktu triwulanan - kedua fitur ini berkorelasi sempurna.

correlation_cutoff
float
nilai default: 0.99

Jika prune_features adalah True, fitur yang memiliki abs(correlation) dari correlation_cutoff atau lebih tinggi akan dibuang. Misalnya, untuk deret waktu triwulanan, baik kuartal tahun maupun bulan dapat dibangun, tetapi mereka akan berkorelasi sempurna. Hanya satu dari fitur-fitur ini yang akan dipertahankan. Perhatikan bahwa correlation_cutoff harus antara 0 dan 1, tanda-tanda korelasi dibuang. Korelasi dengan target tidak dihitung untuk menghindari overfitting dan kebocoran target. Nilai default adalah 0,99, yang mempertahankan sebagian besar fitur, nilai yang lebih rendah akan memangkas fitur lebih agresif.

force_feature_list
list
nilai default: None

Daftar fitur indeks waktu yang akan dibuat. Harus merupakan bagian dari daftar fitur lengkap. Jika force_feature_list ditentukan, pengaturan prune_features dan correlation_cutoff diabaikan.

force_feature_list
nilai default: None
freq
nilai default: None
datetime_columns
nilai default: None
holiday_start_time
nilai default: None
holiday_end_time
nilai default: None

Metode

fit

Sesuaikan dengan transformasi.

Tentukan fitur mana, jika ada, yang harus dipangkas.

fit_transform

Terapkan metode fit dan transform secara berurutan.

Tentukan fitur mana, jika ada, yang harus dipangkas.

get_params

Dapatkan parameter untuk penghitung ini.

preview_datetime_column_featured_names

Dapatkan nama fitur waktu yang dihasilkan pada kolom tanggalwaktu lain (bukan indeks waktu).

preview_non_holiday_feature_names

Dapatkan nama fitur waktu non-Holiday yang akan dibuat jika transformasi diterapkan ke X.

preview_time_feature_names

Dapatkan nama fitur waktu yang akan dibuat jika transformasi diterapkan ke X.

transform

Buat fitur indeks waktu untuk bingkai data input.

fit

Sesuaikan dengan transformasi.

Tentukan fitur mana, jika ada, yang harus dipangkas.

fit(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime.featurizer.transformer.timeseries.time_index_featurizer.TimeIndexFeaturizer

Parameter

X
<xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Diperlukan

Data input

y
Diperlukan

Diteruskan ke sklearn transformator fit

Mengembalikan

Transformasi yang dipasang

Tipe hasil

fit_transform

Terapkan metode fit dan transform secara berurutan.

Tentukan fitur mana, jika ada, yang harus dipangkas.

fit_transform(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet, y: Optional[numpy.ndarray] = None) -> azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet

Parameter

X
<xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Diperlukan

Data input

y
Diperlukan

Diteruskan ke sklearn transformator fit

Mengembalikan

Bingkai data dengan fitur indeks waktu

Tipe hasil

<xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>

get_params

Dapatkan parameter untuk penghitung ini.

get_params(deep=True)

Parameter

deep
bool, <xref:default=True>
nilai default: True

Jika True, akan menampilkan parameter untuk penghitung ini dan berisi sub-objek yang merupakan penghitung.

Mengembalikan

params – Nama parameter dipetakan ke nilainya.

Tipe hasil

<xref:<xref:mapping of string to any>>

Dapatkan nama fitur waktu yang dihasilkan pada kolom tanggalwaktu lain (bukan indeks waktu).

preview_datetime_column_featured_names() -> List[str]

Mengembalikan

nama fitur waktu

Tipe hasil

preview_non_holiday_feature_names

Dapatkan nama fitur waktu non-Holiday yang akan dibuat jika transformasi diterapkan ke X.

preview_non_holiday_feature_names(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet) -> List[str]

Parameter

X
<xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Diperlukan

Data input

Mengembalikan

nama fitur waktu

Tipe hasil

preview_time_feature_names

Dapatkan nama fitur waktu yang akan dibuat jika transformasi diterapkan ke X.

preview_time_feature_names(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet) -> List[str]

Parameter

X
<xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Diperlukan

Data input

Mengembalikan

nama fitur waktu

Tipe hasil

transform

Buat fitur indeks waktu untuk bingkai data input.

transform(X: azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet) -> azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet

Parameter

X
<xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>
Diperlukan

Data input

Mengembalikan

Bingkai data dengan fitur indeks waktu

Tipe hasil

<xref:azureml.automl.runtime._time_series_data_set.TimeSeriesDataSet>

Atribut

FEATURE_COLUMN_NAMES

Kumpulan kolom fitur baru lengkap yang dapat dibuat oleh transformasi ini.

correlation_cutoff

Lihat parameter correlation_cutoff.

feature_name_mapper

force_feature_list

Daftar eksplisit kolom fitur yang harus dibuat, terlepas dari pengaturan pemangkasan.

holiday_column_name

overwrite_columns

Lihat parameter overwrite_columns.

paid_timeoff_column_name

prune_features

Lihat parameter prune_features.

time_index_feature_names_full