Share via


ForecastingSettings Osztály

AutoML-feladat előrejelzési beállításai.

Öröklődés
azure.ai.ml.entities._mixins.RestTranslatableMixin
ForecastingSettings

Konstruktor

ForecastingSettings(*, country_or_region_for_holidays: str | None = None, cv_step_size: int | None = None, forecast_horizon: str | int | None = None, target_lags: str | int | List[int] | None = None, target_rolling_window_size: str | int | None = None, frequency: str | None = None, feature_lags: str | None = None, seasonality: str | int | None = None, use_stl: str | None = None, short_series_handling_config: str | None = None, target_aggregate_function: str | None = None, time_column_name: str | None = None, time_series_id_column_names: str | List[str] | None = None, features_unknown_at_forecast_time: str | List[str] | None = None)

Paraméterek

Name Description
country_or_region_for_holidays
Kötelező

A nyaralási szolgáltatások létrehozásához használt ország/régió. Ezeknek iso 3166 kétbetűs ország-/régiókódnak kell lenniük, például "US" vagy "GB".

cv_step_size
Kötelező

Az egyik cv-hajtás origin_time és a következő hajtás közötti időszakok száma. Ha például n_step = 3 a napi adatok esetében, az egyes hajtások forrásideje három nap különbséget tesz.

forecast_horizon
Kötelező

A kívánt maximális előrejelzési horizont az idősor gyakoriságának egységeiben. Az alapértelmezett érték az 1.

Az egységek a betanítási adatok időintervallumán alapulnak, például havonta, hetente, amelyet az előrejelzőnek előre kell jeleznie. A tevékenységtípus előrejelzése esetén erre a paraméterre van szükség. Az előrejelzési paraméterek beállításával kapcsolatos további információkért lásd: Idősoros előrejelzési modell automatikus betanítása.

target_lags
Kötelező

A céloszloptól eltúlzott időszakok száma. Alapértelmezés szerint a késések ki vannak kapcsolva.

Az előrejelzés során ez a paraméter az adatok gyakorisága alapján a célértékek késleltetéséhez használt sorok számát jelöli. Ez listaként vagy egész számként jelenik meg. Késést kell használni, ha a független változók és a függő változók közötti kapcsolat alapértelmezés szerint nem egyezik vagy korrelál. Ha például egy termék iránti keresletet próbál előrejelezni, a kereslet bármely hónapban függhet az adott áruk 3 hónappal korábbi árától. Ebben a példában érdemes lehet 3 hónappal negatívan eltolni a célt (keresletet), hogy a modell betanítást használjon a megfelelő kapcsolatra. További információ: Idősoros előrejelzési modell automatikus betanítása.

Jegyezze fel a célelmaradások és a gördülő ablak méretének automatikus észlelését. Tekintse meg a megfelelő megjegyzéseket a görgetőablak szakaszában. A következő algoritmus használatával észleljük az optimális célelmaradást és a gördülő ablakméretet.

  1. Becsülje meg a visszatekintés funkció kiválasztásának maximális késési sorrendjét. Esetünkben ez az időszakok száma a következő dátumig gyakorisági részletesség, azaz ha a gyakoriság napi, akkor egy hét (7), ha egy hét, akkor hónap lesz (4). Ez a kettővel szorzott értékek a késések/gördülő ablakok legnagyobb lehetséges értékei. Példáinkban a maximális késési sorrendet 14 és 8 között fogjuk figyelembe venni.

  2. Trendek és reziduális összetevők hozzáadásával hozzon létre egy szezonalitás-ellenes sorozatot. Ezt a következő lépésben fogjuk használni.

  3. Becsülje meg a PACF – Részleges automatikus korreláció függvényt a (2) adatokon, és keressen olyan pontokat, ahol az automatikus korreláció jelentős, azaz abszolút értéke több, mint 1,96/square_root (maximális késési érték), amely 95%-os pontosságnak felel meg.

  4. Ha minden pont jelentős, erős szezonalitásnak tekintjük, és nem hozunk létre visszatekintési funkciókat.

  5. A PACF-értékeket az elejétől vizsgáljuk, és az első jelentéktelen automatikus korreláció előtti érték jelöli a késést. Ha az első jelentős elemet (az érték önmagával korrelál) jelentéktelen követi, a késés 0 lesz, és nem használunk visszatekintő funkciókat.

target_rolling_window_size
Kötelező

A céloszlop gördülőablak-átlagának létrehozásához használt elmúlt időszakok száma.

Előrejelzéskor ez a paraméter n előzményidőszakot jelöl az előrejelzett értékek létrehozásához, <= betanítási csoport mérete. Ha nincs megadva, n a betanítási csoport teljes mérete. Adja meg ezt a paramétert, ha csak egy bizonyos mennyiségű előzményt szeretne figyelembe venni a modell betanításakor. Ha az "automatikus" értékre van állítva, a rendszer az utolsó értékként becsüli meg a görgetőablakot, ahol a PACF nagyobb, mint a pontossági küszöbérték. Részletekért tekintse meg target_lags szakaszt.

frequency
Kötelező

Előrejelzés gyakorisága.

Előrejelzéskor ez a paraméter azt az időszakot jelöli, amellyel az előrejelzést kívánja, például napi, heti, éves stb. Az előrejelzés gyakorisága alapértelmezés szerint az adathalmaz gyakorisága. Igény szerint nagyobb (de nem kisebb) értékre állíthatja, mint az adathalmaz gyakorisága. Összesítjük az adatokat, és előrejelzési gyakorisággal generáljuk az eredményeket. A napi adatok esetében például beállíthatja, hogy a gyakoriság napi, heti vagy havi legyen, de ne óránként. A gyakoriságnak pandas offset aliasnak kell lennie. További információért tekintse meg a pandas dokumentációját: https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects

feature_lags
Kötelező

Az "auto" vagy a None típusú numerikus funkciók késéseinek generálására szolgáló jelző.

seasonality
Kötelező

Állítsa be az idősor szezonalitását a sorozat gyakoriságának egész számának többszöröseként. Ha a szezonalitás "automatikus" értékre van állítva, a rendszer levonja a következtetést. Ha a Nincs értékre van állítva, akkor az idősor nem szezonális, ami egyenértékű a szezonalitás=1 értékkel.

use_stl
Kötelező

Konfigurálja az idősor céloszlopának STL-felbontását. use_stl három értéket vehet fel: Nincs (alapértelmezett) – nincs stl felbontás, "szezon" – csak szezonösszetevőt és season_trend hoz létre, és szezon- és trendösszetevőket is létrehoz.

short_series_handling_config
Kötelező

A paraméter határozza meg, hogy az AutoML hogyan kezelje a rövid idősorokat.

Lehetséges értékek: "auto" (alapértelmezett), "pad", "drop" és None.

  • az automatikus rövid sorozat ki lesz párnázott, ha nincsenek hosszú sorozatok, ellenkező esetben a rövid sorozatok el lesznek dobva.
  • pad az összes rövid sorozat lesz párnázott.
  • az összes rövid sorozat elvetése".
  • A rövid sorozat nem lesz módosítva. Ha a "pad" értékre van állítva, a tábla a regresszorok nulláival és üres értékeivel, a célhoz pedig véletlenszerű értékekkel lesz kipárnázott, és az adott idősor-azonosító célértékének középértéke. Ha a medián nullával egyenlő vagy nagyobb, a minimális kipárnázott érték nullával lesz kivágva. Bemenet:

Date

numeric_value

sztring

Cél

2020-01-01

23

zöld

55

A kimenet minimális értékeket feltételezve négy:

Date

numeric_value

sztring

Cél

2019-12-29

0

NA

55.1

2019-12-30

0

NA

55.6

2019-12-31

0

NA

54.5

2020-01-01

23

zöld

55

Megjegyzés: Két paraméterünk short_series_handling_configuration és örökölt short_series_handling. Ha mindkét paraméter be van állítva, szinkronizáljuk őket az alábbi táblázatban látható módon (short_series_handling_configuration és short_series_handling a rövidséghez handling_configuration és kezelésként vannak megjelölve).

Kezelése

konfiguráció kezelése

eredményként kapott kezelés

eredményként kapott kezeléskonfigurálás

Igaz

auto

Igaz

auto

Igaz

Pad

Igaz

auto

Igaz

drop

Igaz

auto

Igaz

None

Hamis

None

Hamis

auto

Hamis

None

Hamis

Pad

Hamis

None

Hamis

drop

Hamis

None

Hamis

None

Hamis

None

target_aggregate_function
Kötelező
str

Az idősor céloszlopának összesítéséhez használandó függvény, hogy megfeleljen a felhasználó által megadott gyakoriságnak. Ha a target_aggregation_function be van állítva, de a freq paraméter nincs beállítva, a hiba keletkezik. A lehetséges célösszesítési függvények a következők: "sum", "max", "min" és "mean".

  • A céloszlop értékeit a rendszer a megadott művelet alapján összesíti. Az összeg általában a legtöbb forgatókönyvhöz megfelelő.

  • Az adatok numerikus prediktoroszlopai összeg, középérték, minimális érték és maximális érték szerint vannak összesítve. Ennek eredményeképpen az automatizált gépi tanulás az aggregációs függvény nevével utótaggal ellátott új oszlopokat hoz létre, és alkalmazza a kiválasztott összesítési műveletet.

  • A kategorikus prediktoroszlopok esetében az adatok az ablak legkiválóbb kategóriája, a mód szerint összesítve lesznek.

  • A dátumelőztető oszlopokat a rendszer a minimális érték, a maximális érték és a mód szerint összesíti.

Freq

target_aggregation_function

Adatszűkítési mechanizmus

Nincs (alapértelmezett)

Nincs (alapértelmezett)

Az összesítés nincs alkalmazva. Ha az érvényesség nem határozható meg, a hiba jelentkezik.

Néhány érték

Nincs (alapértelmezett)

Az összesítés nincs alkalmazva. Ha a megadott frekvenciarácsnak megfelelő adatpontok száma kisebb, akkor ezek a pontok 90%-a törlődik, ellenkező esetben a hiba jelentkezik.

Nincs (alapértelmezett)

Aggregációs függvény

A missingfrequency paraméterekkel kapcsolatos hiba lépett fel.

Néhány érték

Aggregációs függvény

Összesítés gyakoriságra aprovided aggregációs függvény használatával.

time_column_name
Kötelező

Az időoszlop neve. Ez a paraméter szükséges az előrejelzéshez az idősor létrehozásához és gyakoriságának meghatározásához használt bemeneti adatok datetime oszlopának megadásához.

time_series_id_column_names
Kötelező

Az idősorok csoportosításához használt oszlopok neve. Több adatsor létrehozására is használható. Ha az idősor-azonosító oszlopnevei nincsenek definiálva, vagy a megadott azonosító oszlopok nem azonosítják az adathalmaz összes adatsorát, az idősor-azonosítók automatikusan létrejönnek az adathalmazhoz.

features_unknown_at_forecast_time
Kötelező

A betanításhoz elérhető, de az előrejelzés/következtetés időpontjában ismeretlen funkcióoszlopok. Ha features_unknown_at_forecast_time üres listára van állítva, akkor a rendszer feltételezi, hogy az adathalmaz összes funkcióoszlopa a következtetés időpontjában ismert. Ha ez a paraméter nincs beállítva, a jövőbeli funkciók támogatása nincs engedélyezve.

Csak kulcsszavas paraméterek

Name Description
country_or_region_for_holidays
Kötelező
cv_step_size
Kötelező
forecast_horizon
Kötelező
target_lags
Kötelező
target_rolling_window_size
Kötelező
frequency
Kötelező
feature_lags
Kötelező
seasonality
Kötelező
use_stl
Kötelező
short_series_handling_config
Kötelező
target_aggregate_function
Kötelező
time_column_name
Kötelező
time_series_id_column_names
Kötelező
features_unknown_at_forecast_time
Kötelező