Share via


Az autoML idősor-előrejelzési funkciói

Ez a cikk az AutoML késési és gördülőablak-összesítési funkcióinak regressziós modellek előrejelzésére szolgáló módszereivel foglalkozik. Az ilyen, korábbi információkat használó funkciók jelentősen növelhetik a pontosságot azáltal, hogy segítenek a modellnek időben megtanulni a korrelációs mintákat. Az AutoML előrejelzési módszertanával kapcsolatos általános információkért tekintse meg a módszerek áttekintését ismertető cikket . Az AutoML-betanítási előrejelzési modellek betanítására vonatkozó utasításokat és példákat az AutoML beállítása idősor-előrejelzési cikkünkben találja.

Késési funkció – példa

Az AutoML késéseket hoz létre az előrejelzési horizonthoz képest. A jelen szakaszban szereplő példa ezt a fogalmat szemlélteti. Itt egy háromból álló előrejelzési horizontot használunk, és egy cél késési sorrendjét. Vegye figyelembe a következő havi idősorokat:

1. táblázat: Eredeti idősor

Dátum $y_t$
1/1/2001 0
2/1/2001 10
3/1/2001 20
4/1/2001 30
5/1/2001 40
6/1/2001 50

Először létrehozzuk a késési funkciót csak a horizonthoz $h=1$ értékhez. Ahogy folytatja az olvasást, egyértelművé válik, hogy miért használunk egyes horizontokat az egyes táblákban.

2. táblázat: Lag featurization for $h=1$

Dátum $y_t$ Forrás $y_{t-1}$ $h$
1/1/2001 0 12/1/2000 - 1
2/1/2001 10 1/1/2001 0 1
3/1/2001 20 2/1/2001 10 1
4/1/2001 30 3/1/2001 20 1
5/1/2001 40 4/1/2001 30 1
6/1/2001 50 5/1/2001 40 1

A 2. táblázat az 1. táblából jön létre úgy, hogy a $y_t$ oszlopot egyetlen megfigyeléssel lefelé tolja. Hozzáadtunk egy nevű Origin oszlopot, amely tartalmazza azokat a dátumokat, amelyekből a késési funkciók származnak. Ezután létrehozzuk az előrejelzési horizont késési funkcióját $h=2$ értékre.

3. táblázat: A $h=2$ késési featurizációja

Dátum $y_t$ Forrás $y_{t-2}$ $h$
1/1/2001 0 11/1/2000 - 2
2/1/2001 10 12/1/2000 - 2
3/1/2001 20 1/1/2001 0 2
4/1/2001 30 2/1/2001 10 2
5/1/2001 40 3/1/2001 20 2
6/1/2001 50 4/1/2001 30 2

A 3. táblázat az 1. táblából jön létre úgy, hogy a $y_t$ oszlopot két megfigyeléssel lefelé tolja. Végül létrehozzuk az előrejelzési horizont késési funkcióját $h=3$ értékre.

4. táblázat: A $h=3$ késési featurizációja

Dátum $y_t$ Forrás $y_{t-3}$ $h$
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 3/1/2001 20 3

Ezután összefűzzük az 1., 2. és 3. táblázatot, és átrendezzük a sorokat. Az eredmény a következő táblázatban található:

5. táblázat: Lag featurization complete

Dátum $y_t$ Forrás $y_{t-1}^{(h)}$ $h$
1/1/2001 0 12/1/2000 - 1
1/1/2001 0 11/1/2000 - 2
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 1/1/2001 0 1
2/1/2001 10 12/1/2000 - 2
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 2/1/2001 10 1
3/1/2001 20 1/1/2001 0 2
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 3/1/2001 20 1
4/1/2001 30 2/1/2001 10 2
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 4/1/2001 30 1
5/1/2001 40 3/1/2001 20 2
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 4/1/2001 40 1
6/1/2001 50 4/1/2001 30 2
6/1/2001 50 3/1/2001 20 3

Az utolsó táblázatban a késés oszlopának nevét $y_{t-1}^{(h)}$ értékre módosítottuk, hogy tükrözze, hogy a késés egy adott horizonthoz képest jön létre. A táblázat azt mutatja, hogy a horizonthoz képest létrehozott késések az előző táblák késésének hagyományos módjaihoz rendelhetők.

Az 5. táblázat egy példa arra az adatkiterjesztésre, amelyet az AutoML a betanítási adatokra alkalmaz a regressziós modellekből történő közvetlen előrejelzés engedélyezéséhez. Ha a konfiguráció késési funkciókat is tartalmaz, az AutoML horizontfüggő késéseket hoz létre egy egész szám értékű horizont-funkcióval együtt. Ez lehetővé teszi az AutoML előrejelzési regressziós modelljei számára, hogy előrejelzést készítsenek a horizont $h$ területen, tekintet nélkül a $h-1$ előrejelzésre, szemben az olyan rekurzívan definiált modellekkel, mint az ARIMA.

Megjegyzés

A horizontfüggő késési funkciók létrehozása új sorokat ad hozzá az adathalmazhoz. Az új sorok száma arányos az előrejelzési horizontmal. Az adathalmaz méretének növekedése memóriakimaradási hibákhoz vezethet a kisebb számítási csomópontokon, vagy ha az adathalmaz mérete már nagy. A probléma megoldásához tekintse meg a gyakori kérdéseket ismertető cikket.

Ennek a lemaradási stratégiának egy másik következménye, hogy a késési sorrend és az előrejelzési horizont leválasztva van. Ha például az előrejelzési horizont hét, és azt szeretné, hogy az AutoML késési funkciókat használjon, nem kell hétre állítania a késési sorrendet, hogy az előrejelzés teljes előrejelzési horizonton legyen. Mivel az AutoML késéseket hoz létre a horizonthoz képest, beállíthatja a késési sorrendet egy értékre, az AutoML pedig bővíti az adatokat, hogy a megrendelések késése érvényes legyen az előrejelzési horizontig.

Következő lépések