Az autoML idősor-előrejelzési funkciói
Ez a cikk az AutoML késési és gördülőablak-összesítési funkcióinak regressziós modellek előrejelzésére szolgáló módszereivel foglalkozik. Az ilyen, korábbi információkat használó funkciók jelentősen növelhetik a pontosságot azáltal, hogy segítenek a modellnek időben megtanulni a korrelációs mintákat. Az AutoML előrejelzési módszertanával kapcsolatos általános információkért tekintse meg a módszerek áttekintését ismertető cikket . Az AutoML-betanítási előrejelzési modellek betanítására vonatkozó utasításokat és példákat az AutoML beállítása idősor-előrejelzési cikkünkben találja.
Késési funkció – példa
Az AutoML késéseket hoz létre az előrejelzési horizonthoz képest. A jelen szakaszban szereplő példa ezt a fogalmat szemlélteti. Itt egy háromból álló előrejelzési horizontot használunk, és egy cél késési sorrendjét. Vegye figyelembe a következő havi idősorokat:
Dátum | $y_t$ |
---|---|
1/1/2001 | 0 |
2/1/2001 | 10 |
3/1/2001 | 20 |
4/1/2001 | 30 |
5/1/2001 | 40 |
6/1/2001 | 50 |
Először létrehozzuk a késési funkciót csak a horizonthoz $h=1$ értékhez. Ahogy folytatja az olvasást, egyértelművé válik, hogy miért használunk egyes horizontokat az egyes táblákban.
2. táblázat: Lag featurization for $h=1$
Dátum | $y_t$ | Forrás | $y_{t-1}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
6/1/2001 | 50 | 5/1/2001 | 40 | 1 |
A 2. táblázat az 1. táblából jön létre úgy, hogy a $y_t$ oszlopot egyetlen megfigyeléssel lefelé tolja. Hozzáadtunk egy nevű Origin
oszlopot, amely tartalmazza azokat a dátumokat, amelyekből a késési funkciók származnak. Ezután létrehozzuk az előrejelzési horizont késési funkcióját $h=2$ értékre.
3. táblázat: A $h=2$ késési featurizációja
Dátum | $y_t$ | Forrás | $y_{t-2}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 11/1/2000 | - | 2 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
A 3. táblázat az 1. táblából jön létre úgy, hogy a $y_t$ oszlopot két megfigyeléssel lefelé tolja. Végül létrehozzuk az előrejelzési horizont késési funkcióját $h=3$ értékre.
4. táblázat: A $h=3$ késési featurizációja
Dátum | $y_t$ | Forrás | $y_{t-3}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Ezután összefűzzük az 1., 2. és 3. táblázatot, és átrendezzük a sorokat. Az eredmény a következő táblázatban található:
5. táblázat: Lag featurization complete
Dátum | $y_t$ | Forrás | $y_{t-1}^{(h)}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
1/1/2001 | 0 | 11/1/2000 | - | 2 |
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 4/1/2001 | 40 | 1 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Az utolsó táblázatban a késés oszlopának nevét $y_{t-1}^{(h)}$ értékre módosítottuk, hogy tükrözze, hogy a késés egy adott horizonthoz képest jön létre. A táblázat azt mutatja, hogy a horizonthoz képest létrehozott késések az előző táblák késésének hagyományos módjaihoz rendelhetők.
Az 5. táblázat egy példa arra az adatkiterjesztésre, amelyet az AutoML a betanítási adatokra alkalmaz a regressziós modellekből történő közvetlen előrejelzés engedélyezéséhez. Ha a konfiguráció késési funkciókat is tartalmaz, az AutoML horizontfüggő késéseket hoz létre egy egész szám értékű horizont-funkcióval együtt. Ez lehetővé teszi az AutoML előrejelzési regressziós modelljei számára, hogy előrejelzést készítsenek a horizont $h$ területen, tekintet nélkül a $h-1$ előrejelzésre, szemben az olyan rekurzívan definiált modellekkel, mint az ARIMA.
Megjegyzés
A horizontfüggő késési funkciók létrehozása új sorokat ad hozzá az adathalmazhoz. Az új sorok száma arányos az előrejelzési horizontmal. Az adathalmaz méretének növekedése memóriakimaradási hibákhoz vezethet a kisebb számítási csomópontokon, vagy ha az adathalmaz mérete már nagy. A probléma megoldásához tekintse meg a gyakori kérdéseket ismertető cikket.
Ennek a lemaradási stratégiának egy másik következménye, hogy a késési sorrend és az előrejelzési horizont leválasztva van. Ha például az előrejelzési horizont hét, és azt szeretné, hogy az AutoML késési funkciókat használjon, nem kell hétre állítania a késési sorrendet, hogy az előrejelzés teljes előrejelzési horizonton legyen. Mivel az AutoML késéseket hoz létre a horizonthoz képest, beállíthatja a késési sorrendet egy értékre, az AutoML pedig bővíti az adatokat, hogy a megrendelések késése érvényes legyen az előrejelzési horizontig.
Következő lépések
- További információ arról, hogyan állíthatja be az AutoML-t egy idősorozat-előrejelzési modell betanításához.
- Az AutoML-előrejelzéssel kapcsolatos gyakori kérdések tallózása.
- Tudnivalók az idősor-előrejelzés naptárfunkcióiról az AutoML-ben.
- Megtudhatja , hogyan használja az AutoML a gépi tanulást előrejelzési modellek létrehozására.