Funkcje opóźnione na potrzeby prognozowania szeregów czasowych w rozwiązaniu AutoML
Ten artykuł koncentruje się na metodach automatycznego uczenia maszynowego na potrzeby tworzenia funkcji agregacji opóźnień i okien kroczących na potrzeby prognozowania modeli regresji. Funkcje takie jak te, które używają wcześniejszych informacji, mogą znacznie zwiększyć dokładność, pomagając modelowi uczyć się wzorców korelacji w czasie. Zobacz artykuł omówienie metod , aby uzyskać ogólne informacje na temat metodologii prognozowania w rozwiązaniu AutoML. Instrukcje i przykłady dotyczące modeli prognozowania trenowania w rozwiązaniu AutoML można znaleźć w artykule dotyczącym konfigurowania rozwiązania AutoML na potrzeby prognozowania szeregów czasowych .
Przykład funkcji Opóźnienie
Rozwiązanie AutoML generuje opóźnienia w odniesieniu do horyzontu prognozy. W przykładzie w tej sekcji przedstawiono tę koncepcję. W tym miejscu używamy horyzontu prognozy trzech i kolejności opóźnienia docelowego jednego. Rozważmy następujące miesięczne serie czasowe:
Tabela 1. Oryginalny szereg czasowy
Date | $y_t$ |
---|---|
1/1/2001 | 0 |
2/1/2001 | 10 |
3/1/2001 | 20 |
4/1/2001 | 30 |
5/1/2001 | 40 |
6/1/2001 | 50 |
Najpierw generujemy funkcję opóźnienia tylko dla horyzontu $h=1$. W miarę kontynuowania czytania stało się jasne, dlaczego używamy poszczególnych horyzontów w każdej tabeli.
Tabela 2. Opóźnienie cechowania dla $h=1$
Date | $y_t$ | Origin | $y_{t-1}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
6/1/2001 | 50 | 5/1/2001 | 40 | 1 |
Tabela 2 jest generowana z tabeli 1 przez przesunięcie kolumny $y_t$ w dół przez jedną obserwację. Dodaliśmy kolumnę o nazwie Origin
zawierającą daty, z których pochodzą funkcje opóźnienia. Następnie wygenerujemy funkcję opóźniania dla horyzontu prognozy $h=2$.
Tabela 3. Opóźnienie cechowania dla $h=2$
Date | $y_t$ | Origin | $y_{t-2}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 11/1/2000 | - | 2 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
Tabela 3 jest generowana z tabeli 1 przez przesunięcie kolumny $y_t$ w dół o dwie obserwacje. Na koniec wygenerujemy funkcję opóźniania dla horyzontu prognozy $h=3$.
Tabela 4. Opóźnienie cechowania dla $h=3$
Date | $y_t$ | Origin | $y_{t-3}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Następnie łączymy tabele 1, 2 i 3 i zmieniamy kolejność wierszy. Wynik znajduje się w poniższej tabeli:
Tabela 5. Ukończenie cechowania
Date | $y_t$ | Origin | $y_{t-1}^{(h)}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
1/1/2001 | 0 | 11/1/2000 | - | 2 |
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 4/1/2001 | 40 | 1 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
W końcowej tabeli zmieniliśmy nazwę kolumny opóźnienia na $y_{t-1}^{(h)}$ w celu odzwierciedlenia, że opóźnienie jest generowane w odniesieniu do określonego horyzontu. W tabeli pokazano, że opóźnienia wygenerowane w odniesieniu do horyzontu można zamapować na konwencjonalne sposoby generowania opóźnień w poprzednich tabelach.
Tabela 5 jest przykładem rozszerzenia danych stosowanego przez rozwiązanie AutoML do danych szkoleniowych w celu umożliwienia bezpośredniego prognozowania z modeli regresji. Gdy konfiguracja obejmuje funkcje opóźnienia, rozwiązanie AutoML tworzy opóźnienie zależne od horyzontu wraz z funkcją horyzontu o wartości całkowitej. Dzięki temu modele regresji prognozowania rozwiązania AutoML mogą przewidywać w $h$ w zakresie $h$ bez względu na przewidywanie na $h-1$, w przeciwieństwie do rekursywnie zdefiniowanych modeli, takich jak ARIMA.
Uwaga
Generowanie funkcji opóźnienia zależnego od horyzontu dodaje nowe wiersze do zestawu danych. Liczba nowych wierszy jest proporcjonalna do horyzontu prognozy. Ten wzrost rozmiaru zestawu danych może prowadzić do błędów braku pamięci w mniejszych węzłach obliczeniowych lub gdy rozmiar zestawu danych jest już duży. Zapoznaj się z artykułem na temat często zadawanych pytań , aby uzyskać rozwiązania tego problemu.
Kolejną konsekwencją tej strategii opóźnienia jest oddzielenie kolejności opóźnienia i horyzontu prognozy. Jeśli na przykład horyzont prognozy wynosi siedem i chcesz, aby rozwiązanie AutoML używało funkcji opóźnienia, nie musisz ustawiać kolejności opóźnienia na siedem, aby zapewnić przewidywanie w pełnym horyzoncie prognozy. Ponieważ rozwiązanie AutoML generuje opóźnienia w odniesieniu do horyzontu, można ustawić kolejność opóźnienia na jeden, a rozwiązanie AutoML rozszerzy dane tak, aby opóźnienie dowolnego zamówienia było prawidłowe do prognozowanego horyzontu.
Następne kroki
- Dowiedz się więcej o sposobie konfigurowania rozwiązania AutoML do trenowania modelu prognozowania szeregów czasowych.
- Przeglądaj często zadawane pytania dotyczące prognozowania automatycznego uczenia maszynowego.
- Dowiedz się więcej o funkcjach kalendarza na potrzeby prognozowania szeregów czasowych w rozwiązaniu AutoML.
- Dowiedz się , jak rozwiązanie AutoML używa uczenia maszynowego do tworzenia modeli prognozowania.