Funkcje opóźnione na potrzeby prognozowania szeregów czasowych w rozwiązaniu AutoML

Ten artykuł koncentruje się na metodach automatycznego uczenia maszynowego na potrzeby tworzenia funkcji agregacji opóźnień i okien kroczących na potrzeby prognozowania modeli regresji. Funkcje takie jak te, które używają wcześniejszych informacji, mogą znacznie zwiększyć dokładność, pomagając modelowi uczyć się wzorców korelacji w czasie. Zobacz artykuł omówienie metod , aby uzyskać ogólne informacje na temat metodologii prognozowania w rozwiązaniu AutoML. Instrukcje i przykłady dotyczące modeli prognozowania trenowania w rozwiązaniu AutoML można znaleźć w artykule dotyczącym konfigurowania rozwiązania AutoML na potrzeby prognozowania szeregów czasowych .

Przykład funkcji Opóźnienie

Rozwiązanie AutoML generuje opóźnienia w odniesieniu do horyzontu prognozy. W przykładzie w tej sekcji przedstawiono tę koncepcję. W tym miejscu używamy horyzontu prognozy trzech i kolejności opóźnienia docelowego jednego. Rozważmy następujące miesięczne serie czasowe:

Tabela 1. Oryginalny szereg czasowy

Date $y_t$
1/1/2001 0
2/1/2001 10
3/1/2001 20
4/1/2001 30
5/1/2001 40
6/1/2001 50

Najpierw generujemy funkcję opóźnienia tylko dla horyzontu $h=1$. W miarę kontynuowania czytania stało się jasne, dlaczego używamy poszczególnych horyzontów w każdej tabeli.

Tabela 2. Opóźnienie cechowania dla $h=1$

Date $y_t$ Origin $y_{t-1}$ $h$
1/1/2001 0 12/1/2000 - 1
2/1/2001 10 1/1/2001 0 1
3/1/2001 20 2/1/2001 10 1
4/1/2001 30 3/1/2001 20 1
5/1/2001 40 4/1/2001 30 1
6/1/2001 50 5/1/2001 40 1

Tabela 2 jest generowana z tabeli 1 przez przesunięcie kolumny $y_t$ w dół przez jedną obserwację. Dodaliśmy kolumnę o nazwie Origin zawierającą daty, z których pochodzą funkcje opóźnienia. Następnie wygenerujemy funkcję opóźniania dla horyzontu prognozy $h=2$.

Tabela 3. Opóźnienie cechowania dla $h=2$

Date $y_t$ Origin $y_{t-2}$ $h$
1/1/2001 0 11/1/2000 - 2
2/1/2001 10 12/1/2000 - 2
3/1/2001 20 1/1/2001 0 2
4/1/2001 30 2/1/2001 10 2
5/1/2001 40 3/1/2001 20 2
6/1/2001 50 4/1/2001 30 2

Tabela 3 jest generowana z tabeli 1 przez przesunięcie kolumny $y_t$ w dół o dwie obserwacje. Na koniec wygenerujemy funkcję opóźniania dla horyzontu prognozy $h=3$.

Tabela 4. Opóźnienie cechowania dla $h=3$

Date $y_t$ Origin $y_{t-3}$ $h$
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 3/1/2001 20 3

Następnie łączymy tabele 1, 2 i 3 i zmieniamy kolejność wierszy. Wynik znajduje się w poniższej tabeli:

Tabela 5. Ukończenie cechowania

Date $y_t$ Origin $y_{t-1}^{(h)}$ $h$
1/1/2001 0 12/1/2000 - 1
1/1/2001 0 11/1/2000 - 2
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 1/1/2001 0 1
2/1/2001 10 12/1/2000 - 2
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 2/1/2001 10 1
3/1/2001 20 1/1/2001 0 2
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 3/1/2001 20 1
4/1/2001 30 2/1/2001 10 2
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 4/1/2001 30 1
5/1/2001 40 3/1/2001 20 2
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 4/1/2001 40 1
6/1/2001 50 4/1/2001 30 2
6/1/2001 50 3/1/2001 20 3

W końcowej tabeli zmieniliśmy nazwę kolumny opóźnienia na $y_{t-1}^{(h)}$ w celu odzwierciedlenia, że opóźnienie jest generowane w odniesieniu do określonego horyzontu. W tabeli pokazano, że opóźnienia wygenerowane w odniesieniu do horyzontu można zamapować na konwencjonalne sposoby generowania opóźnień w poprzednich tabelach.

Tabela 5 jest przykładem rozszerzenia danych stosowanego przez rozwiązanie AutoML do danych szkoleniowych w celu umożliwienia bezpośredniego prognozowania z modeli regresji. Gdy konfiguracja obejmuje funkcje opóźnienia, rozwiązanie AutoML tworzy opóźnienie zależne od horyzontu wraz z funkcją horyzontu o wartości całkowitej. Dzięki temu modele regresji prognozowania rozwiązania AutoML mogą przewidywać w $h$ w zakresie $h$ bez względu na przewidywanie na $h-1$, w przeciwieństwie do rekursywnie zdefiniowanych modeli, takich jak ARIMA.

Uwaga

Generowanie funkcji opóźnienia zależnego od horyzontu dodaje nowe wiersze do zestawu danych. Liczba nowych wierszy jest proporcjonalna do horyzontu prognozy. Ten wzrost rozmiaru zestawu danych może prowadzić do błędów braku pamięci w mniejszych węzłach obliczeniowych lub gdy rozmiar zestawu danych jest już duży. Zapoznaj się z artykułem na temat często zadawanych pytań , aby uzyskać rozwiązania tego problemu.

Kolejną konsekwencją tej strategii opóźnienia jest oddzielenie kolejności opóźnienia i horyzontu prognozy. Jeśli na przykład horyzont prognozy wynosi siedem i chcesz, aby rozwiązanie AutoML używało funkcji opóźnienia, nie musisz ustawiać kolejności opóźnienia na siedem, aby zapewnić przewidywanie w pełnym horyzoncie prognozy. Ponieważ rozwiązanie AutoML generuje opóźnienia w odniesieniu do horyzontu, można ustawić kolejność opóźnienia na jeden, a rozwiązanie AutoML rozszerzy dane tak, aby opóźnienie dowolnego zamówienia było prawidłowe do prognozowanego horyzontu.

Następne kroki