Regresja Poissona

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Ten składnik umożliwia utworzenie modelu regresji Poissona w potoku. Regresja Poissona jest przeznaczona do przewidywania wartości liczbowych, zwykle zliczanych. W związku z tym należy użyć tego składnika do utworzenia modelu regresji tylko wtedy, gdy wartości, które próbujesz przewidzieć, pasują do następujących warunków:

  • Zmienna odpowiedzi ma rozkład Poissona.

  • Liczby nie mogą być ujemne. Metoda zakończy się niepowodzeniem w przypadku próby użycia jej z etykietami negatywnymi.

  • Rozkład Poissona jest odrębnym rozkładem; w związku z tym nie ma znaczenia, aby użyć tej metody z liczbami nie całkowitymi.

Porada

Jeśli cel nie jest liczbą, regresja Poissona prawdopodobnie nie jest odpowiednią metodą. Wypróbuj inne składniki regresji w projektancie.

Po skonfigurowaniu metody regresji należy wytrenować model przy użyciu zestawu danych zawierającego przykłady wartości, którą chcesz przewidzieć. Następnie wytrenowany model może służyć do przewidywania.

Więcej informacji o regresji Poissona

Regresja Poissona jest specjalnym typem analizy regresji, która jest zwykle używana do modelowania liczb. Na przykład regresja Poissona byłaby przydatna w następujących scenariuszach:

  • Modelowanie liczby zimnych skojarzonych z lotami samolotowymi

  • Szacowanie liczby połączeń służb ratowniczych podczas zdarzenia

  • Prognozowanie liczby zapytań klientów po podwyższeniu poziomu

  • Tworzenie tabel awaryjnych

Ponieważ zmienna odpowiedzi ma rozkład Poissona, model przyjmuje różne założenia dotyczące danych i rozkładu prawdopodobieństwa niż, powiedzmy, regresja najmniejszych kwadratów. Dlatego modele Poissona powinny być interpretowane inaczej niż inne modele regresji.

Jak skonfigurować regresję Poissona

  1. Dodaj składnik Regresja Poissona do potoku w projektancie. Ten składnik można znaleźć w obszarze Algorytmy uczenia maszynowego w kategorii Regresja .

  2. Dodaj zestaw danych zawierający dane treningowe odpowiedniego typu.

    Zalecamy użycie funkcji Normalize Data (Normalizacja danych ) w celu normalizacji wejściowego zestawu danych przed użyciem go do trenowania regresji.

  3. W okienku po prawej stronie składnika Regresja Poissona określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: jeśli wiesz, jak skonfigurować model, podaj określony zestaw wartości jako argumenty.

    • Zakres parametrów: jeśli nie masz pewności co do najlepszych parametrów, wykonaj zamiatanie parametrów przy użyciu składnika Hiperparametrów modelu dostrajania . Trener iteruje wiele wartości, aby znaleźć optymalną konfigurację.

  4. Tolerancja optymalizacji: wpisz wartość, która definiuje interwał tolerancji podczas optymalizacji. Im niższa wartość, wolniejsze i dokładniejsze dopasowanie.

  5. Waga uregulowania L1 i waga uregulowania L2: wartości typów do użycia na potrzeby uregulowania L1 i L2. Regularyzacja dodaje ograniczenia do algorytmu dotyczące aspektów modelu, które są niezależne od danych treningowych. Regularyzacja jest często stosowana w celu uniknięcia nadmiernego dopasowania.

    • Regularyzacja L1 jest przydatna, jeśli celem jest posiadanie modelu, który jest tak rozrzedniejszy, jak to możliwe.

      Regularyzacja L1 jest wykonywana przez odjęcie wagi L1 wektora wagi od wyrażenia straty, które uczeń próbuje zminimalizować. Normą L1 jest dobre przybliżenie normy L0, która jest liczbą współrzędnych niezerowych.

    • Regularyzacja L2 zapobiega wzrostowi zbyt dużej ilości wielkości każdej pojedynczej współrzędnej w wektorze wagi. Regularyzacja L2 jest przydatna, jeśli celem jest posiadanie modelu z małą ogólną wagą.

    W tym składniku można zastosować kombinację uregulowania L1 i L2. Łącząc uregulowania L1 i L2, można nałożyć karę na wielkość wartości parametrów. Uczący się stara się zminimalizować karę, w kompromisie z minimalizacją strat.

    Aby zapoznać się z dobrą dyskusją na temat uregulowania L1 i L2, zobacz L1 i L2 Regularization for Machine Learning (Regularyzacja L1 i L2 na potrzeby uczenia maszynowego).

  6. Rozmiar pamięci dla L-BFGS: określ ilość pamięci do zarezerwowania na potrzeby dopasowania i optymalizacji modelu.

    L-BFGS to konkretna metoda optymalizacji oparta na algorytmie Broyden-Fletcher-Goldfarb-Shanno (BFGS). Metoda używa ograniczonej ilości pamięci (L), aby obliczyć następny kierunek kroku.

    Zmieniając ten parametr, można wpływać na liczbę poprzednich pozycji i gradientów przechowywanych do obliczeń następnego kroku.

  7. Połącz zestaw danych trenowania i nieuszkodzony model z jednym ze składników szkoleniowych:

    Ostrzeżenie

    • Jeśli przekazujesz zakres parametrów do trenowania modelu, używa ona tylko pierwszej wartości na liście zakresów parametrów.

    • Jeśli przekazujesz pojedynczy zestaw wartości parametrów do składnika Hiperparametrów modelu dostrajania , gdy oczekuje ona zakresu ustawień dla każdego parametru, ignoruje wartości i używa wartości domyślnych dla ucznia.

    • Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, określona pojedyncza wartość będzie używana w całym zamiataniu, nawet jeśli inne parametry zmienią się w zakresie wartości.

  8. Prześlij potok.

Wyniki

Po zakończeniu szkolenia:

  • Aby zapisać migawkę wytrenowanego modelu, wybierz składnik trenowania, a następnie przejdź do karty Dane wyjściowe i dzienniki w prawym panelu. Kliknij ikonę Zarejestruj zestaw danych. Zapisany model można znaleźć jako składnik w drzewie składników.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.