Regresja Poissona

W tym artykule opisano składnik w projektancie Azure Machine Learning.

Użyj tego składnika, aby utworzyć model regresji Poisson w potoku. Regresja Poissona jest przeznaczona do przewidywania wartości liczbowych, zwykle zliczanych. W związku z tym należy użyć tego składnika do utworzenia modelu regresji tylko wtedy, gdy wartości, które próbujesz przewidzieć, pasują do następujących warunków:

  • Zmienna odpowiedzi ma rozkład Poissona.

  • Liczba nie może być ujemna. Metoda nie powiedzie się wprost, jeśli spróbujesz użyć jej z etykietami negatywnymi.

  • Rozkład Poissona jest dyskretnym rozkładem; w związku z tym nie ma znaczenia, aby używać tej metody z liczbami niezliczonymi.

Porada

Jeśli element docelowy nie jest liczbą, regresja Poissona prawdopodobnie nie jest odpowiednią metodą. Wypróbuj inne składniki regresji w projektancie.

Po skonfigurowaniu metody regresji należy wytrenować model przy użyciu zestawu danych zawierającego przykłady wartości, którą chcesz przewidzieć. Wytrenowany model może następnie służyć do przewidywania.

Więcej informacji na temat regresji Poissona

Regresja Poissona jest specjalnym typem analizy regresji, która jest zwykle używana do modelowania liczby. Na przykład regresja Poissona byłaby przydatna w następujących scenariuszach:

  • Modelowanie liczby chłodów związanych z lotami samolotowymi

  • Szacowanie liczby połączeń służb ratowniczych podczas zdarzenia

  • Prognozowanie liczby zapytań klientów po podwyższeniu poziomu

  • Tworzenie tabel awaryjnych

Ponieważ zmienna odpowiedzi ma rozkład Poisson, model wykonuje różne założenia dotyczące danych i rozkład prawdopodobieństwa niż, powiedzmy, regresja najmniejszych kwadratów. W związku z tym modele Poissona powinny być interpretowane inaczej niż inne modele regresji.

Jak skonfigurować regresję Poissona

  1. Dodaj składnik Regresja Poissona do potoku w projektancie. Ten składnik można znaleźć w obszarze Machine Learning Algorytmy w kategorii Regresja.

  2. Dodaj zestaw danych zawierający dane szkoleniowe poprawnego typu.

    Zalecamy użycie metody Normalize Data (Normalizacja danych ) w celu normalizacji wejściowego zestawu danych przed użyciem go do trenowania regresji.

  3. W okienku po prawej stronie składnika Regresja poissona określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: jeśli wiesz, jak skonfigurować model, podaj określony zestaw wartości jako argumenty.

    • Zakres parametrów: jeśli nie masz pewności co do najlepszych parametrów, wykonaj zamiatanie parametrów przy użyciu składnika Hiperparameters modelu dostrajania . Trener iteruje wiele wartości, które określisz, aby znaleźć optymalną konfigurację.

  4. Tolerancja optymalizacji: wpisz wartość, która definiuje interwał tolerancji podczas optymalizacji. Niższa wartość, wolniejsze i dokładniejsze dopasowanie.

  5. Waga regularnych L1 i waga regularnych L2: wartości typów do użycia w przypadku regularyzacji L1 i L2. Regularyzacja dodaje ograniczenia do algorytmu dotyczące aspektów modelu, które są niezależne od danych treningowych. Regularyzacja jest często używana do unikania nadmiernego dopasowania.

    • Regularyzacja L1 jest przydatna, jeśli celem jest posiadanie modelu, który jest tak rozrzedny, jak to możliwe.

      Regularyzacja L1 jest wykonywana przez odejmowanie wagi L1 wektora wagi z wyrażenia straty, że uczeń próbuje zminimalizować. Norma L1 jest dobrym przybliżeniem normy L0, która jest liczbą współrzędnych niezerowych.

    • Regularyzacja L2 uniemożliwia każdej pojedynczej współrzędnej w wektorze wagi rośnie zbyt wiele wielkości. Regularyzacja L2 jest przydatna, jeśli celem jest posiadanie modelu z małą ogólną wagą.

    W tym składniku można zastosować kombinację regularyzacji L1 i L2. Łącząc regularyzacja L1 i L2, można nałożyć karę na wielkość wartości parametrów. Uczeń próbuje zminimalizować karę, w kompromisie z minimalizacją straty.

    Aby uzyskać dobrą dyskusję na temat regularyzacji L1 i L2, zobacz L1 i L2 Regularization for Machine Learning (Regularyzacja L1 i L2).

  6. Rozmiar pamięci dla L-BFGS: określ ilość pamięci do zarezerwowania na potrzeby dopasowania i optymalizacji modelu.

    L-BFGS to konkretna metoda optymalizacji oparta na algorytmie Broyden-Fletcher-Goldfarb-Shanno (BFGS). Metoda używa ograniczonej ilości pamięci (L) do obliczenia następnego kierunku kroku.

    Zmieniając ten parametr, można mieć wpływ na liczbę poprzednich pozycji i gradientów przechowywanych na potrzeby obliczeń następnego kroku.

  7. Połączenie zestaw danych trenowania i nietrenowany model do jednego ze składników trenowania:

    Ostrzeżenie

    • Jeśli przekazujesz zakres parametrów do trenowania modelu, używa ona tylko pierwszej wartości na liście zakresów parametrów.

    • Jeśli przekazujesz jeden zestaw wartości parametrów do składnika Hiperparametry modelu dostrajania , gdy oczekuje on zakresu ustawień dla każdego parametru, ignoruje wartości i używa wartości domyślnych dla ucznia.

    • Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, ta określona wartość jest używana w całym zamiataniu, nawet jeśli inne parametry zmieniają się w zakresie wartości.

  8. Prześlij potok.

Wyniki

Po zakończeniu trenowania:

  • Aby zapisać migawkę wytrenowanego modelu, wybierz składnik trenowania, a następnie przejdź do karty Dane wyjściowe i dzienniki w prawym panelu. Kliknij ikonę Zarejestruj zestaw danych. Zapisany model można znaleźć jako składnik w drzewie składników.

Następne kroki

Zobacz zestaw składników dostępnych do Azure Machine Learning.