składnik maszyny wektorowej obsługi Two-Class

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Ten składnik umożliwia utworzenie modelu opartego na algorytmie maszyny wektorów nośnych.

Maszyny wektorów nośnych (SVM) to dobrze zbadana klasa nadzorowanych metod uczenia. Ta konkretna implementacja jest odpowiednia do przewidywania dwóch możliwych wyników na podstawie zmiennych ciągłych lub podzielonych na kategorie.

Po zdefiniowaniu parametrów modelu wytrenuj model przy użyciu składników trenowania i podaj oznakowany zestaw danych zawierający etykietę lub kolumnę wyniku.

Informacje o maszynach wektorów nośnych

Maszyny wektorów nośnych należą do najwcześniejszych algorytmów uczenia maszynowego, a modele SVM były używane w wielu aplikacjach— od pobierania informacji do klasyfikacji tekstu i obrazów. Maszyny wektorów nośnych mogą służyć zarówno do zadań klasyfikacji, jak i regresji.

Ten model SVM jest nadzorowanym modelem uczenia, który wymaga danych oznaczonych etykietą. W procesie trenowania algorytm analizuje dane wejściowe i rozpoznaje wzorce w przestrzeni funkcji wielowymiarowej nazywanej hiperpłaszyną. Wszystkie przykłady danych wejściowych są reprezentowane jako punkty w tym obszarze i są mapowane na kategorie wyjściowe w taki sposób, aby kategorie zostały podzielone przez możliwie szeroki i wyczyść lukę.

W przypadku przewidywania algorytm SVM przypisuje nowe przykłady do jednej lub drugiej kategorii, mapując je na tę samą przestrzeń.

Sposób konfigurowania

W przypadku tego typu modelu zaleca się normalizację zestawu danych przed użyciem go do trenowania klasyfikatora.

  1. Dodaj składnik Two-Class Support Vector Machine do potoku.

  2. Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: jeśli wiesz, jak skonfigurować model, możesz podać określony zestaw wartości jako argumenty.

    • Zakres parametrów: jeśli nie masz pewności co do najlepszych parametrów, możesz znaleźć optymalne parametry przy użyciu składnika Hiperparametry modelu dostrajania . Podajesz zakres wartości, a trener iteruje wiele kombinacji ustawień, aby określić kombinację wartości, które dają najlepszy wynik.

  3. W polu Liczba iteracji wpisz liczbę, która określa liczbę iteracji używanych podczas tworzenia modelu.

    Ten parametr może służyć do kontrolowania kompromisu między szybkością trenowania a dokładnością.

  4. W polu Lambda wpisz wartość, która ma być używana jako waga uregulowania L1.

    Ten współczynnik uregulowania może służyć do dostrajania modelu. Większe wartości karają bardziej złożone modele.

  5. Wybierz opcję Normalizuj funkcje, jeśli chcesz znormalizować funkcje przed trenowaniem.

    W przypadku zastosowania normalizacji przed trenowaniem punkty danych są skoncentrowane na średniej i skalowane w taki sposób, aby miały jedną jednostkę odchylenia standardowego.

  6. Wybierz opcję Project to the unit sphere (Projektuj do sfery jednostkowej), aby znormalizować współczynniki.

    Prognozowanie wartości w przestrzeni jednostkowej oznacza, że przed trenowaniem punkty danych są wyśrodkowane na poziomie 0 i skalowane, aby mieć jedną jednostkę odchylenia standardowego.

  7. W inicjatorze liczby losowej wpisz wartość całkowitą, która ma być używana jako inicjator, jeśli chcesz zapewnić powtarzalność między przebiegami. W przeciwnym razie wartość zegara systemowego jest używana jako inicjator, co może spowodować nieco inne wyniki w różnych przebiegach.

  8. Połącz oznaczony zestaw danych i wytrenuj model:

    • Jeśli ustawisz opcję Utwórz tryb trenera na pojedynczy parametr, połącz oznakowany zestaw danych i składnik Train Model (Trenowanie modelu ).

    • Jeśli ustawisz opcję Utwórz tryb trenera na wartość Zakres parametrów, połącz oznakowany zestaw danych i wytrenuj model przy użyciu hiperparametrów dostrajania modelu.

    Uwaga

    Jeśli przekazujesz zakres parametrów do trenowania modelu, używa tylko wartości domyślnej na liście pojedynczych parametrów.

    W przypadku przekazania pojedynczego zestawu wartości parametrów do składnika Hiperparametrów modelu dostrajania , gdy oczekuje ona zakresu ustawień dla każdego parametru, ignoruje wartości i używa wartości domyślnych dla ucznia.

    Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, określona pojedyncza wartość będzie używana w całym zamiataniu, nawet jeśli inne parametry zmienią się w zakresie wartości.

  9. Prześlij potok.

Wyniki

Po zakończeniu szkolenia:

  • Aby zapisać migawkę wytrenowanego modelu, wybierz kartę Dane wyjściowe w prawym panelu składnika Trenowanie modelu . Wybierz ikonę Zarejestruj zestaw danych , aby zapisać model jako składnik wielokrotnego użytku.

  • Aby użyć modelu do oceniania, dodaj składnik Score Model (Generowanie wyników dla modelu ) do potoku.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.