Komponenta Two-Class Support Vector Machine

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Tato komponenta slouží k vytvoření modelu založeného na algoritmu metody podpůrných vektorů.

Podpůrné vektorové stroje (SVM) jsou dobře probádávanou třídou metod učení se supervizí. Tato konkrétní implementace je vhodná pro predikci dvou možných výsledků na základě spojitých nebo kategorických proměnných.

Po definování parametrů modelu natrénujte model pomocí trénovacích komponent a poskytnutím označené datové sady , která obsahuje popisek nebo sloupec výsledku.

O podpůrných vektorových strojích

Podpůrné vektorové počítače patří k nejstarším algoritmům strojového učení a modely SVM se používají v mnoha aplikacích, od načítání informací až po klasifikaci textu a obrázků. SVM lze použít pro úlohy klasifikace i regrese.

Tento model SVM je model učení se supervizí, který vyžaduje data s popisky. V procesu trénování algoritmus analyzuje vstupní data a rozpoznává vzory v multidimenzionálním prostoru prvků, kterému se říká nadrovin. Všechny vstupní příklady jsou reprezentovány jako body v tomto prostoru a mapují se na výstupní kategorie tak, aby kategorie byly rozděleny co nejsměrněji a nejjasněji.

Pro predikci algoritmus SVM přiřadí nové příklady do jedné nebo druhé kategorie a mapuje je do stejného prostoru.

Způsob konfigurace

U tohoto typu modelu se doporučuje před použitím k trénování klasifikátoru normalizovat datovou sadu.

  1. Přidejte do kanálu komponentu Podpůrný vektorový stroj se dvěma třídami .

  2. Určete, jak se má model trénovat, nastavením možnosti Vytvořit režim školitele .

    • Jeden parametr: Pokud víte, jak chcete model nakonfigurovat, můžete jako argumenty zadat konkrétní sadu hodnot.

    • Rozsah parametrů: Pokud si nejste jisti nejlepšími parametry, můžete optimální parametry najít pomocí komponenty Tune Model Hyperparameters . Zadáte určitý rozsah hodnot a školitel iteruje několik kombinací nastavení, aby určil kombinaci hodnot, která vede k nejlepšímu výsledku.

  3. Do pole Počet iterací zadejte číslo, které označuje počet iterací použitých při sestavování modelu.

    Tento parametr lze použít k řízení kompromisu mezi rychlostí trénování a přesností.

  4. Pro lambda zadejte hodnotu, která se použije jako váha pro regularizaci L1.

    Tento regularizační koeficient lze použít k ladění modelu. Větší hodnoty penalizují složitější modely.

  5. Pokud chcete před trénováním normalizovat funkce, vyberte možnost Normalizovat funkce.

    Pokud použijete normalizaci, před trénováním se datové body zacentrují na střední hodnotě a škálují se tak, aby měly jednu jednotku směrodatné odchylky.

  6. Pokud chcete normalizovat koeficienty, vyberte možnost Promítnout na jednotkovou kouli.

    Promítání hodnot do prostoru jednotek znamená, že před trénováním jsou datové body vycentrovány na 0 a škálovány tak, aby měly jednu jednotku směrodatné odchylky.

  7. Do pole Náhodné počáteční číslo zadejte celočíselnou hodnotu, která se použije jako počáteční hodnota, pokud chcete zajistit reprodukovatelnost napříč spuštěními. V opačném případě se hodnota systémových hodin použije jako počáteční hodnota, což může vést k mírně odlišným výsledkům napříč spuštěními.

  8. Připojte datovou sadu s popiskem a vytrénujte model:

    • Pokud nastavíte vytvořit režim školitele na jeden parametr, propojte označenou datovou sadu a komponentu Trénování modelu .

    • Pokud nastavíte Vytvořit režim školitele na Rozsah parametrů, připojte označenou datovou sadu a vytrénujte model pomocí hyperparametrů vyladit model.

    Poznámka

    Pokud předáte rozsah parametrů trénování modelu, použije se pouze výchozí hodnota v seznamu jednotlivých parametrů.

    Pokud předáte jednu sadu hodnot parametrů komponentě Tune Model Hyperparameters , když očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro učícího se.

    Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se tato zadaná hodnota v průběhu úklidu, a to i v případě, že se jiné parametry v rámci rozsahu hodnot mění.

  9. Odešlete kanál.

Výsledky

Po dokončení trénování:

  • Pokud chcete uložit snímek natrénovaného modelu, vyberte kartu Výstupy v pravém panelu komponenty Trénování modelu . Výběrem ikony Zaregistrovat datovou sadu uložte model jako opakovaně použitelnou komponentu.

  • Pokud chcete model použít k bodování, přidejte do kanálu komponentu Určení skóre modelu .

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.