Trénování modelu

Navlakuje model klasifikace nebo regrese v dohledovém režimu.

Kategorie: Machine Learning/výuka

Poznámka

Platí pro: Machine Learning Studio (Classic)

Tento obsah se týká pouze studia (Classic). Podobné moduly přetažení byly přidány do návrháře Azure Machine Learning. Další informace najdete v tomto článku porovnávající tyto dvě verze.

Přehled modulu

Tento článek popisuje, jak používat modul vlakového modelu v Azure Machine Learning Studio (Classic) k učení modelu klasifikace nebo regrese. Školení proběhne po definování modelu a nastavení jeho parametrů a vyžaduje označení dat. Pomocí výukového modelu můžete také přeškolovat stávající model s novými daty.

Jak proces školení funguje

V Azure Machine Learning je vytváření a používání modelu strojového učení obvykle proces tří kroků.

  1. Nakonfigurujete model, výběrem konkrétního typu algoritmu a definováním jeho parametrů nebo parametrů. Vyberte některý z následujících typů modelů:

    • Klasifikační modelyzaložené na neuronovéch sítích, rozhodovacích stromů a doménových strukturách a dalších algoritmech.
    • Regresní modely, které mohou zahrnovat standardní lineární regresi nebo které používají jiné algoritmy, včetně neuronovéch sítí a Baysian regrese.
  2. Poskytněte datovou sadu, která je označena a má data kompatibilní s algoritmem. Připojte data i model k proškolování modelu.

    Jaké školení vytváří konkrétní binární formát, iLearner, který zapouzdřuje statistické vzorce získané z dat. Tento formát nejde změnit přímo ani číst. Nicméně jiné moduly v aplikaci Studio (Classic) mohou používat tento vycvičený model.

    Můžete také zobrazit vlastnosti modelu. Další informace najdete v části s výsledky .

  3. Po dokončení školení použijte školicí model s jedním z modulů pro vyhodnocovánía předpovědi se na nová data.

Poznámka

Další specializované úkoly strojového učení vyžadují různé metody školení a Studio (Classic) poskytuje pro ně samostatné školicí moduly. Například detekce imagí, clusteringu a anomálie detction využívají vlastní školicí metody. Model výuky je určený jenom pro použití s regresí a klasifikačními modely.

Pod dohledem a bez dohledu školení

Je možné, že jste si vyslyšeli výrazy pod dohledem nebo bez dohledu nad učením. Školení modelu klasifikace nebo regrese pomocí modelu výuky je klasickým příkladem strojového učení pod dohledem. To znamená, že musíte poskytnout datovou sadu, která obsahuje historická data, ze kterých se naučíte vzory. Data by měla obsahovat výsledek (popisek), který se pokoušíte odhadnout, a související faktory (proměnné). Model strojového učení potřebuje výsledky pro určení funkcí, které nejlépe vypovídají výsledky.

Během procesu školení se data seřadí podle výsledků a algoritmus získá statistické vzory pro sestavování modelu.

Učení bez dohledu znamená, že výsledek není znám, nebo pokud se rozhodnete nepoužívat známé popisky. Například algoritmy clusteringu obvykle využívají bezdohledné metody učení, ale mohou používat popisky, pokud jsou k dispozici. Dalším příkladem je modelování tématu pomocí LDA. Pomocí těchto algoritmů nelze model výuky použít.

Tip

Začínáte se strojovým učením? Tento kurz vás provede procesem získání dat, konfigurací algoritmu, školením a následným použitím modelu: Vytvoření prvního experimentu machine learningu

Jak používat model výuky

  1. V Azure Machine Learning Studio (Classic) Nakonfigurujte model klasifikace nebo modely regresních modelů.

    Můžete také vytvořit vlastní model vytvořený pomocí modelu vytvoření R.

  2. Přidejte modul vlakového modelu do experimentu. Tento modul můžete najít v kategorii Machine Learning . Rozbalte položku vlaka přetáhněte modul vlakového modelu do experimentu.

  3. Na levém vstupu připojte nev nevýukovém režimu. Připojte datovou sadu ke správnému vstupu modelu výuky.

    Datová sada školení musí obsahovat sloupec popisku. Všechny řádky bez popisků jsou ignorovány.

  4. U sloupce popisekklikněte na Spustit selektor sloupcůa vyberte jeden sloupec obsahující výsledky, které model může použít pro školení.

    • Pro problémy s klasifikací musí sloupec popisku obsahovat buď hodnoty kategorií nebo diskrétní hodnoty. Některé příklady mohou být hodnocení typu Ano/bez, kód klasifikace choroby nebo název nebo skupina pro příjem. Pokud vyberete sloupec noncategorical, modul během školení vrátí chybu.

    • V případě regresních problémů musí sloupec popisku obsahovat Číselná data, která představují proměnnou odpovědi. V ideálním případě číselná data představují souvislý rozsah.

    Příkladem může být skóre úvěrového rizika, předpokládaný čas k selhání pevného disku nebo předpokládaný počet volání centra volání v daném dni nebo čase. Pokud nevyberete číselný sloupec, může se zobrazit chyba.

    • Pokud neurčíte, který sloupec popisku použít, Azure Machine Learning se pokusí odvodit, který je příslušným sloupcem popisku, pomocí metadat datové sady. Pokud se sloupec vybere jako špatný, můžete ho opravit pomocí voliče sloupců.

    Tip

    Pokud máte potíže s použitím voliče sloupců, přečtěte si článek Výběr sloupců v datové sadě pro tipy. Popisuje několik běžných scénářů a tipů k používání pravidel s pravidly a možnostmi názvu .

  5. Spusťte experiment. Pokud máte velké množství dat, může to chvíli trvat.

Důsledk

Po vyškolení modelu:

  • Pokud chcete zobrazit parametry modelu a váhy funkcí, klikněte pravým tlačítkem na výstup a vyberte vizualizovat.

  • Pokud chcete model použít v jiných experimentech, klikněte pravým tlačítkem na model a vyberte Uložit model. Zadejte název modelu.

    Tím se model uloží jako snímek, který není aktualizován opakovanými běhy experimentu.

  • Pokud chcete model použít při předvídání nových hodnot, připojte ho k modulu skóre modelu spolu s novými vstupními daty.

Pokud potřebujete vytvořit typ modelu, který není podporován modelem výuky, existuje několik možností:

  • Vytvořte vlastní metodu bodování pomocí skriptu jazyka R nebo použijte jeden z mnoha dostupných balíčků pro vyhodnocování R.

  • Psaní vlastního skriptu Pythonu pro výuku a hodnocení modelu nebo použití existující knihovny Pythonu:

  • Modely detekce anomálií

  • Modely doporučení

    • Pokud model používá doporučení Matchbox doporučené v Azure Machine Learning, použijte modul Matchbox pro školení .

    • Pokud používáte jiný algoritmus pro analýzu nebo doporučení na trhu, využijte své školicí metody ve skriptu R nebo v jazyce Python.

  • Modely clusteringu

Příklady

Příklady toho, jak se modul vlakového modelu používá při experimentech machine learningu, najdete v následujících experimentech v Azure AI Gallery:

Očekávané vstupy

Název Typ Popis
Nevlakový model Rozhraní ILearner Nevlaková známka
Datová sada Tabulka dat Data pro trénink

Parametry modulu

Name Rozsah Typ Výchozí Popis
Sloupec popisku Libovolný ColumnSelection Výběr sloupce obsahujícího sloupec popisek nebo výsledek

Výstupy

Název Typ Popis
Školený model Rozhraní ILearner Školený učí

Výjimky

Seznam všech chyb modulu najdete v tématu kódy chyb modulu.

Výjimka Popis
Chyba 0032 K výjimce dojde, pokud argument není číslo.
Chyba 0033 K výjimce dojde, pokud je argumentem nekonečno.
Chyba 0083 K výjimce dojde, pokud datovou sadu použitou pro školení nelze použít pro konkrétní typ učení.
Chyba 0035 K výjimce dojde, pokud nebyly pro daného uživatele nebo položku zadány žádné funkce.
Chyba 0003 K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.
Chyba 0020 K výjimce dojde, pokud je počet sloupců v některých datových sadách předaných do modulu příliš malý.
Chyba 0021 K výjimce dojde v případě, že počet řádků v některých datových sadách předaných do modulu je příliš malý.
Chyba 0013 Pokud je předána rutině modulu pro učení neplatný typ, dojde k výjimce.

Viz také

Vyhodnotit model
Seznam modulů a-Z