Machine Learning – skóre

V této části jsou uvedeny moduly poskytované v Azure Machine Learning Studio (Classic) pro bodování.

Poznámka

Platí pro: Machine Learning Studio (Classic)

Tento obsah se týká pouze studia (Classic). Podobné moduly přetažení byly přidány do návrháře Azure Machine Learning. Další informace najdete v tomto článku porovnávající tyto dvě verze.

Bodování se také označuje jako předpověď a je proces generování hodnot založených na školicím modelu strojového učení s ohledem na některá nová vstupní data. Hodnoty nebo hodnocení, které jsou vytvořeny, mohou představovat předpovědi budoucích hodnot, ale mohou představovat také pravděpodobně kategorii nebo výsledek. Význam skóre závisí na typu dat, která zadáte, a typu modelu, který jste vytvořili.

Vytváření a používání modelů v Machine Learning Studio (Classic)

Typický pracovní postup pro Machine Learning zahrnuje tyto fáze:

  • Výběr vhodného algoritmu a nastavení počátečních možností.
  • Školení modelu na kompatibilních datech.
  • Vytváření předpovědi pomocí nových dat na základě vzorů v modelu.
  • Vyhodnotili jste model, abyste zjistili, jestli je předpovědi přesné a kolik chyb má, a pokud existuje nějaké přeložení.

Machine Learning Studio (Classic) podporuje flexibilní, přizpůsobitelnou architekturu pro strojové učení. Každý úkol v tomto procesu provádí konkrétní typ modulu, který je možné upravit, přidat nebo odebrat, aniž by došlo k porušení zbytku experimentu.

Moduly v této části obsahují nástroje pro bodování. V této fázi strojového učení použijete školicí model pro nová data a vygenerujete předpovědi. Tyto předpovědi můžete buď Odeslat do aplikace, která využívá výsledky strojového učení, nebo výsledky vyhodnocování použít k vyhodnocení přesnosti a užitečnosti modelu.

Další informace o bodování

Bodování se v strojovém učení často používá k vytváření nových hodnot, s ohledem na model a nějaký nový vstup. Použije se obecný pojem "skóre", nikoli "předpověď", protože proces bodování může vygenerovat tolik různých typů hodnot:

  • Seznam doporučených položek a skóre podobnosti.
  • Číselné hodnoty pro modely časových řad a regresní modely.
  • Hodnota pravděpodobnosti, která indikuje pravděpodobnost, že nový vstup patří do některé existující kategorie.
  • Název kategorie nebo clusteru, na který je nová položka podobná.
  • Předpokládaná třída nebo výsledek pro modely klasifikace.

Poznámka

Možná jste si také vyslyšeli skóre slova, které se používá k tomu, aby se znamenala váha nebo hodnota přiřazená v důsledku analýzy dat. V Machine Learning Studio (Classic) se však bodování obvykle označuje jako proces generování předpokládaných hodnot z nových dat.

Když do experimentu přidáte jeden z těchto modulů, musíte připojit již vyškolený model strojového učení a některá nová data. Když spustíte experiment nebo vybraný modul, modul bodování podrží nová data, vypočítá skóre na základě modelu a vrátí skóre v tabulce.

Data použitá pro bodování

Nová data, která zadáte jako vstup, musí mít stejné sloupce, které byly použity ke výukě modelu, mínus sloupec popisku nebo výsledek.

Sloupce, které jsou používány výhradně jako identifikátory, jsou obvykle vyloučeny při výuce modelu, a proto by měly být při vyhodnocování i vyloučeny. Nicméně identifikátory, jako jsou primární klíče, lze snadno znovu zkombinovat s datovou sadou dat bodování později pomocí modulu Přidat sloupce . Tento modul funguje bez nutnosti zadat klíč JOIN, pokud se velikost datové sady nezměnila.

Před provedením bodování pro datovou sadu vždy vyhledejte chybějící hodnoty a hodnoty null. Když data použitá jako vstup pro bodování obsahují hodnoty, použijí se jako vstupy chybějící hodnoty. Vzhledem k tomu, že se šíří hodnoty null, je výsledkem obvykle chybějící hodnota.

Seznam modulů bodování

Machine Learning Studio (Classic) poskytuje mnoho různých modulů bodování. Jednu vyberte v závislosti na typu modelu, který používáte, nebo typu vyhodnocování úlohy, kterou provádíte:

  • Použít transformaci: aplikuje dobře specifikovanou transformaci dat na datovou sadu.

    Tento modul použijte k použití uloženého procesu pro sadu dat.

  • Přiřazení dat ke clusterům: přiřadí data do clusterů pomocí existujícího modelu proučeného clusteringu.

    Tento modul použijte v případě, že chcete clusterovat nová data založená na stávajícím modelu clusteringu.

    Tento modul nahrazuje modul přiřadit k clusterům (nepoužívanému), který je zastaralý, ale je stále k dispozici pro použití v existujících experimentech.

  • Matchbox doporučuje: hodnocení předpovědi pro datovou sadu pomocí doporučení Matchbox.

    Tento modul použijte, pokud chcete vygenerovat doporučení, najít související položky nebo uživatele nebo odhadnout hodnocení.

  • Model skóre: skóre předpovědi pro vyškolený model klasifikace nebo regrese.

    Tento modul použijte pro všechny ostatní modely regrese a klasifikace a také některé modely detekce anomálií.

Příklady

Tyto příklady v Azure AI Gallery předvádějí proces bodování ze základních do pokročilých scénářů:

Následující články poskytují reálné příklady, jak můžete použít model strojového učení pro účely bodování:

Viz také