Trénování modelu clusteringu

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Navlakuje model clusteringu a přiřazuje data ze školicí sady do clusterů.

kategorie: Machine Learning/výuka

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak pomocí modulu výuka clusteringu clustering v Machine Learning studiu (classic) naučit Model clusteringu.

Modul převezme provedený model clusteringu, který jste už nakonfigurovali pomocí technologie K-označuje modul clusteringu a navlakuje model pomocí označené nebo neoznačené sady dat. Modul vytvoří jak vyškolený model, který můžete použít pro předpověď, a sadu přiřazení clusteru pro každý případ v školicích datech.

Poznámka

Model clusteringu nejde se vyškole pomocí modulu výuka modelu , který je obecným modulem pro vytváření modelů strojového učení. Důvodem je to, že model výuky funguje jenom se základními algoritmy učení. K-znamená a další algoritmy clusteringu umožňují bezdohledné učení, což znamená, že se algoritmus může naučit z neoznačených dat.

Použití modelu výukového clusteringu

  1. Přidejte modul pro vytváření clusterů výukového modelu do experimentu v studiu (Classic). modul najdete v části Machine Learning modulyv kategorii vlaků .

  2. Přidejte modul pro clusteringu, který je prostředkem pro clustering , nebo jiný vlastní modul, který vytvoří kompatibilní model clusteringu, a nastavte parametry modelu clusteringu.

  3. Připojte školicí datovou sadu k pravému vstupu modelu clusteringu s výukou.

  4. V části sada sloupcůvyberte sloupce z datové sady, které chcete použít při vytváření clusterů. Nezapomeňte vybrat sloupce, které mají dobré funkce, například Vyhněte se použití ID nebo jiných sloupců, které mají jedinečné hodnoty, nebo sloupců, které mají všechny stejné hodnoty.

    Pokud je popisek k dispozici, můžete ho buď použít jako funkci, nebo ho nechat zapnutý.

  5. Vyberte možnost a zaškrtněte políčko připojit nebo zrušit zaškrtnutí pouze pro výsledek, pokud chcete výstup školicích dat společně s novým označením clusteru.

    Pokud zrušíte výběr této možnosti, budou výstupem pouze přiřazení clusteru.

  6. Spusťte experiment nebo klikněte na modul výukového modelu clusteringu a vyberte Spustit vybrané.

Výsledky

Po dokončení školení:

  • Chcete-li zobrazit cluster a jejich oddělení v grafu, klikněte pravým tlačítkem na výstup datové sady výsledků a vyberte vizualizovat.

    Graf představuje hlavní komponenty clusteru, nikoli skutečné hodnoty. Další informace najdete v tématu Analýza hlavní komponenty .

  • Chcete-li zobrazit hodnoty v datové sadě, přidejte instanci modulu převést do datové sady a připojte ji k výstupu datové sady výsledků . Spusťte modul převést do datové sady , který načte kopii dat, která můžete zobrazit nebo stáhnout.

  • Pokud chcete vyškolený model Uložit pro pozdější opětovné použití, klikněte pravým tlačítkem myši na modul, vyberte trained modela klikněte na Uložit jako trained model.

  • K vygenerování skóre z modelu použijte přiřazení dat do clusterů.

Příklady

Příklad toho, jak se Clustering používá ve službě Machine Learning, najdete v Azure AI Gallery:

Očekávané vstupy

Název Typ Description
Nevlakový model Rozhraní ICluster Nevlakový model clusteringu
Datová sada Tabulka dat Vstupní zdroj dat

Parametry modulu

Name Rozsah Typ Výchozí Description
Sada sloupců Libovolný ColumnSelection Vzor výběru sloupce
Kontrolovat pouze výsledek připojení nebo zrušení kontroly Libovolný Logická hodnota true Zda výstupní datová sada musí obsahovat vstupní datovou sadu, která je připojena sloupcem přiřazení (zaškrtnuto) nebo pouze sloupcem přiřazení (nezaškrtnuto)

Výstupy

Název Typ Description
Školený model Rozhraní ICluster Model proučeného clusteringu
Datová sada výsledků Tabulka dat Vstupní datová sada, která je připojena datovým sloupcem pro přiřazení nebo sloupce přiřazení

Výjimky

Výjimka Description
Chyba 0003 K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.

seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.

seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.

Viz také

Seznam modulů a-Z
Trénování
Přiřazení dat do clusterů
Clustering K-Means