Trénování modelu clusteringu

Článek
05/06/2019

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
přečtěte si další informace o Azure Machine Learning.

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Navlakuje model clusteringu a přiřazuje data ze školicí sady do clusterů.

kategorie: Machine Learning/výuka

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak pomocí modulu výuka clusteringu clustering v Machine Learning studiu (classic) naučit Model clusteringu.

Modul převezme provedený model clusteringu, který jste už nakonfigurovali pomocí technologie K-označuje modul clusteringu a navlakuje model pomocí označené nebo neoznačené sady dat. Modul vytvoří jak vyškolený model, který můžete použít pro předpověď, a sadu přiřazení clusteru pro každý případ v školicích datech.

Poznámka

Model clusteringu nejde se vyškole pomocí modulu výuka modelu , který je obecným modulem pro vytváření modelů strojového učení. Důvodem je to, že model výuky funguje jenom se základními algoritmy učení. K-znamená a další algoritmy clusteringu umožňují bezdohledné učení, což znamená, že se algoritmus může naučit z neoznačených dat.

Použití modelu výukového clusteringu

Přidejte modul pro vytváření clusterů výukového modelu do experimentu v studiu (Classic). modul najdete v části Machine Learning modulyv kategorii vlaků .
Přidejte modul pro clusteringu, který je prostředkem pro clustering , nebo jiný vlastní modul, který vytvoří kompatibilní model clusteringu, a nastavte parametry modelu clusteringu.
Připojte školicí datovou sadu k pravému vstupu modelu clusteringu s výukou.
V části sada sloupcůvyberte sloupce z datové sady, které chcete použít při vytváření clusterů. Nezapomeňte vybrat sloupce, které mají dobré funkce, například Vyhněte se použití ID nebo jiných sloupců, které mají jedinečné hodnoty, nebo sloupců, které mají všechny stejné hodnoty.

Pokud je popisek k dispozici, můžete ho buď použít jako funkci, nebo ho nechat zapnutý.
Vyberte možnost a zaškrtněte políčko připojit nebo zrušit zaškrtnutí pouze pro výsledek, pokud chcete výstup školicích dat společně s novým označením clusteru.

Pokud zrušíte výběr této možnosti, budou výstupem pouze přiřazení clusteru.
Spusťte experiment nebo klikněte na modul výukového modelu clusteringu a vyberte Spustit vybrané.

Výsledky

Po dokončení školení:

Chcete-li zobrazit cluster a jejich oddělení v grafu, klikněte pravým tlačítkem na výstup datové sady výsledků a vyberte vizualizovat.

Graf představuje hlavní komponenty clusteru, nikoli skutečné hodnoty. Další informace najdete v tématu Analýza hlavní komponenty .
Chcete-li zobrazit hodnoty v datové sadě, přidejte instanci modulu převést do datové sady a připojte ji k výstupu datové sady výsledků . Spusťte modul převést do datové sady , který načte kopii dat, která můžete zobrazit nebo stáhnout.
Pokud chcete vyškolený model Uložit pro pozdější opětovné použití, klikněte pravým tlačítkem myši na modul, vyberte trained modela klikněte na Uložit jako trained model.
K vygenerování skóre z modelu použijte přiřazení dat do clusterů.

Příklady

Příklad toho, jak se Clustering používá ve službě Machine Learning, najdete v Azure AI Gallery:

Clusteringu: Vyhledání podobných společností: ukazuje, jak používat clusteringu u atributů odvozených z nestrukturovaného textu.
Clustering: Color kvantizační: ukazuje, jak pomocí clusteringu najít související barvy a snížit počet bitů použitých v obrázcích.
Clusteringu: seskupit data Iris: poskytuje jednoduchý příklad clusteringu na základě datové sady Iris.

Očekávané vstupy

Název	Typ	Description
Nevlakový model	Rozhraní ICluster	Nevlakový model clusteringu
Datová sada	Tabulka dat	Vstupní zdroj dat

Parametry modulu

Name	Rozsah	Typ	Výchozí	Description
Sada sloupců	Libovolný	ColumnSelection		Vzor výběru sloupce
Kontrolovat pouze výsledek připojení nebo zrušení kontroly	Libovolný	Logická hodnota	true	Zda výstupní datová sada musí obsahovat vstupní datovou sadu, která je připojena sloupcem přiřazení (zaškrtnuto) nebo pouze sloupcem přiřazení (nezaškrtnuto)

Výstupy

Název	Typ	Description
Školený model	Rozhraní ICluster	Model proučeného clusteringu
Datová sada výsledků	Tabulka dat	Vstupní datová sada, která je připojena datovým sloupcem pro přiřazení nebo sloupce přiřazení

Výjimky

Výjimka	Description
Chyba 0003	K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.

seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.

seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.

Viz také

Seznam modulů a-Z
Trénování
Přiřazení dat do clusterů
Clustering K-Means