Sdílet prostřednictvím


Moduly clusteringu

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Tento článek popisuje moduly v Machine Learning Studiu (klasickém), které podporují vytváření modelů clusteringu.

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Co je clustering?

Clustering ve strojové učení je metoda seskupení datových bodů do podobných shluků. Říká se jí také segmentace.

V průběhu let bylo vyvinuto mnoho algoritmů clusteringu. Téměř všechny algoritmy clusteringu používají funkce jednotlivých položek k nalezení podobných položek. Clustering můžete například použít k nalezení podobných lidí podle demografických údajů. Pomocí clusteringu s analýzou textu můžete seskupit věty s podobnými tématy nebo zabarvením.

Clustering se nazývá technika učení bez dohledu, protože se může používat v neoznačených datech. Clustering je skutečně užitečným prvním krokem pro zjišťování nových vzorů a vyžaduje jen málo předchozích znalostí o tom, jak můžou být data strukturovaná nebo jak jsou položky spojené. Clustering se často používá ke zkoumání dat před analýzou s jinými prediktivními algoritmy.

Vytvoření modelu clusteringu

V Machine Learning Studio (classic) můžete clustering používat s daty označenými popisky nebo s neoznačených daty.

  • V neoznačených datech algoritmus clusteringu určuje, které datové body jsou nejblíže k sobě, a vytváří shluky kolem centrálního bodu nebo centroidu. ID clusteru pak můžete použít jako dočasný popisek pro skupinu dat.

  • Pokud data mají popisky, můžete použít popisek k řízení počtu shluků nebo použít popisek jako jen další funkci.

Po nakonfigurování algoritmu clusteringu ho vytrénujete na data pomocí modulů Trénování modelu clusteringu nebo Sweep Clustering .

Když je model vytrénovaný, použijte ho k předpovídání členství v clusteru pro nové datové body. Pokud jste například použili clustering k seskupení zákazníků podle nákupního chování, můžete model použít k předpovídání nákupního chování nových zákazníků.

Seznam modulů

Kategorie clusteringu zahrnuje tento modul:

Pokud chcete použít jiný algoritmus clusteringu nebo vytvořit vlastní model clusteringu pomocí R, projděte si tato témata:

Příklady

Příklady clusteringu v akci najdete v Azure AI Gallery.

Nápovědu k výběru algoritmu najdete v těchto článcích:

Viz také