Clustering-Module

In diesem Artikel werden die Module in Azure Machine Learning Studio (klassisch) beschrieben, die die Erstellung von Clustering-Modellen unterstützen.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Was ist Clustering?

Clustering ist in Machine Learning eine Methode zum Gruppieren von Datenpunkten in ähnliche Cluster. Sie wird auch als Segmentierung bezeichnet.

Im Laufe der Jahre wurden viele Clustering-Algorithmen entwickelt. Fast alle Clustering-Algorithmen verwenden die Features einzelner Elemente, um ähnliche Elemente zu suchen. Beispielsweise können Sie Clustering anwenden, um ähnliche Personen durch Demographics zu suchen. Sie können Clustering mit Textanalyse verwenden, um Sätze mit ähnlichen Themen oder Stimmungen zu gruppieren.

Clustering wird als nicht überwachtes Lernverfahren bezeichnet, da es in Daten ohne Bezeichnung verwendet werden kann. In der Tat ist Clustering ein nützlicher erster Schritt zum Ermitteln neuer Muster und erfordert wenig Vorkenntnisse darüber, wie die Daten strukturiert werden können oder wie Elemente verknüpft sind. Clustering wird häufig zum Durchsuchen von Daten vor der Analyse mit anderen weiteren Vorhersage Algorithmen verwendet.

Erstellen eines Clusteringmodells

In Machine Learning Studio (klassisch) können Sie Clustering mit Daten mit oder ohne Bezeichnung verwenden.

  • In Daten ohne Bezeichnung bestimmt der Clustering-Algorithmus, welche Datenpunkte sich am nächsten befinden, und erstellt Cluster um einen zentralen Punkt oder einen Schwerpunkt. Anschließend können Sie die Cluster-ID als temporäre Bezeichnung für die Gruppe der Daten verwenden.

  • Wenn die Daten Bezeichnungen enthalten, können Sie die Anzahl der Cluster mithilfe der Bezeichnung Steuern oder die Bezeichnung als eine andere Funktion verwenden.

Nachdem Sie den Clustering-Algorithmus konfiguriert haben, trainieren Sie ihn mit den Modulen Train Clustering Model oder Sweep Clustering .

Wenn das Modell trainiert wird, verwenden Sie es, um die Cluster Mitgliedschaft für neue Datenpunkte vorherzusagen. Wenn Sie z. b. Clustering verwendet haben, um Kunden nach dem Kaufverhalten zu gruppieren, können Sie das Modell verwenden, um das Kaufverhalten von neuen Kunden vorherzusagen.

Liste der Module

Die Kategorie Clustering umfasst das folgende Modul:

Informationen zur Verwendung eines anderen Clustering-Algorithmus oder zum Erstellen eines benutzerdefinierten Clusteringmodells mithilfe von R finden Sie in den folgenden Themen:

Beispiele

Beispiele für das Clustering in Aktion finden Sie in der Azure AI Gallery.

Hilfe bei der Auswahl eines Algorithmus finden Sie in diesen Artikeln:

Weitere Informationen