Trainieren eines Clusteringmodells

Dieser Artikel beschreibt eine Komponente im Azure Machine Learning-Designer.

Verwenden Sie diese Komponente, um ein Clusteringmodell zu trainieren.

In dieser Komponente wird ein untrainiertes Clusteringmodell verwendet, das Sie bereits mithilfe der Komponente K-Means Clustering konfiguriert haben. Die Komponente trainiert das Modell mit einem bezeichneten oder nicht bezeichneten Dataset. Die Komponente erstellt sowohl ein trainiertes Modell, das Sie für Vorhersagen verwenden können, als auch eine Reihe von Clusterzuweisungen für jeden Fall in den Trainingsdaten.

Hinweis

Ein Clusteringmodell kann nicht mit der Komponente Train Model (Modell trainieren) trainiert werden, bei der es sich um die generische Komponente zum Training von Machine Learning-Modellen handelt. Das liegt daran, dass Train Model nur mit überwachten Lernalgorithmen funktioniert. k-Means- und andere Clusteringalgorithmen ermöglichen unüberwachtes Lernen, was bedeutet, dass der Algorithmus aus unbezeichneten Daten lernen kann.

Verwenden des Moduls „Train Clustering Model“

  1. Fügen Sie die Komponente Train Clustering Model (Clusteringmodell trainieren) Ihrer Pipeline im Designer hinzu. Sie finden die Komponente unter den Machine Learning-Komponenten in der Kategorie Train (Trainieren).

  2. Fügen Sie die Komponente K-Means Clustering oder eine andere benutzerdefinierte Komponente hinzu, mit der ein kompatibles Clusteringmodell erstellt wird, und legen Sie dessen Parameter fest.

  3. Fügen Sie das Trainingsdataset an die rechte Eingabe von Train Clustering Model an.

  4. Wählen Sie unter Column Set (Spaltengruppe) die Spalten aus dem Dataset aus, die zum Erstellen von Clustern verwendet werden sollen. Achten Sie darauf, Spalten auszuwählen, die gute Features bieten. Vermeiden Sie z.B. die Verwendung von IDs oder anderen Spalten mit eindeutigen oder identischen Werten.

    Wenn eine Bezeichnung verfügbar ist, können Sie sie entweder als Feature verwenden oder weglassen.

  5. Aktivieren Sie die Option Check for Append or Uncheck for Result Only (Für Anfügen aktivieren oder für reines Ergebnis deaktivieren), wenn Sie die Trainingsdaten zusammen mit der neuen Clusterbezeichnung ausgeben möchten.

    Wenn Sie diese Option deaktivieren, werden nur die Clusterzuweisungen ausgegeben.

  6. Übermitteln Sie die Pipeline, oder klicken Sie auf die Komponente Train Clustering Model (Clusteringmodell trainieren) und dann auf Auswahl ausführen.

Ergebnisse

Nach Abschluss des Trainings:

  • Um eine Momentaufnahme des trainierten Modells zu speichern, wählen Sie die Registerkarte Ausgaben im rechten Bereich der Komponente Train model (Modell trainieren) aus. Wählen Sie das Symbol Dataset registrieren aus, um das Modell als wiederverwendbare Komponente zu speichern.

  • Verwenden Sie zum Generieren von Ergebnissen aus dem Modell Assign Data to Clusters (Zuweisen von Daten zu Clustern).

Hinweis

Wenn Sie das trainierte Modell im Designer bereitstellen müssen, vergewissern Sie sich, dass in der Rückschlusspipeline die Option Assign Data to Clusters (Clustern Daten zuweisen) anstelle von Score Model (Modell bewerten) mit der Eingabe der Komponente Web Service Output (Webdienstausgabe) verbunden ist.

Nächste Schritte

Siehe die Sammlung der für Azure Machine Learning verfügbaren Komponenten.