Score Matchbox Recommender

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Bewertet Vorhersagen für ein Dataset mithilfe des Matchbox-Empfehlungssystems.

Kategorie: Machine Learning/Bewertung

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Score Matchbox Recommender in Machine Learning Studio (klassisch) verwenden, um Vorhersagen basierend auf einem trainierten Empfehlungsmodell basierend auf dem Matchbox-Algorithmus von Microsoft Research zu erstellen.

Der Matchbox-Empfehlungser kann vier verschiedene Arten von Vorhersagen generieren:

Wenn Sie die letzten drei Arten von Vorhersagen erstellen, können Sie entweder im Produktionsmodus oder im Auswertungsmodus arbeiten.

  • Im Produktionsmodus werden alle Benutzer oder Elemente berücksichtigt und normalerweise in einem Webdienst verwendet.

    Sie können Scores auch für neue Benutzer erstellen, nicht nur für Benutzer, die während des Trainings angezeigt werden. Weitere Informationen finden Sie in diesem Abschnitt.

  • Der Auswertungsmodus arbeitet mit einer reduzierten Gruppe von Benutzern oder Elementen, die ausgewertet werden können, und wird normalerweise beim Experimentieren verwendet.

Tipp

Erfahren Sie in diesem Tutorial vom .NET-Entwicklungsteam alles, was Sie über die End-to-End-Erfahrung beim Erstellen eines Empfehlungssystems wissen müssen. Enthält Beispielcode und eine Erörterung, wie Sie Machine Learning aus einer Anwendung aufrufen.

Erstellen einer Empfehlungs-Engine für .NET-Anwendungen mit Machine Learning

Weitere Informationen zum Matchbox-Empfehlungser

Das Ziel der Erstellung eines Empfehlungssystems besteht im Empfehlen eines oder mehrere "Elemente" für "Benutzer" des Systems. Beispiele für Elemente sind Filme, Restaurants, Bücher oder Songs. Ein Benutzer kann eine Person, eine Gruppe von Personen oder eine andere Entität mit Elementeinstellungen sein.

Es gibt zwei grundlegende Ansätze für Empfehlungssysteme. Der erste ist der inhaltsbasierte Ansatz, der Features für Benutzer und Elemente nutzt. Benutzer können durch Eigenschaften wie Alter und Geschlecht beschrieben werden und Elemente durch Eigenschaften wie Autor und Hersteller. Typische Beispiele für inhaltsbasierte Empfehlungssysteme finden Sie auf Partnersuche-Websites. Der zweite Ansatz ist die kollaborative Filterung, bei der nur Bezeichner der Benutzer und Elemente verwendet werden und implizite Informationen zu diesen Entitäten aus einer (Sparse-)Matrix von Bewertungen abgerufen werden, die von den Benutzern für die Elemente abgegeben wurden. Wir können etwas über einen Benutzer von den bewerteten Elementen und von anderen Benutzern erfahren, die dieselben Elemente bewertet haben.

Beim Matchbox-Empfehlungssystem wird das kollaborative Filtern mit einem inhaltsbasierten Ansatz kombiniert. Es handelt sich dabei somit um ein hybrides Empfehlungsmodul. Wenn ein Benutzer relativ neu für das System ist, werden Vorhersagen mithilfe von Merkmalinformationen über den Benutzer verbessert. Auf diese Weise wird das allgemein bekannte „Kaltstart“-Problem in Angriff genommen. Wenn jedoch eine ausreichende Menge von Bewertungen eines bestimmten Benutzers vorhanden ist, können vollständig personalisierte Vorhersagen für diesen basierend auf seinen spezifischen Bewertungen, und nicht seinen Merkmalen allein, formuliert werden. Der Übergang von inhaltsbasierten Empfehlungen zu Empfehlungen, die auf kollaborativem Filtern basieren, ist daher nahtlos. Auch wenn Benutzer- oder Elementfeatures nicht verfügbar sind, funktioniert Matchbox weiterhin im gemeinsamen Filtermodus.

Weitere Informationen zum Matchbox-Empfehlungssystem und diesem zugrunde gelegten probabilistischen Algorithmus finden Sie im entsprechenden Forschungsbericht:

Beispiele

Beispiele zum Erstellen von Bewertungen aus einer Empfehlungs-Engine finden Sie im Azure KI-Katalog.

  • Empfehlung: Filmempfehlung: Dieses Beispiel veranschaulicht die Elementempfehlung, bei der es sich bei den Elementen um Filme handelt, und veranschaulicht auch die Bewertungsvorhersage.

  • Empfehlung: Restaurantbewertungen: In diesem Beispiel werden Elementempfehlungen mithilfe von Elementfeatures und Benutzerfeatures veranschaulicht.

  • Empfehlungen Everywhere: Dieser Blogbeitrag bietet eine umfassende Einführung in Empfehlungssysteme mit vielen visuellen Hilfsmitteln.

Konfigurieren von Score Matchbox Recommender

Dieses Modul unterstützt verschiedene Arten von Empfehlungen, die jeweils unterschiedliche Anforderungen aufweisen. Klicken Sie auf den Link für den Typ Ihrer Daten und die Art der Empfehlung, die Sie erstellen möchten.

Vorhersagen von Bewertungen

Wenn Sie Bewertungen vorhersagen, berechnet das Modell anhand der Trainingsdaten, wie ein Benutzer auf ein bestimmtes Element reagiert. Daher müssen die Eingabedaten für die Bewertung sowohl einen Benutzer als auch das zu bewertende Element bereitstellen.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungsmodell hinzu, und verbinden Sie es mit dem Trained Matchbox-Empfehlungser. Sie müssen das Modell mit Train Matchbox Recommender erstellen.

  2. Vorhersageart des Empfehlungsmoduls: Wählen Sie Rating Prediction (Bewertungsvorhersage) aus. Es sind keine weiteren Parameter erforderlich.

  3. Fügen Sie die Daten hinzu, für die Sie Vorhersagen erstellen möchten, und verbinden Sie sie mit dem zu bewertenden Dataset.

    Zum Vorhersagen von Bewertungen muss das Eingabedataset Benutzer-Element-Paare enthalten.

    Das Dataset kann eine optionale dritte Spalte mit Bewertungen für das Benutzer-Element-Paar in der ersten und zweiten Spalte enthalten, diese dritte Spalte wird jedoch bei der Vorhersage ignoriert.

  4. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Das Dataset der Benutzerfeatures muss die Benutzer-IDs in der ersten Spalte enthalten. Die restlichen Spalten sollten Werte enthalten, die die Benutzer charakterisieren, z B. Geschlecht, Vorlieben, Standort usw.

    Features von Benutzern, die Elemente bewertet haben, werden von Score Matchbox Recommender ignoriert, da sie bereits während des Trainings erlernt wurden. Filtern Sie Ihr Dataset daher im Voraus, um nur Kaltstartbenutzer oder Benutzer, die keine Elemente bewertet haben, zu berücksichtigen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzerfeatures trainiert wurde, können Sie während der Bewertung keine Benutzerfeatures einführen.

  5. Wenn Sie ein Dataset mit Elementfeatures haben, können Sie es mit Elementfeatures verbinden.

    Das Dataset mit Elementfeatures muss einen Elementbezeichner in der ersten Spalte enthalten. Die übrigen Spalten enthalten Werte, die die Elemente charakterisieren.

    Features bewerteter Elemente werden von Score Matchbox Recommender ignoriert, da sie bereits während des Trainings erlernt wurden. Beschränken Sie Ihr Bewertungsdataset daher auf Kaltstartelemente oder auf Elemente, die nicht von Benutzern bewertet wurden.

    Warnung

    Wenn das Modell ohne Verwendung von Elementfeatures trainiert wurde, können Sie während der Bewertung keine Elementfeatures einführen.

  6. Verwenden Sie den optionalen fünften Eingabeport namens Trainings-Dataset, um Elemente, die bereits bewertet wurden, aus den Vorhersageergebnissen zu entfernen.

    Um diesen Filter anzuwenden, verbinden Sie das ursprüngliche Trainingsdataset mit dem Eingabeport.

  7. Führen Sie das Experiment aus.

Ergebnisse der Bewertungsvorhersagen

Das Ausgabedataset enthält drei Spalten, die den Benutzer, das Element und die vorhergesagte Bewertung für jeden Benutzer und jedes Element des Eingabe enthalten.

Außerdem werden während der Bewertung die folgenden Änderungen angewendet:

  • Fehlende Werte in Benutzer- oder Elementfunktionsspalten werden automatisch durch den Modus der nicht fehlenden Trainingssatzwerte ersetzt.

  • Alle Benutzer- und Elementfeatures werden um die entsprechenden maximalen absoluten Werte im Training neu skaliert.

  • Bei Featurewerten wird keine Übersetzung angewendet, um eine geringe Datendichte aufrechtzuerhalten.

  • Merkmale mit Zeichenfolgenwerten werden in ein Set von Indikatormerkmalen mit Binärwerten konvertiert.

Empfehlen

Zum Empfehlen von Elementen für Benutzer geben Sie eine Liste von Benutzern und Elementen als Eingabe an. Aus diesen Daten generiert das Modell anhand seiner Kenntnisse über vorhandene Elemente und Benutzer eine Liste von Elementen, die für den jeweiligen Benutzer wahrscheinlich attraktiv sind. Sie können die Anzahl der zurückgegebenen Empfehlungen anpassen und einen Schwellenwert für die Anzahl der vorherigen Empfehlungen festlegen, die zum Generieren einer Empfehlung erforderlich sind.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungsmodell hinzu, und verbinden Sie es mit dem Trained Matchbox-Empfehlungser. Sie müssen das Modell mit Train Matchbox Recommender erstellen.

  2. Um einer bestimmten Liste von Benutzern Elemente zu empfehlen, legen Sie Recommender prediction kind (Vorhersageart des Empfehlungsmoduls) auf Item Recommendation (Elementempfehlung) fest.

  3. Recommended item selection (Empfohlene Elementauswahl): Geben Sie an, ob Sie das Bewertungsmodul in der Produktion oder für die Modellauswertung verwenden, indem Sie einen der folgenden Werte auswählen:

    • From Rated Items (for model evaluation) (Aus bewerteten Elementen (für Modellauswertung)): Wählen Sie diese Option aus, wenn Sie ein Modell entwickeln oder testen. Diese Option aktiviert den Auswertungsmodus, und das Modul gibt Empfehlungen nur für die Elemente im eingegebenen Dataset aus, die bewertet wurden.

    • From All Items (Aus allen Elementen): Wählen Sie diese Option aus, wenn Sie ein Experiment für die Verwendung in einem Webdienst oder in der Produktion einrichten. Diese Option aktiviert den Produktionsmodus, und das Modul gibt Empfehlungen für alle Elemente aus, die während des Trainings aufgetreten sind.

  4. Fügen Sie das Dataset hinzu, für das Sie Vorhersagen erstellen möchten, und verbinden Sie es mit dem zu bewertenden Dataset.

    • Für die Option From All Items (Aus allen Elementen) muss das Eingabedataset aus nur einer Spalte mit den Bezeichnern von Benutzern bestehen, für die Empfehlungen gegeben werden sollen.

      Wenn das Dataset mehr als eine Spalte enthält, wird ein Fehler ausgelöst. Verwenden Sie das Modul Select Columns in Dataset (Spalten im Dataset auswählen), um zusätzliche Spalten aus dem Eingabe-Dataset zu entfernen.

    • Wenn Sie die Option From Rated Items (for model evaluation) (Aus bewerteten Elementen (für Modellauswertung)) auswählen, muss das Eingabedataset aus Benutzer-Element-Paaren bestehen. Die erste Spalte muss den Benutzerbezeichner enthalten. Die zweite Spalte muss die entsprechenden Elementbezeichner enthalten.

      Das Dataset kann eine dritte Spalte mit Benutzer-Element-Bewertungen enthalten, diese Spalte wird jedoch ignoriert.

  5. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Die erste Spalte des Datasets der Benutzerfeatures muss die Benutzer-IDs enthalten. Die restlichen Spalten sollten Werte enthalten, die den Benutzer charakterisieren, z B. Geschlecht, Vorlieben, Standort usw.

    Features von Benutzern, die Bewertete Elemente bewertet haben, werden von Score Matchbox Recommender ignoriert, da diese Features bereits während des Trainings erlernt wurden. Daher können Sie Ihr Dataset im Voraus filtern, um nur Kaltstartbenutzer oder Benutzer, die keine Elemente bewertet haben, zu berücksichtigen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzerfeatures trainiert wurde, können Sie während der Bewertung keine Features anwenden.

  6. (Optional) Wenn Sie ein Dataset mit Elementfeatures haben, können Sie es mit Elementfeatures verbinden.

    Die erste Spalte des Datasets mit Elementfeatures muss den Elementbezeichner enthalten. Die übrigen Spalten enthalten Werte, die die Elemente charakterisieren.

    Features bewerteter Elemente werden von Score Matchbox Recommender ignoriert, da diese Features bereits während des Trainings erlernt wurden. Daher können Sie Ihr Bewertungsdataset auf Kaltstartelemente oder auf Elemente beschränken, die nicht von Benutzern bewertet wurden.

    Warnung

    Verwenden Sie keine Elementfeatures für Bewertungen, wenn das Modell ohne Verwendung der Elementfeatures trainiert wurde.

  7. Maximum number of items to recommend to a user (Maximale Anzahl von Elementen, die einem Benutzer empfohlen werden sollen): Geben Sie die Anzahl der Elemente ein, die für jeden Benutzer zurückgegeben werden soll. Standardmäßig werden fünf Elemente empfohlen.

  8. Minimum size of the recommendation pool per user (Minimale Größe des Empfehlungspools pro Benutzer): Geben Sie einen Wert ein, der angibt, wie viele vorherige Empfehlungen erforderlich sind. Standardmäßig ist dieser Parameter auf 2 festgelegt. Das bedeutet, dass das Element von mindestens zwei anderen Benutzern empfohlen werden muss.

    Diese Option sollte nur verwendet werden, wenn Sie im Auswertungsmodus bewerten. Die Option ist nicht verfügbar, wenn Sie Aus allen Elementen auswählen.

  9. Führen Sie das Experiment aus.

Ergebnisse der Elementempfehlung

Das vom Score Matchbox Recommender zurückgegebene bewertete Dataset listet die empfohlenen Elemente für jeden Benutzer auf.

  • Die erste Spalte enthält die Benutzer-IDs.
  • Abhängig vom Wert, den Sie für Maximum number of items to recommend to a user (Maximale Anzahl von Elementen, die einem Benutzer empfohlen werden sollen) festgelegt haben, werden verschiedene zusätzliche Spalten generiert. Jede Spalte enthält ein empfohlenes Element (nach Bezeichner). Die Empfehlungen werden nach der Affinität zwischen Benutzer und Element geordnet, wobei das Element mit der höchsten Affinität in die Spalte Item 1 (Element 1) platziert wird.

Warnung

Dieses bewertete Dataset kann nicht mithilfe des Moduls Evaluate Recommender ausgewertet werden.

Suchen verwandter Benutzer

Die Option zum Suchen verwandter Benutzer ist nützlich, wenn Sie "Personen wie Sie" empfehlen oder einen Pool ähnlicher Benutzer erstellen, auf dem andere Arten von Vorhersagen erstellt werden sollen.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungsmodell hinzu, und verbinden Sie es mit dem Trained Matchbox-Empfehlungser. Sie müssen das Modell mit Train Matchbox Recommender erstellen.

  2. Empfehlungsvorhersageart: Wählen Sie Verwandte Benutzer aus.

  3. Verwandte Benutzerauswahl: Geben Sie an, wie Sie das Modell für die Bewertung verwenden, und geben Sie den Benutzerpool an, auf dem die Bewertungen wie folgt verwendet werden sollen:

    • Aus allen Benutzern: Wählen Sie diese Option aus, wenn Sie ein Experiment für die Verwendung in einem Webdienst oder einer Produktionsumgebung einrichten oder Vorhersagen für neue Benutzer treffen müssen. Diese Option aktiviert den Produktionsmodus, und das Modul basiert seine Empfehlung nur auf Benutzern, die während des Trainings angezeigt werden.

    • Von Benutzern, die Elemente bewertet haben (für die Modellauswertung): Wählen Sie diese Option aus, wenn Sie ein Modell entwickeln oder testen. Diese Option aktiviert den Auswertungsmodus, und das Modell basiert seine Empfehlungen auf den Benutzern im Testsatz, die einige allgemeine Elemente bewertet haben.

  4. Verbinden Ein Dataset, das die Benutzer enthält, für die Vorhersagen generiert werden. Das Format für dieses Dataset hängt davon ab, ob Sie das Bewertungsmodul im Produktions- oder Auswertungsmodus verwenden.

    • Produktionsmodus mit From All Items

      Das zu bewertungsbezogene Dataset muss aus Benutzern bestehen, für die Sie verwandte Benutzer suchen möchten. Die erste und einzige Spalte sollte die Benutzer-IDs enthalten. Wenn andere Spalten eingeschlossen werden, wird ein Fehler ausgelöst. Verwenden Sie das Modul Select Columns in Dataset (Spalten im Dataset auswählen), um unnötige Spalten zu entfernen.

    • Auswertungsmodus mit from Rated Items (für die Modellauswertung)

      Das zu bewertungsbasierte Dataset sollte aus 2 bis 3 Spalten bestehen, die Benutzer-Element-Paare enthalten. Die erste Spalte sollte Benutzerbezeichner enthalten. Die zweite Spalte sollte Elementbezeichner enthalten. Das Dataset kann eine dritte Spalte mit Bewertungen enthalten (vom Benutzer in Spalte 1 für das Element in Spalte 2), aber die Spalte ratings wird ignoriert.

  5. Maximale Anzahl verwandter Benutzer, die für einen Benutzer zu finden sind: Geben Sie eine Zahl ein, die die maximale Anzahl von Vorhersagen angibt, die Sie für jeden Benutzer wünschen. Der Standardwert ist 5, was bedeutet, dass mindestens fünf verwandte Benutzer zurückgegeben werden können, aber in einigen Fällen weniger als 5 sind.

  6. Konfigurieren Sie im Auswertungsmodus (Von Benutzern, die Elemente bewertet haben) diese zusätzlichen Parameter:

    • Mindestanzahl von Elementen, die der Abfragebenutzer und der entsprechende Benutzer gemeinsam bewertet haben müssen: Dieser Wert legt einen Schwellenwert für Empfehlungen fest. Die Zahl, die Sie eingeben, stellt die Mindestanzahl von Elementen dar, die ihr Zielbenutzer und der potenzielle verwandte Benutzer bewertet haben müssen. Der Standardwert ist 2. Das bedeutet, dass mindestens zwei Elemente von beiden Benutzern bewertet worden sein müssen.

    • Mindestgröße des zugehörigen Benutzerpools für einen einzelnen Benutzer: Dieser Wert steuert die Mindestanzahl ähnlicher Benutzer, die zum Erstellen einer Empfehlung erforderlich sind. Standardmäßig ist der Wert 2. Wenn Sie also nur zwei Benutzer haben, die aufgrund der Bewertung der gleichen Elemente verknüpft sind, können Sie diese als verknüpft betrachten und eine Empfehlung generieren.

  7. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Die erste Spalte des Datasets der Benutzerfeatures muss die Benutzer-IDs enthalten. Die übrigen Spalten sollten Werte enthalten, die den Benutzer charakterisieren, z. B. Geschlecht, Einstellungen, Standort usw.

    Features von Benutzern, die Bewertete Elemente bewertet haben, werden von Score Matchbox Recommender ignoriert, da diese Features bereits während des Trainings erlernt wurden. Filtern Sie Ihr Dataset daher im Voraus, um nur Kaltstartbenutzer oder Benutzer, die keine Elemente bewertet haben, zu berücksichtigen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzerfeatures trainiert wurde, können Sie während der Bewertung keine Benutzerfeatures anwenden.

  8. (Optional) Wenn Sie über ein Dataset mit Elementfeatures verfügen, verbinden Sie es mit Item-Features.

    Die erste Spalte des Datasets mit Elementfeatures muss den Elementbezeichner enthalten. Die übrigen Spalten enthalten Werte, die die Elemente charakterisieren.

    Features bewerteter Elemente werden von Score Matchbox Recommender ignoriert, da diese Features bereits während des Trainings erlernt wurden. Daher können Sie Ihr Bewertungs-Dataset auf Kaltstartelemente oder Elemente beschränken, die nicht von Benutzern bewertet wurden.

    Warnung

    Verwenden Sie keine Elementfeatures für Bewertungen, wenn das Modell ohne Verwendung der Elementfeatures trainiert wurde.

  9. Führen Sie das Experiment aus.

Das von Score Matchbox Recommender zurückgegebene bewertungsbezogene Dataset listet die Benutzer auf, die mit den einzelnen Benutzern im Eingabe-Dataset verknüpft sind.

Für jeden im Eingabe-Dataset angegebenen Benutzer enthält das Ergebnis-Dataset eine Gruppe verwandter Benutzer.

  • Die erste Spalte enthält den Bezeichner des Zielbenutzers (der als Eingabe bereitgestellte Benutzer).

  • Es werden zusätzliche Spalten generiert, die die Bezeichner verwandter Benutzer enthalten. Die Anzahl zusätzlicher Spalten hängt vom Wert ab, den Sie in der Option Maximale Anzahl verwandter Benutzer festlegen, die für einen Benutzer zu finden sind.

    Verwandte Benutzer werden nach der Stärke der Beziehung zum Zielbenutzer geordnet, mit dem stark verknüpften Benutzer in der Spalte Verwandter Benutzer 1.

Suchen verwandter Elemente

Indem Sie verwandte Elemente vorhersagen, können Sie Empfehlungen für Benutzer basierend auf Elementen generieren, die bereits bewertet wurden.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungsmodell hinzu, und verbinden Sie es mit dem Trained Matchbox-Empfehlungser. Sie müssen das Modell mit Train Matchbox Recommender erstellen.

  2. Empfehlungsvorhersageart: Wählen Sie Verwandte Elemente aus.

  3. Verbinden Ein Dataset, das die Benutzer enthält, für die Vorhersagen generiert werden. Das Format für dieses Dataset hängt davon ab, ob Sie das Bewertungsmodul im Produktions- oder Auswertungsmodus verwenden.

    • Produktionsmodus mit From All Items

      Das zu bewertungsbezogene Dataset muss aus Elementen bestehen, für die Sie verwandte Benutzer suchen möchten.

      Die erste und einzige Spalte sollte die Elementbezeichner enthalten. Wenn andere Spalten eingeschlossen werden, wird ein Fehler ausgelöst. Verwenden Sie das Modul Select Columns in Dataset (Spalten im Dataset auswählen), um unnötige Spalten zu entfernen.

    • Auswertungsmodus mit from Rated Items (für die Modellauswertung)

      Das zu bewertungsbasierte Dataset sollte aus 2 bis 3 Spalten bestehen, die Benutzer-Element-Paare enthalten. Die erste Spalte sollte Benutzerbezeichner enthalten. Die zweite Spalte sollte Elementbezeichner enthalten.

      Das Dataset kann eine dritte Spalte mit Bewertungen enthalten (vom Benutzer in Spalte 1 für das Element in Spalte 2), aber die Spalte ratings wird ignoriert.

  4. Maximale Anzahl verwandter Elemente, die für ein Element zu suchen sind>: Geben Sie eine Zahl ein, die die maximale Anzahl von Vorhersagen angibt, die Sie für jedes Element wünschen.

    Der Standardwert ist 5, was bedeutet, dass mindestens fünf verwandte Elemente zurückgegeben werden können, aber möglicherweise weniger als 5 sind.

  5. Wenn Sie den Auswertungsmodus (From Users That Rated Items) verwenden, konfigurieren Sie diese zusätzlichen Parameter:

    • Mindestanzahl von Elementen, von denen das Abfrageelement und das zugehörige Element gemeinsam bewertet worden sein müssen: Dieser Wert legt einen Schwellenwert für Empfehlungen fest. Die Zahl, die Sie eingeben, stellt die Mindestanzahl von Elementen dar, die vom Zielbenutzer und einem verwandten Benutzer bewertet wurden. Der Standardwert ist 2. Das bedeutet, dass mindestens zwei Elemente vom Zielbenutzer und dem entsprechenden Benutzer bewertet worden sein müssen.

    • Mindestgröße des verknüpften Elementpools für ein einzelnes Element: Dieser Wert steuert die Mindestanzahl ähnlicher Elemente, die zum Erstellen einer Empfehlung erforderlich sind. Standardmäßig ist der Wert 2. Wenn Sie also nur über zwei Elemente verfügen, die aufgrund der Bewertung durch dieselben Benutzer verknüpft sind, können Sie sie als verknüpft betrachten und eine Empfehlung generieren.

  6. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Die erste Spalte des Datasets der Benutzerfeatures muss die Benutzer-IDs enthalten. Die restlichen Spalten sollten Werte enthalten, die den Benutzer charakterisieren, z B. Geschlecht, Vorlieben, Standort usw.

    Features von Benutzern, die Bewertete Elemente bewertet haben, werden von Score Matchbox Recommender ignoriert, da diese Features bereits während des Trainings erlernt wurden. Daher können Sie Ihr Dataset im Voraus filtern, um nur Kaltstartbenutzer oder Benutzer, die keine Elemente bewertet haben, zu berücksichtigen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzerfeatures trainiert wurde, können Sie während der Bewertung keine Benutzerfeatures anwenden.

  7. (Optional) Wenn Sie über ein Dataset mit Elementfeatures verfügen, können Sie es mit Elementfeatures verbinden.

    Die erste Spalte des Datasets mit Elementfeatures muss den Elementbezeichner enthalten. Die übrigen Spalten sollten Werte enthalten, die das Element charakterisieren.

    Features bewerteter Elemente werden von Score Matchbox Recommender ignoriert, da diese Features bereits während des Trainings erlernt wurden. Daher können Sie Ihr Bewertungs-Dataset auf Kaltstartelemente oder Elemente beschränken, die nicht von Benutzern bewertet wurden.

    Warnung

    Verwenden Sie keine Elementfeatures für Bewertungen, wenn das Modell ohne Verwendung der Elementfeatures trainiert wurde.

  8. (Optional) In einem Vorhersageexperiment können Sie einen fünften Eingabeport namens Trainings-Dataset verwenden, um vorhandene Benutzer, die in den Modelltrainingsdaten enthalten waren, aus den Vorhersageergebnissen zu entfernen.

    Um diesen Filter anzuwenden, verbinden Sie das ursprüngliche Trainingsdataset mit dem Eingabeport.

  9. Führen Sie das Experiment aus.

Das von Score Matchbox Recommender zurückgegebene bewertungsbezogene Dataset listet die zugehörigen Elemente für jedes Element im Eingabe-Dataset auf.

  • Die erste Spalte enthält den Bezeichner des Zielelements (das als Eingabe bereitgestellte Element).

  • Es werden zusätzliche Spalten generiert, die die Bezeichner verwandter Elemente enthalten. Die Anzahl zusätzlicher Spalten hängt vom Wert ab, den Sie in der Option Maximale Anzahl verknüpfter Elemente festlegen, die für ein Element zu suchen sind.

    Die verknüpften Elemente werden nach der Stärke der Beziehung zum Zielelement geordnet, mit dem am stärksten verknüpften Element in der Spalte Verknüpftes Element 1.

Technische Hinweise

Dieser Abschnitt enthält Antworten auf einige häufig gestellte Fragen zur Verwendung des Empfehlungsmoduls zum Erstellen von Vorhersagen.

Kaltstartbenutzer und Empfehlungen

In der Regel erfordert das Modul Score Matchbox Recommender dieselben Eingaben, die Sie beim Trainieren des Modells verwendet haben, einschließlich einer Benutzer-ID, um Empfehlungen zu erstellen. Dies liegt daran, dass der Algorithmus wissen muss, ob er während des Trainings etwas über diesen Benutzer gelernt hat.

Bei neuen Benutzern verfügen Sie aber möglicherweise nicht über eine Benutzer-ID, sondern nur über einige Features wie z. B. Alter, Geschlecht usw.

Sie können trotzdem Empfehlungen zu neuen Benutzern im System erstellen, indem Sie sie als Kaltstartbenutzer behandeln. Für solche Benutzer verwendet der Empfehlungsalgorithmus weder die Vorgeschichte noch vorherige Bewertungen, sondern nur Benutzerfeatures.

Zu Vorhersagezwecken wird ein Kaltstartbenutzer als Benutzer mit einer ID definiert, die nicht zum Trainieren verwendet wurde. Um sicherzustellen, dass die IDs nicht mit den im Training verwendeten IDs identisch sind, können Sie neue Bezeichner erstellen. Sie können beispielsweise zufällige IDs innerhalb eines bestimmten Bereichs erstellen oder Kaltstartbenutzern im Voraus eine Reihe von IDs zuweisen.

Wenn Sie keine gemeinsamen Filterdaten besitzen, z. B. einen Vektor der Benutzerfeatures, sollten Sie besser ein Klassifizierungs- oder Regressions-Lernmodul verwenden.

Verwendung des Matchbox-Empfehlungsers in der Produktion

Wenn Sie mit dem Matchbox-Empfehlungs- und anschließenden Verschieben des Modells in die Produktion experimentiert haben, beachten Sie diese wichtigen Unterschiede, wenn Sie das Empfehlungser im Auswertungsmodus und im Produktionsmodus verwenden:

  • Die Auswertung erfordert definitionsgemäß Vorhersagen, die anhand der grundlegende Wahrheit in einem Testsatz überprüft werden können. Wenn Sie das Empfehlungsmodul auswerten, dürfen daher nur Elemente vorhergesagt werden, die im Testsatz bewertet wurden. Dies schränkt notwendigerweise die möglichen vorhergesagten Werte ein.

    Wenn Sie das Modell jedoch operationalisieren, ändern Sie in der Regel den Vorhersagemodus, sodass Empfehlungen auf der Grundlage aller möglichen Elemente getroffen werden, um die besten Vorhersagen zu erhalten. Bei vielen dieser Vorhersagen gibt es keine entsprechende grundlegende Wahrheit, sodass die Genauigkeit der Empfehlung nicht wie beim Einstellen in Experimenten überprüft werden kann.

  • Wenn Sie in der Produktionsumgebung keine Benutzer-ID, sondern nur einen Featurevektor bereitstellen, erhalten Sie als Antwort unter Umständen eine Liste aller Empfehlungen für alle möglichen Benutzer. Achten Sie darauf, dass Sie eine Benutzer-ID angeben.

    Um die Anzahl der zurückgegebenen Empfehlungen zu beschränken, können Sie auch die maximale Anzahl der pro Benutzer zurückgegebenen Elemente angeben.

  • Es ist nicht möglich, Vorhersagen nur für Elemente zu generieren, die zuvor nicht bewertet wurden. Dies ist beabsichtigt.

    Der Grund dafür ist, dass das Empfehlungsmedium das gesamte Trainingsdatenset mit dem Modell speichern muss, um nur die Elemente zu empfehlen, die nicht bewertet wurden. Dies würde die Speichernutzung erhöhen.

    Wenn Sie nur Elemente empfehlen möchten, die der Benutzer noch nicht kennt, können Sie weitere zu empfehlende Elemente anfordern und dann die bewerteten manuell herausfiltern.

Fortlaufendes Update des Empfehlungsers

Die Onlineaktualisierung (oder kontinuierliches Training) eines Empfehlungsmodells wird derzeit in der Machine Learning. Wenn Sie Benutzerantworten auf Empfehlungen erfassen und diese zur Verbesserung des Modells verwenden möchten, empfehlen wir Ihnen, das vollständige Modell regelmäßig erneut zu trainingieren. Inkrementelles Training ist nicht möglich, aber Sie können ein gleitendes Fenster auf die Trainingsdaten anwenden, um sicherzustellen, dass das Datenvolumen bei Verwendung der neuesten Daten minimiert wird.

Erwartete Eingaben

Name Type Beschreibung
Trainiertes Matchbox-Empfehlungssystem ILearner Trainiertes Matchbox-Empfehlungssystem
Zu bewertendes Dataset Datentabelle Zu bewertendes Dataset
User features Datentabelle Dataset mit Merkmalen, die Benutzer beschreiben

Diese Daten sind optional.
Item features Datentabelle Dataset mit Merkmalen, die Elemente beschreiben

Diese Daten sind optional.

Modulparameter

Name Range type Standard Beschreibung
Recommender prediction kind Liste Art der Vorhersage Item Recommendation Angeben des Vorhersagetyps, den das Empfehlungsmodul ausgeben soll.
Empfohlene Elementauswahl Liste Elementauswahl From Rated Items (for model evaluation) Auswählen des Elementsatzes, aus dem Empfehlungen gegeben werden sollen.
Auswahl verwandter Benutzer Liste Benutzerauswahl From Users That Rated Items (for model evaluation) Auswählen der Gruppe von Benutzern, die beim Suchen verwandter Elemente verwendet werden soll.
Auswahl verwandter Elemente Liste [Elementauswahl From Rated Items (for model evaluation) Auswählen der Gruppe von Elementen, die beim Suchen verwandter Elemente verwendet werden soll.

Ausgaben

Name Type Beschreibung
Bewertetes Dataset Datentabelle Bewertetes Dataset

Ausnahmen

Ausnahme Beschreibung
Fehler 0022 Eine Ausnahme tritt auf, wenn die Anzahl der ausgewählten Spalten im Eingabedataset nicht mit der erwarteten Anzahl übereinstimmt.
Fehler 0036 Eine Ausnahme tritt auf, wenn mehrere Featurevektoren für einen bestimmten Benutzer oder ein bestimmtes Element bereitgestellt wurden.
Fehler 0013 Die Ausnahme tritt auf, wenn das an das Modul übergebene Lernmodul einen ungültigen Typ hat.
Fehler 0035 Eine Ausnahme tritt auf, wenn für einen bestimmten Benutzer oder ein bestimmtes Element keine Features bereitgestellt wurden.
Fehler 0053 Die Ausnahme tritt auf, wenn keine Benutzermerkmale oder Elemente für Matchbox-Empfehlungen vorhanden sind.
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Train Matchbox Recommender (Matchbox Recommender trainieren)
Evaluate Recommender
Wert