Score Matchbox Recommender

Bewertet Vorhersagen für ein Dataset mithilfe des Matchbox-Empfehlungssystems.

Kategorie: Machine Learning/Score

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Score matchbox-Empfehlungs Modul in Azure Machine Learning Studio (klassisch) verwenden, um basierend auf dem matchbox-Algorithmus von Microsoft Research Vorhersagen basierend auf einem trainierten Empfehlungs Modell zu erstellen.

Der Matchbox-Empfehlungs Dienst kann vier verschiedene Arten von Vorhersagen generieren:

Wenn Sie die letzten drei Arten von Vorhersagen erstellen, können Sie entweder im Produktions -oder Auswertungsmodus arbeiten.

  • Im Produktionsmodus werden alle Benutzer oder Elemente berücksichtigt und normalerweise in einem Webdienst verwendet.

    Sie können Scores auch für neue Benutzer erstellen, nicht nur für Benutzer, die während des Trainings angezeigt werden. Weitere Informationen finden Sie in diesem Abschnitt.

  • Der Auswertungsmodus arbeitet mit einer reduzierten Gruppe von Benutzern oder Elementen, die ausgewertet werden können, und wird normalerweise beim Experimentieren verwendet.

Tipp

Erfahren Sie alles, was Sie über die End-to-End-Entwicklung eines Empfehlungs Systems in diesem Tutorial aus dem .net-Entwicklungsteam wissen müssen. Enthält Beispielcode und Erörterung, wie Azure Machine Learning aus einer Anwendung aufgerufen wird.

Empfehlungs-Engine für .NET-Anwendungen mit Azure Machine Learning

Weitere Informationen zum matchbox-Empfehlungssystem

Das Ziel der Erstellung eines Empfehlungs Systems besteht darin, ein oder mehrere "Elemente" für "Benutzer" des Systems zu empfehlen. Beispiele für Elemente sind Filme, Restaurants, Bücher oder Songs. Ein Benutzer kann eine Person, eine Gruppe von Personen oder eine andere Entität mit Elementeinstellungen sein.

Es gibt zwei grundlegende Ansätze für Empfehlungssysteme. Der erste ist der inhaltsbasierte Ansatz, der Features für Benutzer und Elemente nutzt. Benutzer können durch Eigenschaften wie Alter und Geschlecht beschrieben werden und Elemente durch Eigenschaften wie Autor und Hersteller. Typische Beispiele für inhaltsbasierte Empfehlungssysteme finden Sie auf Partnersuche-Websites. Der zweite Ansatz ist die kollaborative Filterung, bei der nur Bezeichner der Benutzer und Elemente verwendet werden und implizite Informationen zu diesen Entitäten aus einer (Sparse-)Matrix von Bewertungen abgerufen werden, die von den Benutzern für die Elemente abgegeben wurden. Wir können etwas über einen Benutzer von den bewerteten Elementen und von anderen Benutzern erfahren, die dieselben Elemente bewertet haben.

Beim Matchbox-Empfehlungssystem wird das kollaborative Filtern mit einem inhaltsbasierten Ansatz kombiniert. Es handelt sich dabei somit um ein hybrides Empfehlungsmodul. Wenn ein Benutzer relativ neu für das System ist, werden Vorhersagen mithilfe von Merkmalinformationen über den Benutzer verbessert. Auf diese Weise wird das allgemein bekannte „Kaltstart“-Problem in Angriff genommen. Wenn jedoch eine ausreichende Menge von Bewertungen eines bestimmten Benutzers vorhanden ist, können vollständig personalisierte Vorhersagen für diesen basierend auf seinen spezifischen Bewertungen, und nicht seinen Merkmalen allein, formuliert werden. Der Übergang von inhaltsbasierten Empfehlungen zu Empfehlungen, die auf kollaborativem Filtern basieren, ist daher nahtlos. Auch wenn Benutzer-oder Element Features nicht verfügbar sind, funktioniert matchbox weiterhin im Zusammenarbeits Filter Modus.

Weitere Informationen zum Matchbox-Empfehlungssystem und diesem zugrunde gelegten probabilistischen Algorithmus finden Sie im entsprechenden Forschungsbericht:

Beispiele

Beispiele zum Erstellen von Bewertungen aus einem empfehlungsmodul finden Sie in der Azure AI Gallery.

  • Empfehlungen Everywhere: dieser Blogbeitrag bietet eine allgemeine Einführung in Empfehlungssysteme mit vielen visuellen Hilfen.

Vorgehensweise beim Konfigurieren der Score matchbox-Empfehlung

Dieses Modul unterstützt verschiedene Arten von Empfehlungen, die jeweils unterschiedliche Anforderungen aufweisen. Klicken Sie auf den Link für den Typ Ihrer Daten und die Art der Empfehlung, die Sie erstellen möchten.

Vorhersagen von Bewertungen

Wenn Sie Bewertungen vorhersagen, berechnet das Modell anhand der Trainingsdaten, wie ein Benutzer auf ein bestimmtes Element reagiert. Daher müssen die Eingabedaten für die Bewertung sowohl einen Benutzer als auch das zu bewertende Element bereitstellen.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungs Modell hinzu, und verbinden Sie es mit dem trainierten matchbox-Empfehlungs Modul. Sie müssen das Modell mit Train matchbox Empfehlungserstellen.

  2. Vorhersageart des Empfehlungsmoduls: Wählen Sie Rating Prediction (Bewertungsvorhersage) aus. Es sind keine weiteren Parameter erforderlich.

  3. Fügen Sie die Daten hinzu, für die Sie Vorhersagen erstellen möchten, und verbinden Sie sie mit dem zu bewertenden Dataset.

    Zum Vorhersagen von Bewertungen muss das Eingabedataset Benutzer-Element-Paare enthalten.

    Das Dataset kann eine optionale dritte Spalte mit Bewertungen für das Benutzer-Element-Paar in der ersten und zweiten Spalte enthalten, diese dritte Spalte wird jedoch bei der Vorhersage ignoriert.

  4. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Das Dataset der Benutzerfeatures muss die Benutzer-IDs in der ersten Spalte enthalten. Die restlichen Spalten sollten Werte enthalten, die die Benutzer charakterisieren, z B. Geschlecht, Vorlieben, Standort usw.

    Features von Benutzern, die Elemente bewertet haben, werden von Score matchbox Empfehlungs ignoriert, da Sie während des Trainings bereits gelernt wurden. Filtern Sie Ihr Dataset daher im Voraus, um nur Kaltstartbenutzer oder Benutzer, die keine Elemente bewertet haben, zu berücksichtigen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzerfeatures trainiert wurde, können Sie während der Bewertung keine Benutzerfeatures einführen.

  5. Wenn Sie ein Dataset mit Elementfeatures haben, können Sie es mit Elementfeatures verbinden.

    Das Dataset mit Elementfeatures muss einen Elementbezeichner in der ersten Spalte enthalten. Die übrigen Spalten enthalten Werte, die die Elemente charakterisieren.

    Features von bewerteten Elementen werden von der Score matchbox-Empfehlung ignoriert, da Sie bereits beim Training erlernt wurden. Beschränken Sie Ihr Bewertungsdataset daher auf Kaltstartelemente oder auf Elemente, die nicht von Benutzern bewertet wurden.

    Warnung

    Wenn das Modell ohne Verwendung von Elementfeatures trainiert wurde, können Sie während der Bewertung keine Elementfeatures einführen.

  6. Verwenden Sie den optionalen fünften eingabeport namens Trainings Dataset, um Elemente zu entfernen, die bereits aus den Vorhersage Ergebnissen bewertet wurden.

    Um diesen Filter anzuwenden, verbinden Sie das ursprüngliche Trainingsdataset mit dem Eingabeport.

  7. Führen Sie das Experiment aus.

Ergebnisse der Bewertungsvorhersagen

Das Ausgabedataset enthält drei Spalten, die den Benutzer, das Element und die vorhergesagte Bewertung für jeden Benutzer und jedes Element des Eingabe enthalten.

Außerdem werden während der Bewertung die folgenden Änderungen angewendet:

  • Fehlende Werte in den Funktions Spalten eines Benutzers oder Elements werden automatisch durch den Modus der nicht fehlenden Trainings Satz Werte ersetzt.

  • Alle Benutzer-und Element Features werden durch die entsprechenden maximalen absoluten Werte, die im Training angezeigt werden, neu berechnet.

  • Bei Featurewerten wird keine Übersetzung angewendet, um eine geringe Datendichte aufrechtzuerhalten.

  • Merkmale mit Zeichenfolgenwerten werden in ein Set von Indikatormerkmalen mit Binärwerten konvertiert.

Empfehlen

Zum Empfehlen von Elementen für Benutzer geben Sie eine Liste von Benutzern und Elementen als Eingabe an. Aus diesen Daten generiert das Modell anhand seiner Kenntnisse über vorhandene Elemente und Benutzer eine Liste von Elementen, die für den jeweiligen Benutzer wahrscheinlich attraktiv sind. Sie können die Anzahl der zurückgegebenen Empfehlungen anpassen und einen Schwellenwert für die Anzahl der vorherigen Empfehlungen festlegen, die zum Generieren einer Empfehlung erforderlich sind.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungs Modell hinzu, und verbinden Sie es mit dem trainierten matchbox-Empfehlungs Modul. Sie müssen das Modell mit Train matchbox Empfehlungserstellen.

  2. Um einer bestimmten Liste von Benutzern Elemente zu empfehlen, legen Sie Recommender prediction kind (Vorhersageart des Empfehlungsmoduls) auf Item Recommendation (Elementempfehlung) fest.

  3. Recommended item selection (Empfohlene Elementauswahl): Geben Sie an, ob Sie das Bewertungsmodul in der Produktion oder für die Modellauswertung verwenden, indem Sie einen der folgenden Werte auswählen:

    • From Rated Items (for model evaluation) (Aus bewerteten Elementen (für Modellauswertung)): Wählen Sie diese Option aus, wenn Sie ein Modell entwickeln oder testen. Diese Option aktiviert den Auswertungsmodus, und das Modul gibt Empfehlungen nur für die Elemente im eingegebenen Dataset aus, die bewertet wurden.

    • From All Items (Aus allen Elementen): Wählen Sie diese Option aus, wenn Sie ein Experiment für die Verwendung in einem Webdienst oder in der Produktion einrichten. Diese Option aktiviert den Produktionsmodus, und das Modul gibt Empfehlungen für alle Elemente aus, die während des Trainings aufgetreten sind.

  4. Fügen Sie das Dataset hinzu, für das Sie Vorhersagen erstellen möchten, und verbinden Sie es mit dem zu bewertenden Dataset.

    • Für die Option From All Items (Aus allen Elementen) muss das Eingabedataset aus nur einer Spalte mit den Bezeichnern von Benutzern bestehen, für die Empfehlungen gegeben werden sollen.

      Wenn das Dataset mehr als eine Spalte enthält, wird ein Fehler ausgelöst. Verwenden Sie das Modul select columns in DataSet , um zusätzliche Spalten aus dem Eingabe DataSet zu entfernen.

    • Wenn Sie die Option From Rated Items (for model evaluation) (Aus bewerteten Elementen (für Modellauswertung)) auswählen, muss das Eingabedataset aus Benutzer-Element-Paaren bestehen. Die erste Spalte muss den Benutzerbezeichner enthalten. Die zweite Spalte muss die entsprechenden Elementbezeichner enthalten.

      Das Dataset kann eine dritte Spalte mit Benutzer-Element-Bewertungen enthalten, diese Spalte wird jedoch ignoriert.

  5. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Die erste Spalte des Datasets der Benutzerfeatures muss die Benutzer-IDs enthalten. Die restlichen Spalten sollten Werte enthalten, die den Benutzer charakterisieren, z B. Geschlecht, Vorlieben, Standort usw.

    Features von Benutzern, die Elemente bewertet haben, werden von Score matchbox Empfehlungs ignoriert, da diese Funktionen bereits während des Trainings erlernt wurden. Daher können Sie Ihr Dataset im Voraus filtern, um nur Kaltstartbenutzer oder Benutzer, die keine Elemente bewertet haben, zu berücksichtigen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzerfeatures trainiert wurde, können Sie während der Bewertung keine Features anwenden.

  6. (Optional) Wenn Sie ein Dataset mit Elementfeatures haben, können Sie es mit Elementfeatures verbinden.

    Die erste Spalte des Datasets mit Elementfeatures muss den Elementbezeichner enthalten. Die übrigen Spalten enthalten Werte, die die Elemente charakterisieren.

    Features von bewerteten Elementen werden von Score matchbox Empfehlungs ignoriert, da diese Funktionen bereits während des Trainings erlernt wurden. Daher können Sie Ihr Bewertungsdataset auf Kaltstartelemente oder auf Elemente beschränken, die nicht von Benutzern bewertet wurden.

    Warnung

    Verwenden Sie keine Elementfeatures für Bewertungen, wenn das Modell ohne Verwendung der Elementfeatures trainiert wurde.

  7. Maximum number of items to recommend to a user (Maximale Anzahl von Elementen, die einem Benutzer empfohlen werden sollen): Geben Sie die Anzahl der Elemente ein, die für jeden Benutzer zurückgegeben werden soll. Standardmäßig werden fünf Elemente empfohlen.

  8. Minimum size of the recommendation pool per user (Minimale Größe des Empfehlungspools pro Benutzer): Geben Sie einen Wert ein, der angibt, wie viele vorherige Empfehlungen erforderlich sind. Standardmäßig ist dieser Parameter auf 2 festgelegt. Das bedeutet, dass das Element von mindestens zwei anderen Benutzern empfohlen werden muss.

    Diese Option sollte nur verwendet werden, wenn Sie im Auswertungsmodus bewerten. Die Option ist nicht verfügbar, wenn Sie aus allen Elementen auswählen.

  9. Führen Sie das Experiment aus.

Ergebnisse der Elementempfehlung

Das vom Score Matchbox Recommender zurückgegebene bewertete Dataset listet die empfohlenen Elemente für jeden Benutzer auf.

  • Die erste Spalte enthält die Benutzer-IDs.
  • Abhängig vom Wert, den Sie für Maximum number of items to recommend to a user (Maximale Anzahl von Elementen, die einem Benutzer empfohlen werden sollen) festgelegt haben, werden verschiedene zusätzliche Spalten generiert. Jede Spalte enthält ein empfohlenes Element (nach Bezeichner). Die Empfehlungen werden nach der Affinität zwischen Benutzer und Element geordnet, wobei das Element mit der höchsten Affinität in die Spalte Item 1 (Element 1) platziert wird.

Warnung

Dieses bewertete Dataset kann nicht mithilfe des Moduls Evaluate Recommender ausgewertet werden.

Die Option zum Suchen verwandter Benutzer ist nützlich, wenn Sie "Personen wie Sie" empfehlen oder wenn Sie einen Pool ähnlicher Benutzer erstellen, auf dem andere Vorhersage Typen basieren sollen.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungs Modell hinzu, und verbinden Sie es mit dem trainierten matchbox-Empfehlungs Modul. Sie müssen das Modell mit Train matchbox Empfehlungserstellen.

  2. Art der Empfehlungs Vorhersage: Wählen Sie Verwandte Benutzer aus.

  3. Auswahl verwandter Benutzer: Geben Sie an, wie das Modell für die Bewertung verwendet werden soll, und geben Sie den Benutzer Pool an, auf dem die Ergebnisse folgendermaßen erstellt werden sollen:

    • Alle Benutzer: Wählen Sie diese Option aus, wenn Sie ein Experiment einrichten, das in einem Webdienst oder in einer Produktionsumgebung verwendet werden soll, oder wenn Sie Vorhersagen für neue Benutzer treffen müssen. Diese Option aktiviert den Produktionsmodus, und das Modul basiert auf seiner Empfehlung nur auf Benutzern, die während des Trainings angezeigt werden.

    • Von Benutzern, die Elemente bewertet haben (für die Modell Auswertung): Wählen Sie diese Option aus, wenn Sie ein Modell entwickeln oder testen. Diese Option aktiviert den Auswertungsmodus, und das Modell basiert auf den Benutzern im Testset, die einige allgemeine Elemente bewertet haben.

  4. Verbinden Sie ein DataSet, das die Benutzer enthält, für die Vorhersagen generiert werden sollen. Welches Format für dieses DataSet Sie verwenden, hängt davon ab, ob Sie das Bewertungs Modul im Produktions-oder Auswertungsmodus verwenden.

    • Produktionsmodus, Verwendung von aus allen Elementen

      Das zu bewertende DataSet muss aus Benutzern bestehen, für die Sie Verwandte Benutzer suchen möchten. Die erste und einzige Spalte sollte die Benutzer-IDs enthalten. Wenn andere Spalten eingeschlossen werden, wird ein Fehler ausgelöst. Verwenden Sie das Modul select columns in DataSet , um unnötige Spalten zu entfernen.

    • Auswertungsmodus, verwenden von bewerteten Elementen (für die Modell Auswertung)

      Das zu bewertende DataSet sollte aus 2-3 Spalten bestehen, die Benutzer-Element-Paare enthalten. Die erste Spalte sollte Benutzer-IDs enthalten. Die zweite Spalte muss Element Bezeichner enthalten. Das DataSet kann eine dritte Spalte mit Bewertungen (vom Benutzer in Spalte 1 für das Element in Spalte 2) enthalten, aber die Spalte Bewertungen wird ignoriert.

  5. Maximale Anzahl von verwandten Benutzern, die für einen Benutzer gesucht werden sollen: Geben Sie eine Zahl ein, die die maximale Anzahl der für jeden Benutzer gewünschten Vorhersagen angibt. Der Standardwert ist 5. Dies bedeutet, dass höchstens fünf Verwandte Benutzer zurückgegeben werden können, in einigen Fällen jedoch weniger als 5.

  6. Konfigurieren Sie im Auswertungsmodus (von Benutzern, die Elemente bewertet haben) diese zusätzlichen Parameter:

    • Die Mindestanzahl von Elementen, die der Abfrage Benutzer und der zugehörige Benutzer gemeinsam haben müssen: dieser Wert legt einen Schwellenwert für Empfehlungen fest. Die Zahl, die Sie eingeben, stellt die Mindestanzahl von Elementen dar, die der Ziel Benutzer und der potenzielle Verwandte Benutzer bewertet haben müssen. Der Standardwert ist 2. Dies bedeutet, dass mindestens zwei Elemente von beiden Benutzern bewertet werden müssen.

    • Minimale Größe des zugehörigen Benutzer Pools für einen einzelnen Benutzer: mit diesem Wert wird die Mindestanzahl ähnlicher Benutzer gesteuert, die zum Erstellen einer Empfehlung benötigt werden. Standardmäßig ist der Wert 2, d. h., wenn Sie nur zwei Benutzer haben, die mit der Bewertung derselben Elemente verknüpft sind, können Sie Sie in Erwägung gezogen und eine Empfehlung generieren.

  7. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Die erste Spalte des Datasets der Benutzerfeatures muss die Benutzer-IDs enthalten. Die restlichen Spalten sollten Werte enthalten, die den Benutzer charakterisieren, z. b. Geschlecht, Vorlieben, Speicherort usw.

    Features von Benutzern, die Elemente bewertet haben, werden von Score matchbox Empfehlungs ignoriert, da diese Features bereits während des Trainings erlernt wurden. Filtern Sie Ihr Dataset daher im voraus, um nur Benutzer mit Kaltstart oder Benutzer, die keine Elemente bewertet haben, einzubeziehen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzer Features trainiert wurde, können Sie während der Bewertung keine Benutzer Features anwenden.

  8. Optionale Wenn Sie über ein DataSet mit Element Features verfügen, verbinden Sie es mit Element Features.

    Die erste Spalte des Datasets mit Elementfeatures muss den Elementbezeichner enthalten. Die übrigen Spalten enthalten Werte, die die Elemente charakterisieren.

    Features von bewerteten Elementen werden von der Score matchbox-Empfehlung ignoriert, da diese Funktionen bereits während des Trainings erlernt wurden. Daher können Sie das Bewertungs DataSet auf kalt Start Elemente oder Elemente beschränken, die nicht von Benutzern bewertet wurden.

    Warnung

    Verwenden Sie keine Elementfeatures für Bewertungen, wenn das Modell ohne Verwendung der Elementfeatures trainiert wurde.

  9. Führen Sie das Experiment aus.

Das bewertete DataSet, das von Score matchbox Empfehlungs zurückgegeben wurde, listet die Benutzer auf, die mit den einzelnen Benutzern im Eingabe DataSet verknüpft sind.

Für jeden Benutzer, der im Eingabe DataSet angegeben ist, enthält das Ergebnis Dataset einen Satz verwandter Benutzer.

  • Die erste Spalte enthält den Bezeichner des Ziel Benutzers (der als Eingabe bereitgestellte Benutzer).

  • Es werden zusätzliche Spalten generiert, die die Bezeichner verwandter Benutzer enthalten. Die Anzahl der zusätzlichen Spalten hängt von dem Wert ab, den Sie in der Option Maximale Anzahl von verwandten Benutzern für einen Benutzer finden.

    Verwandte Benutzer sind nach der Stärke der Beziehung zum Ziel Benutzer geordnet, wobei der Benutzer mit dem am stärksten verbundenen Benutzer in der Spalte, der Benutzer 1, verknüpft ist.

Durch die Vorhersage verwandter Elemente können Sie Empfehlungen für Benutzer generieren, die auf bereits bewerteten Elementen basieren.

  1. Fügen Sie Ihrem Experiment ein trainiertes Empfehlungs Modell hinzu, und verbinden Sie es mit dem trainierten matchbox-Empfehlungs Modul. Sie müssen das Modell mit Train matchbox Empfehlungserstellen.

  2. Empfehlungs anweisungsart: Wählen Sie Verwandte Elemente aus.

  3. Verbinden Sie ein DataSet, das die Benutzer enthält, für die Vorhersagen generiert werden sollen. Welches Format für dieses DataSet Sie verwenden, hängt davon ab, ob Sie das Bewertungs Modul im Produktions-oder Auswertungsmodus verwenden.

    • Produktionsmodus, Verwendung von aus allen Elementen

      Das zu bewertende DataSet muss aus Elementen bestehen, für die Sie Verwandte Benutzer suchen möchten.

      Die erste und einzige Spalte sollte die Element Bezeichner enthalten. Wenn andere Spalten eingeschlossen werden, wird ein Fehler ausgelöst. Verwenden Sie das Modul select columns in DataSet , um unnötige Spalten zu entfernen.

    • Auswertungsmodus, verwenden von bewerteten Elementen (für die Modell Auswertung)

      Das zu bewertende DataSet sollte aus 2-3 Spalten bestehen, die Benutzer-Element-Paare enthalten. Die erste Spalte sollte Benutzer-IDs enthalten. Die zweite Spalte muss Element Bezeichner enthalten.

      Das DataSet kann eine dritte Spalte mit Bewertungen (vom Benutzer in Spalte 1 für das Element in Spalte 2) enthalten, aber die Spalte Bewertungen wird ignoriert.

  4. Maximale Anzahl verwandter Elemente, die nach einem Element> gefunden werden: Geben Sie eine Zahl ein, die die maximale Anzahl der für jedes Element gewünschten Vorhersagen angibt.

    Der Standardwert ist 5. Dies bedeutet, dass höchstens fünf Verwandte Elemente zurückgegeben werden können, aber möglicherweise weniger als 5.

  5. Wenn Sie den Auswertungsmodus verwenden (von Benutzern, die Elemente bewerten), konfigurieren Sie diese zusätzlichen Parameter:

    • Die Mindestanzahl von Elementen, für die das Abfrage Element und das zugehörige Element von Common bewertet werden müssen: dieser Wert legt einen Schwellenwert für Empfehlungen fest. Die Zahl, die Sie eingeben, stellt die Mindestanzahl von Elementen dar, die vom Ziel Benutzer und einem entsprechenden Benutzer bewertet wurden. Der Standardwert ist 2. Dies bedeutet, dass mindestens zwei Elemente vom Ziel Benutzer und dem entsprechenden Benutzer bewertet werden müssen.

    • Minimale Größe des verknüpften Element Pools für ein einzelnes Element: dieser Wert steuert die Mindestanzahl ähnlicher Elemente, die zum Erstellen einer Empfehlung benötigt werden. Standardmäßig ist der Wert 2. Dies bedeutet, dass Sie, wenn Sie nur wenige Elemente haben, die mit der Bewertung durch die gleichen Benutzer verknüpft sind, Sie in Erwägung gezogen und eine Empfehlung generieren können.

  6. (Optional). Wenn Sie über ein Dataset mit Benutzerfeatures verfügen, verbinden Sie es mit Benutzerfeatures.

    Die erste Spalte des Datasets der Benutzerfeatures muss die Benutzer-IDs enthalten. Die restlichen Spalten sollten Werte enthalten, die den Benutzer charakterisieren, z B. Geschlecht, Vorlieben, Standort usw.

    Features von Benutzern, die Elemente bewertet haben, werden von Score matchbox Empfehlungs ignoriert, da diese Funktionen bereits während des Trainings erlernt wurden. Daher können Sie Ihr Dataset im Voraus filtern, um nur Kaltstartbenutzer oder Benutzer, die keine Elemente bewertet haben, zu berücksichtigen.

    Warnung

    Wenn das Modell ohne Verwendung von Benutzer Features trainiert wurde, können Sie während der Bewertung keine Benutzer Features anwenden.

  7. Optionale Wenn Sie ein DataSet mit Element Features haben, können Sie es mit Element Features verbinden.

    Die erste Spalte des Datasets mit Elementfeatures muss den Elementbezeichner enthalten. Die verbleibenden Spalten sollten Werte enthalten, die das Element bezeichnen.

    Features von bewerteten Elementen werden von Score matchbox Empfehlungs ignoriert, da diese Funktionen bereits während des Trainings erlernt wurden. Daher können Sie das Bewertungs DataSet auf kalt Start Elemente oder Elemente beschränken, die nicht von Benutzern bewertet wurden.

    Warnung

    Verwenden Sie keine Elementfeatures für Bewertungen, wenn das Modell ohne Verwendung der Elementfeatures trainiert wurde.

  8. Optionale In einem Vorhersage Experiment können Sie einen fünften eingabeport namens Trainings Dataset verwenden, um vorhandene Benutzer zu entfernen, die in den Modell Trainingsdaten aus den Vorhersage Ergebnissen enthalten sind.

    Um diesen Filter anzuwenden, verbinden Sie das ursprüngliche Trainingsdataset mit dem Eingabeport.

  9. Führen Sie das Experiment aus.

Das bewertete DataSet, das von Score matchbox Empfehlungs zurückgegeben wurde, listet die zugehörigen Elemente für jedes Element im Eingabe DataSet auf.

  • Die erste Spalte enthält den Bezeichner des Ziel Elements (das als Eingabe bereitgestellte Element).

  • Es werden zusätzliche Spalten mit den Bezeichner verwandter Elemente generiert. Die Anzahl der zusätzlichen Spalten hängt von dem Wert ab, den Sie in der Option Maximale Anzahl verwandter Elemente für ein Element finden.

    Die verknüpften Elemente werden nach der Stärke der Beziehung zum Ziel Element geordnet, wobei das am stärksten Verwandte Element in der Spalte mit dem Element 1 verknüpft ist.

Technische Hinweise

Dieser Abschnitt enthält Antworten auf einige häufig gestellte Fragen zur Verwendung des Empfehlungsmoduls zum Erstellen von Vorhersagen.

Benutzer und Empfehlungen für kalte Starts

Zum Erstellen von Empfehlungen benötigt das Score matchbox-Empfehlungs Modul in der Regel die gleichen Eingaben, die Sie beim Trainieren des Modells verwendet haben, einschließlich einer Benutzer-ID. Dies liegt daran, dass der Algorithmus wissen muss, ob er während des Trainings etwas über diesen Benutzer gelernt hat.

Bei neuen Benutzern verfügen Sie aber möglicherweise nicht über eine Benutzer-ID, sondern nur über einige Features wie z. B. Alter, Geschlecht usw.

Sie können trotzdem Empfehlungen zu neuen Benutzern im System erstellen, indem Sie sie als Kaltstartbenutzer behandeln. Für solche Benutzer verwendet der Empfehlungsalgorithmus weder die Vorgeschichte noch vorherige Bewertungen, sondern nur Benutzerfeatures.

Zu Vorhersagezwecken wird ein Kaltstartbenutzer als Benutzer mit einer ID definiert, die nicht zum Trainieren verwendet wurde. Um sicherzustellen, dass die IDs nicht mit den im Training verwendeten IDs identisch sind, können Sie neue Bezeichner erstellen. Sie können beispielsweise zufällige IDs innerhalb eines bestimmten Bereichs erstellen oder Kaltstartbenutzern im Voraus eine Reihe von IDs zuweisen.

Wenn Sie keine gemeinsamen Filterdaten besitzen, z. B. einen Vektor der Benutzerfeatures, sollten Sie besser ein Klassifizierungs- oder Regressions-Lernmodul verwenden.

Verwendung der Matchbox-Empfehlung in der Produktionsumgebung

Wenn Sie mit dem matchbox-Empfehlungs Experiment experimentieren und das Modell dann in die Produktion verschieben, beachten Sie diese wichtigen Unterschiede, wenn Sie den Empfehlungs Dienst im Evaluierungs Modus und im Produktionsmodus verwenden:

  • Die Auswertung erfordert definitionsgemäß Vorhersagen, die anhand der grundlegende Wahrheit in einem Testsatz überprüft werden können. Wenn Sie das Empfehlungsmodul auswerten, dürfen daher nur Elemente vorhergesagt werden, die im Testsatz bewertet wurden. Dies schränkt notwendigerweise die möglichen vorhergesagten Werte ein.

    Wenn Sie das Modell jedoch operationalisieren, ändern Sie in der Regel den Vorhersagemodus, sodass Empfehlungen auf der Grundlage aller möglichen Elemente getroffen werden, um die besten Vorhersagen zu erhalten. Bei vielen dieser Vorhersagen gibt es keine entsprechende grundlegende Wahrheit, sodass die Genauigkeit der Empfehlung nicht wie beim Einstellen in Experimenten überprüft werden kann.

  • Wenn Sie in der Produktionsumgebung keine Benutzer-ID, sondern nur einen Featurevektor bereitstellen, erhalten Sie als Antwort unter Umständen eine Liste aller Empfehlungen für alle möglichen Benutzer. Achten Sie darauf, dass Sie eine Benutzer-ID angeben.

    Um die Anzahl der zurückgegebenen Empfehlungen zu beschränken, können Sie auch die maximale Anzahl der pro Benutzer zurückgegebenen Elemente angeben.

  • Es ist nicht möglich, Vorhersagen nur für Elemente zu generieren, die zuvor nicht bewertet wurden. Dies ist beabsichtigt.

    Der Grund dafür ist, dass der Empfehlungs Dienst das gesamte Trainings Dataset mit dem Modell speichern muss, um nur die Elemente zu empfehlen, die nicht bewertet wurden, was die Nutzung des Speichers erhöhen würde.

    Wenn Sie nur Elemente empfehlen möchten, die der Benutzer noch nicht kennt, können Sie weitere zu empfehlende Elemente anfordern und dann die bewerteten manuell herausfiltern.

Fortlaufendes Update des Empfehlungs Systems

Eine Online Aktualisierung (oder kontinuierliches Training) eines Empfehlungs Modells wird derzeit in Azure Machine Learning nicht unterstützt. Wenn Sie Benutzer Antworten auf Empfehlungen aufzeichnen und diese zur Verbesserung des Modells verwenden möchten, empfiehlt es sich, das gesamte Modell in regelmäßigen Abständen erneut zu trainieren. Inkrementelles Training ist nicht möglich. Sie können jedoch ein gleitender Fenster auf die Trainingsdaten anwenden, um sicherzustellen, dass das Datenvolumen bei der Verwendung der aktuellsten Daten minimiert wird.

Erwartete Eingaben

Name Typ BESCHREIBUNG
Trainiertes Matchbox-Empfehlungssystem ILearner Trainiertes Matchbox-Empfehlungssystem
Zu bewertendes Dataset Datentabelle Zu bewertendes Dataset
User features Datentabelle Dataset mit Merkmalen, die Benutzer beschreiben

Diese Daten sind optional.
Item features Datentabelle Dataset mit Merkmalen, die Elemente beschreiben

Diese Daten sind optional.

Modulparameter

Name Range type Standard BESCHREIBUNG
Recommender prediction kind List Art der Vorhersage Item Recommendation Angeben des Vorhersagetyps, den das Empfehlungsmodul ausgeben soll.
Empfohlene Elementauswahl List Elementauswahl From Rated Items (for model evaluation) Auswählen des Elementsatzes, aus dem Empfehlungen gegeben werden sollen.
Auswahl verwandter Benutzer List Benutzerauswahl From Users That Rated Items (for model evaluation) Auswählen der Gruppe von Benutzern, die beim Suchen verwandter Elemente verwendet werden soll.
Auswahl verwandter Elemente List [Elementauswahl From Rated Items (for model evaluation) Auswählen der Gruppe von Elementen, die beim Suchen verwandter Elemente verwendet werden soll.

Ausgaben

Name Typ BESCHREIBUNG
Bewertetes Dataset Datentabelle Bewertetes Dataset

Ausnahmen

Ausnahme Beschreibung
Fehler 0022 Eine Ausnahme tritt auf, wenn die Anzahl der ausgewählten Spalten im Eingabedataset nicht mit der erwarteten Anzahl übereinstimmt.
Fehler 0036 Eine Ausnahme tritt auf, wenn mehrere Featurevektoren für einen bestimmten Benutzer oder ein bestimmtes Element bereitgestellt wurden.
Fehler 0013 Die Ausnahme tritt auf, wenn das an das Modul übergebene Lernmodul einen ungültigen Typ hat.
Fehler 0035 Eine Ausnahme tritt auf, wenn für einen bestimmten Benutzer oder ein bestimmtes Element keine Features bereitgestellt wurden.
Fehler 0053 Die Ausnahme tritt auf, wenn keine Benutzermerkmale oder Elemente für Matchbox-Empfehlungen vorhanden sind.
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning Rest-API-Fehler Codes.

Weitere Informationen

Train matchbox-empfehlungsmodul
Empfehlungs Empfehlung auswerten
Wert