Aanbeveling voor scorematchbox

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Scores voor voorspellingen voor een gegevensset met behulp van de Matchbox-aanbeveling

Categorie: Machine Learning/score

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Score Matchbox Recommender in Machine Learning Studio (klassiek) gebruikt om voorspellingen te maken op basis van een getraind aanbevelingsmodel, op basis van het Matchbox-algoritme van Microsoft Research.

De Matchbox-aanbevelingser kan vier verschillende soorten voorspellingen genereren:

Wanneer u de laatste drie soorten voorspellingen maakt, kunt u in de productiemodus of evaluatiemodus werken.

  • In de productiemodus worden alle gebruikers of items in overweging genomen en wordt deze doorgaans gebruikt in een webservice.

    U kunt scores maken voor nieuwe gebruikers, niet alleen voor gebruikers die tijdens de training zijn gezien. Zie deze sectie voor meer informatie.

  • De evaluatiemodus werkt op een beperkte set gebruikers of items die kan worden geëvalueerd en wordt doorgaans gebruikt tijdens het experimenteren.

Tip

Ontdek alles wat u moet weten over de end-to-end ervaring van het bouwen van een aanbevelingssysteem in deze zelfstudie van het .NET-ontwikkelteam. Bevat voorbeeldcode en discussie over het aanroepen van Machine Learning vanuit een toepassing.

Aanbevelingsent engine bouwen voor .NET-toepassingen met Machine Learning

Meer informatie over de matchbox-aanbeveling

Het doel van het maken van een aanbevelingssysteem is om een of meer 'items' aan te bevelen aan 'gebruikers' van het systeem. Voorbeelden van een item zijn een film, restaurant, boek of nummer. Een gebruiker kan een persoon, groep personen of een andere entiteit met itemvoorkeuren zijn.

Er zijn twee belangrijke benaderingen voor aanbevelingssystemen. De eerste is de op inhoud gebaseerde benadering, waarbij gebruik wordt gemaakt van functies voor zowel gebruikers als items. Gebruikers kunnen worden beschreven door eigenschappen zoals leeftijd en geslacht, en items kunnen worden beschreven door eigenschappen zoals auteur en fabrikant. Typische voorbeelden van op inhoud gebaseerde aanbevelingssystemen vindt u op sites voor sociale matchmaking. De tweede benadering is filteren in samenwerkingsverband, waarbij alleen id's van de gebruikers en de items worden gebruikt en impliciete informatie over deze entiteiten wordt verkrijgen uit een (sparse) matrix van beoordelingen die de gebruikers aan de items hebben gegeven. We kunnen meer te weten komen over een gebruiker van de items die ze hebben beoordeeld en van andere gebruikers die dezelfde items hebben beoordeeld.

De Matchbox-aanbevelingser combineert gezamenlijke filtering met een op inhoud gebaseerde benadering. Het wordt daarom beschouwd als een hybride aanbeveling. Wanneer een gebruiker relatief nieuw is in het systeem, worden voorspellingen verbeterd door gebruik te maken van de functie-informatie over de gebruiker, waardoor het bekende 'cold-start'-probleem wordt aangepakt. Zodra er echter voldoende beoordelingen van een bepaalde gebruiker zijn, is het mogelijk om volledig gepersonaliseerde voorspellingen te doen op basis van hun specifieke beoordelingen in plaats van alleen op basis van hun functies. Daarom is er een soepele overgang van op inhoud gebaseerde aanbevelingen naar aanbevelingen op basis van gezamenlijke filtering. Zelfs wanneer gebruikers- of itemfuncties niet beschikbaar zijn, werkt Matchbox nog steeds in de modus voor samenwerking met filteren.

Meer informatie over de Matchbox-aanbevelingser en het onderliggende probabilistische algoritme vindt u in het relevante onderzoeksdocument:

Voorbeelden

Zie de Azure AI Gallery voor voorbeelden van het maken van scores op Azure AI Gallery.

  • Aanbeveling: Filmaanbeveling: In dit voorbeeld wordt de aanbeveling voor items gedemonstreerd, waarbij de items films zijn, en wordt ook de voorspelling van classificaties gedemonstreerd.

  • Aanbeveling: Restaurantbeoordelingen: in dit voorbeeld worden itemaanbevelingen gedemonstreerd met zowel itemfuncties als gebruikersfuncties.

  • Aanbevelingen Overal: Dit blogbericht bevat een inleiding op hoog niveau tot aanbevelingssystemen met veel visuele hulpmiddelen.

Aanbeveling voor scorematchbox configureren

Deze module ondersteunt verschillende soorten aanbevelingen, elk met verschillende vereisten. Klik op de koppeling voor het type gegevens dat u hebt en het type aanbeveling dat u wilt maken.

Beoordelingen voorspellen

Wanneer u beoordelingen voorspelt, berekent het model hoe een bepaalde gebruiker op een bepaald item reageert op de trainingsgegevens. Daarom moeten de invoergegevens voor scoren zowel een gebruiker als het te beoordelen item bevatten.

  1. Voeg een getraind aanbevelingsmodel toe aan uw experiment en koppel dit aan de getrainde Matchbox-aanbeveling. U moet het model maken met behulp van Train Matchbox Recommender.

  2. Voorspellings soort aanbeveling: Selecteer Classificatievoorspelling. Er zijn geen verdere parameters vereist.

  3. Voeg de gegevens toe waarvoor u voorspellingen wilt doen en koppel deze aan Gegevensset om te scoren.

    Als u beoordelingen wilt voorspellen, moet de invoergegevensset gebruikersitemparen bevatten.

    De gegevensset kan een optionele derde kolom met classificaties voor het gebruikersitempaar in de eerste en tweede kolom bevatten, maar de derde kolom wordt genegeerd tijdens de voorspelling.

  4. (Optioneel). Als u een gegevensset met gebruikersfuncties hebt, verbindt u deze met Gebruikersfuncties.

    De gegevensset met gebruikersfuncties moet de gebruikers-id in de eerste kolom bevatten. De resterende kolommen moeten waarden bevatten die de gebruikers karakteriseren, zoals hun geslacht, voorkeuren, locatie, enzovoort.

    Functies van gebruikers met beoordeelde items worden genegeerd door Score Matchbox Recommender, omdat ze al zijn geleerd tijdens de training. Filter uw gegevensset daarom vooraf zodat deze alleen coldstart-gebruikers of gebruikers bevat die geen items hebben beoordeeld.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van gebruikersfuncties, kunt u geen gebruikersfuncties introduceren tijdens het scoren.

  5. Als u een gegevensset met itemfuncties hebt, kunt u deze verbinden met Itemfuncties.

    De gegevensset met itemfuncties moet een item-id bevatten in de eerste kolom. De resterende kolommen moeten waarden bevatten die de items karakteriseren.

    Functies van beoordeelde items worden genegeerd door Score Matchbox Recommender , omdat ze al zijn geleerd tijdens de training. Beperk daarom uw score-gegevensset tot coldstart-items of items die niet zijn beoordeeld door gebruikers.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van itemfuncties, kunt u geen itemfuncties introduceren tijdens het scoren.

  6. Gebruik de optionele vijfde invoerpoort met de naam Trainingsset om items te verwijderen die al zijn beoordeeld uit de voorspellingsresultaten.

    Als u dit filter wilt toepassen, verbindt u de oorspronkelijke trainingsset met de invoerpoort.

  7. Voer het experiment uit.

Resultaten voor classificatievoorspellingen

De uitvoergegevensset bevat drie kolommen, met daarin de gebruiker, het item en de voorspelde classificatie voor elke invoergebruiker en elk item.

Daarnaast worden de volgende wijzigingen toegepast tijdens het scoren:

  • Ontbrekende waarden in de kolommen van een gebruikers- of itemfunctie worden automatisch vervangen door de modus van de niet-ontbrekende trainingssetwaarden.

  • Alle gebruikers- en itemfuncties worden opnieuw geschaald op basis van de bijbehorende maximale absolute waarden die in de training worden gezien.

  • Er wordt geen vertaling toegepast op de functiewaarden om de sparsiteit te behouden.

  • Functies met tekenreeksen worden geconverteerd naar een set indicatorfuncties met binaire waarde.

Aanbevelen

Als u items voor gebruikers wilt aanbevelen, geeft u een lijst met gebruikers en items op als invoer. Op basis van deze gegevens gebruikt het model zijn kennis over bestaande items en gebruikers om een lijst met items te genereren die elke gebruiker waarschijnlijk aan kunnen spreken. U kunt het aantal geretourneerde aanbevelingen aanpassen en een drempel instellen voor het aantal eerdere aanbevelingen dat is vereist om een aanbeveling te genereren.

  1. Voeg een getraind aanbevelingsmodel toe aan uw experiment en koppel dit aan de getrainde Matchbox-aanbeveling. U moet het model maken met behulp van Train Matchbox Recommender.

  2. Als u items voor een bepaalde lijst met gebruikers wilt aanbevelen, stelt u Voorspellings soort Aanbeveling van Recommender in op Itemaanbeveling.

  3. Selectie van aanbevolen items: geef aan of u de scoremodule in productie of voor modelevaluatie gebruikt door een van deze waarden te kiezen:

    • Van Beoordeelde items (voor modelevaluatie): selecteer deze optie als u een model ontwikkelt of test. Met deze optie schakelt u de evaluatiemodus in en doet de module alleen aanbevelingen op basis van de items in de invoerset die zijn beoordeeld.

    • Uit Alle items: selecteer deze optie als u een experiment in een webservice of productie instelt voor gebruik. Met deze optie schakelt u de productiemodus in en doet de module aanbevelingen van alle items die tijdens de training worden gezien.

  4. Voeg de gegevensset toe waarvoor u voorspellingen wilt doen en koppel deze aan Gegevensset om te scoren.

    • Als u de optie Van alle items kiest, moet de invoergegevensset bestaan uit één kolom met de id's van gebruikers waarvoor aanbevelingen moeten worden gedaan.

      Als de gegevensset meer dan één kolom bevat, wordt er een foutmelding weergegeven. Gebruik de module Select Columns in Dataset (Kolommen in gegevensset selecteren) om extra kolommen uit de invoerset te verwijderen.

    • Als u de optie Van beoordeelde items (voor modelevaluatie) kiest, moet de invoergegevensset bestaan uit gebruikersitemparen. De eerste kolom moet de gebruikers-id bevatten. De tweede kolom moet de bijbehorende item-id's bevatten.

      De gegevensset kan een derde kolom met gebruikersitemclassificaties bevatten, maar deze kolom wordt genegeerd.

  5. (Optioneel). Als u een gegevensset met gebruikersfuncties hebt, verbindt u deze met Gebruikersfuncties.

    De eerste kolom in de gegevensset gebruikersfuncties moet de gebruikers-id bevatten. De resterende kolommen moeten waarden bevatten die de gebruiker karakteriseren, zoals geslacht, voorkeuren, locatie, enzovoort.

    Functies van gebruikers met beoordeelde items worden genegeerd door Score Matchbox Recommender, omdat deze functies al zijn geleerd tijdens de training. Daarom kunt u uw gegevensset vooraf filteren, zodat alleen niet-startende gebruikers of gebruikers die geen items hebben beoordeeld, worden toegevoegd.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van gebruikersfuncties, kunt u geen functies toepassen tijdens het scoren.

  6. (Optioneel) Als u een gegevensset met itemfuncties hebt, kunt u deze verbinden met Itemfuncties.

    De eerste kolom in de gegevensset met itemfuncties moet de item-id bevatten. De resterende kolommen moeten waarden bevatten die de items karakteriseren.

    Functies van beoordeelde items worden genegeerd door Score Matchbox Recommender, omdat deze functies al zijn geleerd tijdens de training. Daarom kunt u uw score-gegevensset beperken tot coldstart-items of items die niet zijn beoordeeld door gebruikers.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van itemfuncties, gebruikt u geen itemfuncties bij het scoren.

  7. Maximum aantal items dat aan een gebruiker moet worden aanbevolen: typ het aantal items dat voor elke gebruiker moet worden retourneren. Standaard worden 5 items aanbevolen.

  8. Minimale grootte van de aanbevelingsgroep per gebruiker: typ een waarde die aangeeft hoeveel eerdere aanbevelingen vereist zijn. Deze parameter is standaard ingesteld op 2, wat betekent dat het item moet zijn aanbevolen door ten minste twee andere gebruikers.

    Deze optie moet alleen worden gebruikt als u in de evaluatiemodus s scoren. De optie is niet beschikbaar als u Van alle items selecteert.

  9. Voer het experiment uit.

Resultaten van itemaanbeveling

De door Score Matchbox Recommender geretourneerde gegevensset bevat de aanbevolen items voor elke gebruiker.

  • De eerste kolom bevat de gebruikers-id's.
  • Er wordt een aantal extra kolommen gegenereerd, afhankelijk van de waarde die u hebt ingesteld voor Maximum aantal items dat aan een gebruiker moet worden aanbevolen. Elke kolom bevat een aanbevolen item (op id). De aanbevelingen worden geordend op gebruikersitem-affiniteit, met het item met de hoogste affiniteit in kolom Item 1.

Waarschuwing

Deze beoordeelde gegevensset kan niet worden geëvalueerd met behulp van de module Evaluate Recommender .

Gerelateerde gebruikers zoeken

De optie om gerelateerde gebruikers te zoeken is handig als u 'mensen zoals u' aanbeveelt, of als u een groep vergelijkbare gebruikers maakt waarop u andere typen voorspellingen wilt baseren.

  1. Voeg een getraind aanbevelingsmodel toe aan uw experiment en koppel dit aan de getrainde Matchbox-aanbeveling. U moet het model maken met behulp van Train Matchbox Recommender.

  2. Type aanbevelingsvoorspelling: Selecteer Gerelateerde gebruikers.

  3. Gerelateerde gebruikersselectie: geef aan hoe u het model gaat gebruiken om te scoren en geef als volgt de groep gebruikers op waarop de scores moeten worden gebaseerd:

    • Van Alle gebruikers: selecteer deze optie als u een experiment in een webservice of productie instelt of als u voorspellingen moet doen voor nieuwe gebruikers. Met deze optie schakelt u de productiemodus in en de module baseert de aanbeveling alleen op gebruikers die tijdens de training zijn gezien.

    • Uit Users That Rated Items (voor modelevaluatie) : Selecteer deze optie als u een model ontwikkelt of test. Met deze optie schakelt u de evaluatiemodus in en het model baseert de aanbevelingen op de gebruikers in de testset die een aantal algemene items hebben beoordeeld.

  4. Verbinding maken een gegevensset die de gebruikers bevat waarvoor voorspellingen moeten worden gegenereerd. De indeling voor deze gegevensset is afhankelijk van het gebruik van de scoremodule in de productiemodus of evaluatiemodus.

    • Productiemodus, met behulp van Van alle items

      De gegevensset die moet worden scoren, moet bestaan uit gebruikers waarvoor u gerelateerde gebruikers wilt vinden. De eerste en enige kolom moet de gebruikers-id's bevatten. Als er andere kolommen zijn opgenomen, tuurt er een fout op. Gebruik de module Select Columns in Dataset (Kolommen in gegevensset selecteren) om overbodige kolommen te verwijderen.

    • Evaluatiemodus, met behulp van Van beoordeelde items (voor modelevaluatie)

      De gegevensset die moet worden scoren, moet bestaan uit 2-3 kolommen met paren van gebruikersitem. De eerste kolom moet gebruikers-id's bevatten. De tweede kolom moet item-id's bevatten. De gegevensset kan een derde kolom met classificaties bevatten (door de gebruiker in kolom 1 voor het item in kolom 2), maar de beoordelingskolom wordt genegeerd.

  5. Maximum aantal gerelateerde gebruikers dat voor een gebruiker moet worden gevonden: typ een getal dat het maximum aantal voorspellingen aangeeft dat u voor elke gebruiker wilt. De standaardwaarde is 5, wat betekent dat er niet meer dan vijf gerelateerde gebruikers kunnen worden geretourneerd, maar dat er in sommige gevallen minder dan vijf kunnen zijn.

  6. Configureer in de evaluatiemodus (van gebruikers die items beoordelen) deze aanvullende parameters:

    • Minimumaantal items dat de querygebruiker en de daaraan gerelateerde gebruiker gemeenschappelijk moeten hebben beoordeeld: met deze waarde wordt een drempelwaarde voor aanbevelingen. Het getal dat u typt, vertegenwoordigt het minimum aantal items dat uw doelgebruiker en de potentiële gerelateerde gebruiker moeten hebben beoordeeld. De standaardwaarde is 2, wat betekent dat ten minste twee items moeten zijn beoordeeld door beide gebruikers.

    • Minimale grootte van de gerelateerde gebruikersgroep voor één gebruiker: met deze waarde bepaalt u het minimum aantal vergelijkbare gebruikers dat nodig is om een aanbeveling te maken. De waarde is standaard 2, wat betekent dat als u maar twee gebruikers hebt die zijn gerelateerd vanwege de classificatie van dezelfde items, u ze gerelateerd kunt beschouwen en een aanbeveling kunt genereren.

  7. (Optioneel). Als u een gegevensset met gebruikersfuncties hebt, verbindt u deze met Gebruikersfuncties.

    De eerste kolom in de gegevensset gebruikersfuncties moet de gebruikers-id bevatten. De resterende kolommen moeten waarden bevatten die de gebruiker karakteriseren, zoals geslacht, voorkeuren, locatie, enzovoort.

    Functies van gebruikers met beoordeelde items worden genegeerd door Score Matchbox Recommender , omdat deze functies al zijn geleerd tijdens de training. Filter uw gegevensset daarom vooraf zodat deze alleen coldstart-gebruikers of gebruikers bevat die geen items hebben beoordeeld.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van gebruikersfuncties, kunt u geen gebruikersfuncties toepassen tijdens het scoren.

  8. (Optioneel) Als u een gegevensset met itemfuncties hebt, verbindt u deze met Itemfuncties.

    De eerste kolom in de gegevensset met itemfuncties moet de item-id bevatten. De resterende kolommen moeten waarden bevatten die de items karakteriseren.

    Functies van beoordeelde items worden genegeerd door Score Matchbox Recommender , omdat deze functies al zijn geleerd tijdens de training. Daarom kunt u uw score-gegevensset beperken tot coldstart-items of items die niet zijn beoordeeld door gebruikers.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van itemfuncties, gebruikt u geen itemfuncties bij het scoren.

  9. Voer het experiment uit.

De door Score Matchbox Recommender geretourneerde gegevensset bevat de gebruikers die gerelateerd zijn aan elke gebruiker in de invoerset.

Voor elke gebruiker die is opgegeven in de invoergegevensset, bevat de resultaatgegevensset een set gerelateerde gebruikers.

  • De eerste kolom bevat de id van de doelgebruiker (de gebruiker die is opgegeven als invoer).

  • Er worden extra kolommen gegenereerd die de id's van gerelateerde gebruikers bevatten. Het aantal extra kolommen is afhankelijk van de waarde die u in de optie Maximum aantal gerelateerde gebruikers voor een gebruiker hebt ingesteld.

    Gerelateerde gebruikers worden geordend op de sterkte van de relatie met de doelgebruiker, met de meest gerelateerde gebruiker in de kolom Related User 1.

Gerelateerde items zoeken

Door gerelateerde items te voorspellen, kunt u aanbevelingen genereren voor gebruikers op basis van items die al zijn beoordeeld.

  1. Voeg een getraind aanbevelingsmodel toe aan uw experiment en koppel dit aan de getrainde Matchbox-aanbeveling. U moet het model maken met behulp van Train Matchbox Recommender.

  2. Type aanbevelingsvoorspelling: Selecteer Gerelateerde items.

  3. Verbinding maken een gegevensset die de gebruikers bevat waarvoor voorspellingen moeten worden gegenereerd. De indeling voor deze gegevensset is afhankelijk van het gebruik van de scoremodule in de productiemodus of evaluatiemodus.

    • Productiemodus, met behulp van Van alle items

      De gegevensset die moet worden scoren, moet bestaan uit items waarvoor u gerelateerde gebruikers wilt vinden.

      De eerste en enige kolom moet de item-id's bevatten. Als er andere kolommen zijn opgenomen, tuurt er een fout op. Gebruik de module Select Columns in Dataset (Kolommen in gegevensset selecteren) om overbodige kolommen te verwijderen.

    • Evaluatiemodus, met behulp van Van beoordeelde items (voor modelevaluatie)

      De gegevensset die moet worden scoren, moet bestaan uit 2-3 kolommen, die paren van gebruikersitem's bevatten. De eerste kolom moet gebruikers-id's bevatten. De tweede kolom moet item-id's bevatten.

      De gegevensset kan een derde kolom met classificaties bevatten (door de gebruiker in kolom 1 voor het item in kolom 2), maar de kolom met beoordelingen wordt genegeerd.

  4. Maximum aantal gerelateerde items dat voor een item> moet worden gevonden: typ een getal dat het maximum aantal voorspellingen aangeeft dat u voor elk item wilt.

    De standaardwaarde is 5, wat betekent dat er niet meer dan vijf gerelateerde items kunnen worden geretourneerd, maar dat er mogelijk minder dan 5 zijn.

  5. Als u de evaluatiemodus gebruikt (van gebruikers die items hebben beoordeeld), configureert u deze aanvullende parameters:

    • Minimum aantal items dat het query-item en het bijbehorende item gemeenschappelijk moeten hebben beoordeeld: met deze waarde wordt een drempelwaarde voor aanbevelingen gemaakt. Het getal dat u typt, vertegenwoordigt het minimum aantal items dat is beoordeeld door de doelgebruiker en een gerelateerde gebruiker. De standaardwaarde is 2, wat betekent dat ten minste twee items moeten zijn beoordeeld door de doelgebruiker en de bijbehorende gebruiker.

    • Minimale grootte van de gerelateerde itemgroep voor één item: met deze waarde bepaalt u het minimum aantal vergelijkbare items dat nodig is om een aanbeveling te maken. De waarde is standaard 2, wat betekent dat als er maar twee items zijn die gerelateerd zijn omdat ze door dezelfde gebruikers zijn beoordeeld, u ze gerelateerd kunt beschouwen en een aanbeveling kunt genereren.

  6. (Optioneel). Als u een gegevensset met gebruikersfuncties hebt, verbindt u deze met Gebruikersfuncties.

    De eerste kolom in de gegevensset gebruikersfuncties moet de gebruikers-id bevatten. De resterende kolommen moeten waarden bevatten die de gebruiker karakteriseren, zoals geslacht, voorkeuren, locatie, enzovoort.

    Functies van gebruikers die items hebben beoordeeld, worden genegeerd door Score Matchbox Recommender, omdat deze functies al zijn geleerd tijdens de training. Daarom kunt u uw gegevensset vooraf filteren om alleen coldstart-gebruikers of gebruikers op te nemen die geen items hebben beoordeeld.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van gebruikersfuncties, kunt u geen gebruikersfuncties toepassen tijdens het scoren.

  7. (Optioneel) Als u een gegevensset met itemfuncties hebt, kunt u deze verbinden met itemfuncties.

    De eerste kolom in de gegevensset met itemfuncties moet de item-id bevatten. De resterende kolommen moeten waarden bevatten die het item karakteriseren.

    Functies van beoordeelde items worden genegeerd door Score Matchbox Recommender, omdat deze functies al zijn geleerd tijdens de training. Daarom kunt u uw score-gegevensset beperken tot koude items of items die niet zijn beoordeeld door gebruikers.

    Waarschuwing

    Als het model is getraind zonder itemfuncties te gebruiken, gebruikt u geen itemfuncties bij het scoren.

  8. (Optioneel) In een voorspellend experiment kunt u een vijfde invoerpoort met de naam Trainingsgegevensset gebruiken om bestaande gebruikers die zijn opgenomen in de modeltrainingsgegevens te verwijderen uit de voorspellingsresultaten.

    Als u dit filter wilt toepassen, verbindt u de oorspronkelijke trainingsset met de invoerpoort.

  9. Voer het experiment uit.

De door Score Matchbox Recommender geretourneerde score-gegevensset bevat de gerelateerde items voor elk item in de invoerset.

  • De eerste kolom bevat de id van het doelitem (het item dat is opgegeven als invoer).

  • Er worden extra kolommen gegenereerd die de id's van gerelateerde items bevatten. Het aantal extra kolommen is afhankelijk van de waarde die u hebt ingesteld in de optie Maximum aantal gerelateerde items dat voor een item moet worden gevonden.

    De gerelateerde items worden geordend op de sterkte van de relatie met het doelitem, met het sterkst gerelateerde item in de kolom, Gerelateerd item 1.

Technische opmerkingen

Deze sectie bevat antwoorden op enkele veelvoorkomende vragen over het gebruik van de aanbevelingsdeser om voorspellingen te maken.

Niet-startende gebruikers en aanbevelingen

Normaal gesproken vereist de module Score Matchbox Recommender dezelfde invoer die u hebt gebruikt bij het trainen van het model, met inbegrip van een gebruikers-id. Dat komt doordat het algoritme moet weten of het iets over deze gebruiker heeft geleerd tijdens de training.

Voor nieuwe gebruikers hebt u echter mogelijk geen gebruikers-id, alleen bepaalde gebruikersfuncties, zoals leeftijd, geslacht, enzovoort.

U kunt nog steeds aanbevelingen maken voor gebruikers die nog niet bekend zijn met uw systeem, door ze als niet-startende gebruikers te verwerken. Voor dergelijke gebruikers gebruikt het aanbevelingsalgoritme geen eerdere of eerdere beoordelingen, alleen gebruikersfuncties.

Voor voorspellingsdoeleinden wordt een coldstart-gebruiker gedefinieerd als een gebruiker met een id die niet is gebruikt voor training. Om ervoor te zorgen dat id's niet overeenkomen met de id's die worden gebruikt in de training, kunt u nieuwe id's maken. U kunt bijvoorbeeld willekeurige ID's binnen een opgegeven bereik genereren of vooraf een reeks ID's toewijzen aan gebruikers met een koude start.

Als u echter geen gezamenlijke filtergegevens hebt, zoals een vector van gebruikersfuncties, kunt u beter een classificatie- of regressie-learner gebruiken.

Productiegebruik van de Matchbox-aanbeveling

Als u hebt geëxperimenteerd met de Matchbox-aanbeveling en vervolgens het model naar productie verplaatst, moet u rekening houden met deze belangrijke verschillen wanneer u de aanbevelings-functie gebruikt in de evaluatiemodus en in de productiemodus:

  • Evaluatie vereist per definitie voorspellingen die kunnen worden geverifieerd tegen de grond waarheid in een testset. Wanneer u de aanbevelingstest evalueert, moet deze daarom alleen items voorspellen die in de testset zijn beoordeeld. Dit beperkt noodzakelijkerwijs de mogelijke waarden die worden voorspeld.

    Wanneer u echter het model operationeel maakt, wijzigt u doorgaans de voorspellingsmodus om aanbevelingen te doen op basis van alle mogelijke items, om de beste voorspellingen te krijgen. Voor veel van deze voorspellingen is er geen bijbehorende grond-waarheid, dus de nauwkeurigheid van de aanbeveling kan niet op dezelfde manier worden geverifieerd als tijdens het experimenteren.

  • Als u geen gebruikers-id in productie op te geven en alleen een functievector op te geven, krijgt u mogelijk als antwoord een lijst met alle aanbevelingen voor alle mogelijke gebruikers. Zorg ervoor dat u een gebruikers-id op geeft.

    Als u het aantal geretourneerde aanbevelingen wilt beperken, kunt u ook het maximum aantal items opgeven dat per gebruiker wordt geretourneerd.

  • Het is niet mogelijk om alleen voorspellingen te genereren voor items die niet eerder zijn beoordeeld. Dit is standaard.

    De reden hiervoor is dat, om alleen de items aan te bevelen die niet zijn beoordeeld, de aanbevelingsdeser de volledige trainingsgegevensset met het model moet opslaan, waardoor uw gebruik van opslag wordt vergroot.

    Als u alleen items wilt aanbevelen die niet zijn gezien door uw gebruiker, kunt u meer items aanvragen om aan te bevelen en vervolgens de beoordeelde items handmatig filteren.

Doorlopende update van de aanbevelingsdeser

Online bijwerken (of continue training) van een aanbevelingsmodel wordt momenteel niet ondersteund in Machine Learning. Als u reacties van gebruikers op aanbevelingen wilt vastleggen en deze wilt gebruiken om het model te verbeteren, raden we u aan het volledige model regelmatig opnieuw te trainen. Incrementele training is niet mogelijk, maar u kunt een sliding window toepassen op de trainingsgegevens om ervoor te zorgen dat het gegevensvolume wordt geminimaliseerd tijdens het gebruik van de meest recente gegevens.

Verwachte invoer

Naam Type Description
Getrainde matchbox-aanbeveling ILearner Getrainde matchbox-aanbeveling
Te scoren gegevensset Gegevenstabel Te scoren gegevensset
Gebruikersfuncties Gegevenstabel Gegevensset met functies die gebruikers beschrijven

Deze gegevens zijn optioneel
Itemfuncties Gegevenstabel Gegevensset met functies die items beschrijven

Deze gegevens zijn optioneel

Moduleparameters

Name Bereik Type Standaard Beschrijving
Voorspellings soort aanbeveling Lijst Voorspellings soort Itemaanbeveling Geef het type voorspelling op dat door de aanbevelingsdeput wordt uitgevoerd
Selectie van aanbevolen items Lijst Itemselectie Van beoordeelde items (voor modelevaluatie) Selecteer de set items waar u aanbevelingen uit wilt doen
Gerelateerde gebruikersselectie Lijst Gebruikersselectie Van gebruikers met een beoordeling van items (voor modelevaluatie) Selecteer de set gebruikers die moet worden gebruikt bij het zoeken naar gerelateerde items
Selectie van gerelateerde items Lijst [Itemselectie Van beoordeelde items (voor modelevaluatie) Selecteer de set items die moet worden gebruikt bij het zoeken naar gerelateerde items

Uitvoerwaarden

Naam Type Description
Scored dataset Gegevenstabel Scored dataset

Uitzonderingen

Uitzondering Description
Fout 0022 Uitzondering treedt op als het aantal geselecteerde kolommen in de invoerset niet gelijk is aan het verwachte aantal.
Fout 0036 Uitzondering treedt op als er meerdere functievectoren zijn opgegeven voor een bepaalde gebruiker of een bepaald item.
Fout 0013 Er treedt een uitzondering op als de module-learner een ongeldig type heeft.
Fout 0035 Uitzondering treedt op als er geen functies zijn opgegeven voor een bepaalde gebruiker of een bepaald item.
Fout 0053 Uitzondering treedt op in het geval dat er geen gebruikersfuncties of items zijn voor Matchbox-aanbevelingen.
Fout 0003 Uitzondering treedt op als een of meer invoer null of leeg zijn.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Aanbeveling voor Matchbox trainen
Aanbevelingsfunctie voor evaluatie
Score