Aanbeveling van Score matchbox

Beoordeelt de voor spellingen voor een gegevensset met behulp van de matchbox-aanbeveling

Categorie: machine learning/Score

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt beschreven hoe u de module Score matchbox recommending in azure machine learning Studio (klassiek) kunt gebruiken om voor spellingen te maken op basis van een getraind aanbevelings model, op basis van de matchbox-algoritme van micro soft Research.

De matchbox-aanbeveling kan vier verschillende soorten voor spellingen genereren:

Bij het maken van de laatste drie soorten voor spellingen kunt u in de productie modus of de evaluatie modusuitvoeren.

  • De productie modus houdt rekening met alle gebruikers of items en wordt doorgaans gebruikt in een webservice.

    U kunt scores maken voor nieuwe gebruikers, niet alleen voor gebruikers die tijdens de training zijn gezien. Zie deze sectievoor meer informatie.

  • De evaluatie modus werkt op een beperkt aantal gebruikers of items die kunnen worden geëvalueerd en wordt doorgaans gebruikt tijdens het experimenteren.

Tip

Leer alles wat u moet weten over de end-to-end-ervaring bij het bouwen van een aanbevelings systeem in deze zelf studie vanuit het .NET-ontwikkel team. Bevat voorbeeld code en discussie over het aanroepen van Azure Machine Learning vanuit een toepassing.

Aanbevelings engine voor .NET-toepassingen bouwen met Azure Machine Learning

Meer informatie over de matchbox-aanbeveling

Het doel van het maken van een aanbevelings systeem is het aanbevelen van een of meer "items" aan "gebruikers" van het systeem. Voor beelden van een item kunnen een film, een restaurant, een boek of een nummer zijn. Een gebruiker kan een persoon, een groep personen of een andere entiteit met voorkeurs instellingen voor item zijn.

Er zijn twee belang rijke benaderingen voor aanbevolen systemen. De eerste is de op inhoud gebaseerde benadering, waarmee u functies voor zowel gebruikers als items kunt gebruiken. Gebruikers kunnen worden beschreven door eigenschappen zoals leeftijd en geslacht, en items kunnen worden beschreven door eigenschappen als auteur en fabrikant. Typische voor beelden van systemen met aanbeveling op basis van inhoud zijn te vinden op de sociale matchmaking-sites. De tweede benadering is het samen werken met filters, waarbij alleen id's van de gebruikers en de items worden gebruikt en impliciete informatie over deze entiteiten wordt opgehaald uit een (sparse) matrix met beoordelingen van de gebruikers aan de items. We hebben meer informatie over een gebruiker van de items die ze hebben geclassificeerd en van andere gebruikers die dezelfde items hebben geclassificeerd.

De matchbox-aanbeveling combineert samenwerkings filters met een op inhoud gebaseerde aanpak. Het wordt daarom als een hybride aanbevelingbeschouwd. Wanneer een gebruiker relatief nieuw is voor het systeem, worden de voor spellingen verbeterd door gebruik te maken van de functie gegevens van de gebruiker, waardoor het probleem bekend ' koude start ' wordt opgelost. Als er echter voldoende classificaties van een bepaalde gebruiker zijn, is het mogelijk om volledig gepersonaliseerde voor spellingen te maken op basis van hun specifieke beoordelingen, in plaats van alleen op basis van hun functies. Daarom is er sprake van een soepele overgang van aanbevelingen op basis van inhoud naar aanbevelingen op basis van gezamenlijke filtering. Zelfs als er geen gebruikers-of item functies beschikbaar zijn, werkt matchbox nog steeds in de samenwerkings modus.

Meer informatie over de matchbox-aanbeveling en het bijbehorende onderliggende Probabilistic-algoritme vindt u in het desbetreffende scriptie:

Voorbeelden

Zie de Azure AI Galleryvoor voor beelden van het maken van scores van een aanbevelings engine.

  • Aanbevelingen overal: dit blog bericht biedt een geavanceerde Inleiding tot aanbevolen systemen met veel visuele hulp middelen.

Advieser voor Score matchbox configureren

Deze module ondersteunt verschillende soorten aanbevelingen, elk met verschillende vereisten. Klik op de koppeling voor het type gegevens dat u hebt en het type aanbeveling dat u wilt maken.

Voor spel classificaties

Wanneer u de classificaties voor spelt, wordt in het model berekend hoe een bepaalde gebruiker reageert op een bepaald item, op basis van de trainings gegevens. Daarom moeten de invoer gegevens voor de Score zowel een gebruiker als het te beoordelen item bevatten.

  1. Voeg een getraind aanbevelings model toe aan uw experiment en verbind het met de getrainde matchbox-aanbeveling. U moet het model maken met behulp van Train matchbox aanbevelen.

  2. Voorspellings soort aanbevolen: Selecteer beoordelings voorspelling. Er zijn geen verdere para meters vereist.

  3. Voeg de gegevens toe waarvoor u de voor spellingen wilt maken en verbind deze met de gegevensset voor de Score.

    Om beoordelingen te voors pellen, moet de invoer gegevensset gebruikers paren bevatten.

    De gegevensset kan een optionele derde kolom met beoordelingen bevatten voor het combi neren van gebruikers items in de kolommen eerste en tweede, maar de derde kolom wordt genegeerd tijdens de voor spelling.

  4. (Optioneel). Als u een gegevensset van gebruikers functies hebt, verbindt u deze met gebruikers functies.

    De gegevensset van gebruikers functies moet de gebruikers-id in de eerste kolom bevatten. De overige kolommen moeten waarden bevatten die de gebruikers kenmerken, zoals geslacht, voor keuren, locatie, enzovoort.

    Functies van gebruikers die geclassificeerde items hebben, worden genegeerd door Score matchbox aanbevolen, omdat deze al zijn geleerd tijdens de training. Filter daarom uw gegevensset vooraf om alleen gebruikers met een koude startte gebruiken of gebruikers die geen items hebben geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder gebruikers functies te gebruiken, kunt u geen gebruikers functies introduceren tijdens het scoren.

  5. Als u een gegevensset van item functies hebt, kunt u deze verbinden met item functies.

    De gegevensset van het item bevat een item-id in de eerste kolom. De overige kolommen moeten waarden bevatten die de items kenmerken.

    Functies van geclassificeerde items worden genegeerd door de Score matchbox-aanbeveling als ze al zijn geleerd tijdens de training. Beperk daarom uw score gegevensset voor koude start itemsof items die door geen enkele gebruiker zijn geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder gebruik te maken van de functie onderdelen, kunt u geen artikel functies introduceren tijdens het scoren.

  6. Gebruik de optionele vijfde invoer poort, met de naam trainings gegevensset, om items te verwijderen die al zijn geclassificeerd op basis van de Voorspellings resultaten.

    Als u dit filter wilt Toep assen, koppelt u de oorspronkelijke trainings gegevensset aan de invoer poort.

  7. Voer het experiment uit.

Resultaten voor de beoordeling van voor spellingen

De uitvoer gegevensset bevat drie kolommen met de gebruiker, het item en de voorspelde classificatie voor elke invoer gebruiker en elk item.

Daarnaast worden de volgende wijzigingen toegepast tijdens de Score:

  • Ontbrekende waarden in de functie kolommen van een gebruiker of item worden automatisch vervangen door de modus van de niet-ontbrekende Trainingsset waarden.

  • Alle gebruikers-en item functies worden opnieuw geschaald op basis van de overeenkomende maximum absolute waarden die worden weer gegeven in de training.

  • Er wordt geen vertaling toegepast op de functie waarden om hun sparsity te behouden.

  • Functies met een teken reeks waarde worden geconverteerd naar een set met functies voor de indicator met binaire waarden.

Aanbevelen

Als u items wilt aanbevelen voor gebruikers, geeft u een lijst met gebruikers en items op als invoer. Op basis van deze gegevens gebruikt het model de kennis over bestaande items en gebruikers om een lijst met items te genereren met een waarschijnlijk beroep op elke gebruiker. U kunt het aantal geretourneerde aanbevelingen aanpassen en een drempel instellen voor het aantal eerdere aanbevelingen dat vereist is om een aanbeveling te genereren.

  1. Voeg een getraind aanbevelings model toe aan uw experiment en verbind het met de getrainde matchbox-aanbeveling. U moet het model maken met behulp van Train matchbox aanbevelen.

  2. Als u items wilt aanbevelen voor een bepaalde lijst met gebruikers, stelt u de Voorspellings soort voor aanbevolen functies in op item aanbeveling.

  3. Aanbevolen item selecteren: Geef aan of u de Score module in productie of voor model evaluatie gebruikt door een van deze waarden te kiezen:

    • Van geclassificeerde items (voor model evaluatie): Selecteer deze optie als u een model ontwikkelt of test. Met deze optie wordt de evaluatie modusingeschakeld. in de module worden alleen aanbevelingen gedaan van die items in de ingevoerde gegevensset die zijn geclassificeerd.

    • Van alle items: Selecteer deze optie als u een experiment wilt instellen voor gebruik in een webservice of productie omgeving. Met deze optie schakelt u de productie modusin. de module maakt aanbevelingen van alle items die tijdens de training worden weer gegeven.

  4. Voeg de gegevensset toe waarvoor u voor spellingen wilt maken en verbind deze met de gegevensset omdeze te beoordelen.

    • Als u kiest voor de optie van alle items, moet de invoer gegevensset bestaan uit één en slechts één kolom die de id's van gebruikers bevat waarvoor aanbevelingen moeten worden gedaan.

      Als de gegevensset meer dan één kolom bevat, wordt er een fout gegenereerd. Gebruik de module select columns in dataset om extra kolommen uit de invoer gegevensset te verwijderen.

    • Als u kiest voor de optie, van nominale items (voor model evaluatie), moet de invoer gegevensset bestaan uit gebruikers paren. De eerste kolom moet de gebruikers -id bevatten. De tweede kolom moet de bijbehorende item -id's bevatten.

      De gegevensset kan een derde kolom van classificaties van gebruikers items bevatten, maar deze kolom wordt genegeerd.

  5. (Optioneel). Als u een gegevensset van gebruikers functieshebt, verbindt u deze met gebruikers functies.

    De eerste kolom in de gegevensset voor gebruikers functies moet de gebruikers-id bevatten. De overige kolommen moeten waarden bevatten die de gebruiker kenmerken, zoals geslacht, voor keuren, locatie, enzovoort.

    Functies van gebruikers die geclassificeerde items hebben, worden genegeerd door Score matchbox aanbevolen, omdat deze functies tijdens de training al zijn geleerd. Daarom kunt u uw gegevensset vooraf filteren om alleen koude gebruikerstoe te voegen of gebruikers die geen items hebben geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder gebruikers functies te gebruiken, kunt u geen onderdelen Toep assen gebruiken tijdens de score.

  6. Beschrijving Als u een gegevensset van item functieshebt, kunt u deze verbinden met item functies.

    De eerste kolom in de gegevensset item functies moet de item-id bevatten. De overige kolommen moeten waarden bevatten die de items kenmerken.

    Functies van geclassificeerde items worden genegeerd door de Score matchbox-aanbeveling, omdat deze functies tijdens de training al zijn geleerd. Daarom kunt u uw score gegevensset beperken tot koude start itemsof items die niet door gebruikers zijn geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder de onderdelen van het item te gebruiken, mag u geen item functies gebruiken als u een score gebruikt.

  7. Maximum aantal items dat aan een gebruikerkan worden aanbevolen: Typ het aantal items dat voor elke gebruiker moet worden geretourneerd. Standaard worden 5 items aanbevolen.

  8. Minimum grootte van de aanbevelings groep per gebruiker: Typ een waarde die aangeeft hoeveel eerdere aanbevelingen zijn vereist. Deze para meter is standaard ingesteld op 2, wat betekent dat het item moet worden aanbevolen door ten minste twee andere gebruikers.

    Deze optie moet alleen worden gebruikt als u een score in de evaluatie modus hebt. De optie is niet beschikbaar als u in alle itemsselecteert.

  9. Voer het experiment uit.

Resultaten van aanbeveling van het item

De gescoorde gegevensset die door Score matchbox wordt geretourneerd, vermeldt de aanbevolen items voor elke gebruiker.

  • De eerste kolom bevat de gebruikers-id's.
  • Er worden een aantal extra kolommen gegenereerd, afhankelijk van de waarde die u hebt ingesteld voor het maximum aantal items dat aan een gebruikermoet worden aanbevolen. Elke kolom bevat een aanbevolen item (per id). De aanbevelingen worden geordend op basis van de gebruikers-item affiniteit, waarbij het item met de hoogste affiniteit in kolom, item 1, is geplaatst.

Waarschuwing

Deze gescoorde gegevensset kan niet worden geëvalueerd met behulp van de module aanbeveling evalueren .

De optie voor het vinden van gerelateerde gebruikers is handig als u ' mensen zoals u ' aanbeveelt, of als u een pool maakt van gelijksoortige gebruikers waarop andere typen voor spellingen moeten worden gebaseerd.

  1. Voeg een getraind aanbevelings model toe aan uw experiment en verbind het met de getrainde matchbox-aanbeveling. U moet het model maken met behulp van Train matchbox aanbevelen.

  2. Voorspellings type voor aanbevolenfuncties: Selecteer gerelateerde gebruikers.

  3. Gerelateerde gebruikers selectie: Geef aan hoe u het model wilt gebruiken en geef de groep gebruikers op waarop de scores moeten worden gebaseerd als volgt:

    • Van alle gebruikers: Selecteer deze optie als u een experiment wilt instellen voor gebruik in een webservice of productie of als u voor spellingen wilt maken voor nieuwe gebruikers. Met deze optie wordt de productie modusingeschakeld en wordt de aanbeveling van de module alleen gebaseerd op gebruikers die tijdens de training zijn gezien.

    • Van gebruikers die items hebben beoordeeld (voor model evaluatie): Selecteer deze optie als u een model wilt ontwikkelen of testen. Met deze optie wordt de evaluatie modusingeschakeld, en in het model worden de aanbevelingen gebaseerd op de gebruikers in de testset die een aantal algemene items heeft geclassificeerd.

  4. Verbind een gegevensset die de gebruikers bevat waarvoor u de voor spellingen wilt genereren. De indeling voor deze gegevensset is afhankelijk van het feit of u de Score module in de productie modus of de evaluatie modus gebruikt.

    • Productie modus, gebruiken vanuit alle items

      De gegevensset die moet worden genoteerd, bestaat alleen uit gebruikers waarvoor u gerelateerde gebruikers wilt zoeken. De eerste en enige kolom moeten de gebruikers-id's bevatten. Als er andere kolommen worden opgenomen, treedt er een fout op. Gebruik de module select columns in dataset om overbodige kolommen te verwijderen.

    • Evaluatie modus met behulp van nominale items (voor model evaluatie)

      De gegevensset die moet worden genoteerd, bestaat uit 2-3 kolommen, met de paren van gebruikers items. De eerste kolom moet gebruikers-id's bevatten. De tweede kolom moet item-id's bevatten. De gegevensset kan een derde kolom met beoordelingen bevatten (door de gebruiker in kolom 1 voor het item in kolom 2), maar de classificatie kolom wordt genegeerd.

  5. Maximum aantal gerelateerde gebruikers dat moet worden gezocht voor een gebruiker: Typ een getal dat het maximum aantal voor spellingen voor elke gebruiker aangeeft. De standaard waarde is 5, wat betekent dat er Maxi maal vijf gerelateerde gebruikers kunnen worden geretourneerd, maar in sommige gevallen kan er minder dan 5 zijn.

  6. Configureer de volgende aanvullende para meters in de evaluatie modus (van gebruikers die items hebben beoordeeld):

    • Minimum aantal items dat de query gebruiker en de gerelateerde gebruiker moeten hebben geclassificeerd met een gemeen schappelijke classificatie: metdeze waarde wordt een drempel waarde voor aanbevelingen ingesteld. Het getal dat u typt, staat voor het minimum aantal items dat door de doel gebruiker en de potentiële gerelateerde gebruiker moet zijn geclassificeerd. De standaard waarde is 2, wat betekent dat er ten minste twee items door beide gebruikers moeten worden geclassificeerd.

    • Minimale grootte van de gerelateerde gebruikers groep voor één gebruiker: met deze waarde bepaalt u het minimum aantal vergelijk bare gebruikers dat nodig is om een aanbeveling te maken. De waarde is standaard 2, wat betekent dat als er slechts twee gebruikers zijn die verband houden met het classificeren van dezelfde items, u rekening moet houden met de waarden en een aanbeveling kunt genereren.

  7. (Optioneel). Als u een gegevensset van gebruikers functies hebt, verbindt u deze met gebruikers functies.

    De eerste kolom in de gegevensset voor gebruikers functies moet de gebruikers-id bevatten. De overige kolommen moeten waarden bevatten die de gebruiker kenmerken, zoals geslacht, voor keuren, locatie, enzovoort.

    Functies van gebruikers die geclassificeerde items hebben, worden genegeerd door Score matchbox aanbevolen , omdat deze functies tijdens de training al zijn geleerd. Filter daarom uw gegevensset vooraf om alleen gebruikers met een koude startte gebruiken of gebruikers die geen items hebben geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder gebruikers functies te gebruiken, kunt u geen gebruikers functies Toep assen tijdens de scoreing.

  8. Beschrijving Als u een gegevensset van item functies hebt, verbindt u deze met item functies.

    De eerste kolom in de gegevensset item functies moet de item-id bevatten. De overige kolommen moeten waarden bevatten die de items kenmerken.

    Functies van geclassificeerde items worden genegeerd door Score matchbox-aanbeveling omdat deze functies tijdens de training al zijn geleerd. Daarom kunt u uw score gegevensset beperken tot koude start itemsof items die door geen enkele gebruiker zijn geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder de onderdelen van het item te gebruiken, mag u geen item functies gebruiken als u een score gebruikt.

  9. Voer het experiment uit.

De gescoorde gegevensset die door Score matchbox wordt geretourneerd, geeft een lijst van de gebruikers die zijn gerelateerd aan elke gebruiker in de invoer gegevensset.

Voor elke gebruiker die in de invoer gegevensset is opgegeven, bevat de resulterende gegevensset een set verwante gebruikers.

  • De eerste kolom bevat de id van de doel gebruiker (de gebruiker heeft de invoer opgegeven).

  • Er worden aanvullende kolommen gegenereerd die de id's van gerelateerde gebruikers bevatten. Het aantal extra kolommen is afhankelijk van de waarde die u hebt ingesteld in de optie, maximum aantal gerelateerde gebruikers dat voor een gebruiker moet worden gevonden.

    Gerelateerde gebruikers worden geordend op basis van de sterkte van de relatie met de doel gebruiker, met de meest gerelateerde gebruiker in de kolom, gerelateerde gebruiker 1.

Als u verwante items voordicteert, kunt u aanbevelingen voor gebruikers genereren op basis van items die al zijn geclassificeerd.

  1. Voeg een getraind aanbevelings model toe aan uw experiment en verbind het met de getrainde matchbox-aanbeveling. U moet het model maken met behulp van Train matchbox aanbevelen.

  2. Voorspellings type voor aanbevolenfuncties: Selecteer gerelateerde items.

  3. Verbind een gegevensset die de gebruikers bevat waarvoor u de voor spellingen wilt genereren. De indeling voor deze gegevensset is afhankelijk van het feit of u de Score module in de productie modus of de evaluatie modus gebruikt.

    • Productie modus, gebruiken vanuit alle items

      De gegevensset die moet worden genoteerd, bestaat alleen uit items waarvoor u gerelateerde gebruikers wilt zoeken.

      De eerste en enige kolom moeten de item-id's bevatten. Als er andere kolommen worden opgenomen, treedt er een fout op. Gebruik de module select columns in dataset om overbodige kolommen te verwijderen.

    • Evaluatie modus met behulp van nominale items (voor model evaluatie)

      De gegevensset die moet worden genoteerd, bestaat uit 2-3 kolommen, met de paren van gebruikers items. De eerste kolom moet gebruikers-id's bevatten. De tweede kolom moet item-id's bevatten.

      De gegevensset kan een derde kolom met beoordelingen bevatten (door de gebruiker in kolom 1 voor het item in kolom 2), maar de classificatie kolom wordt genegeerd.

  4. Maximum aantal verwante items dat moet worden gezocht voor een item>: Typ een getal dat het maximum aantal voor spellingen voor elk item aangeeft.

    De standaard waarde is 5, wat betekent dat er Maxi maal vijf gerelateerde items kunnen worden geretourneerd, maar er kan minder dan 5 zijn.

  5. Als u de evaluatie modus gebruikt (van gebruikers die items hebben beoordeeld), configureert u deze aanvullende para meters:

    • Het minimum aantal items dat het query-item en het gerelateerde item moeten zijn geclassificeerd met een gemeen schappelijke classificatie: met deze waarde wordt een drempel waarde voor aanbevelingen ingesteld. Het getal dat u typt, staat voor het minimum aantal items dat is beoordeeld door de doel gebruiker en een andere gerelateerde gebruiker. De standaard waarde is 2, wat betekent dat er ten minste twee items moeten worden beoordeeld door de doel gebruiker en de bijbehorende gebruiker.

    • Minimale grootte van de gerelateerde item groep voor één item: deze waarde bepaalt het minimale aantal vergelijk bare items die nodig zijn om een aanbeveling te maken. De waarde is standaard 2, wat betekent dat als er net zo weinig twee items zijn die zijn gerelateerd door dezelfde gebruikers te hebben geclassificeerd, u er rekening mee moet houden en een aanbeveling kunt genereren.

  6. (Optioneel). Als u een gegevensset van gebruikers functies hebt, verbindt u deze met gebruikers functies.

    De eerste kolom in de gegevensset voor gebruikers functies moet de gebruikers-id bevatten. De overige kolommen moeten waarden bevatten die de gebruiker kenmerken, zoals geslacht, voor keuren, locatie, enzovoort.

    Functies van gebruikers die geclassificeerde items hebben, worden genegeerd door Score matchbox aanbevolen, omdat deze functies tijdens de training al zijn geleerd. Daarom kunt u uw gegevensset vooraf filteren om alleen koude gebruikerstoe te voegen of gebruikers die geen items hebben geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder gebruikers functies te gebruiken, kunt u geen gebruikers functies Toep assen tijdens de scoreing.

  7. Beschrijving Als u een gegevensset van item functies hebt, kunt u deze verbinden met item functies.

    De eerste kolom in de gegevensset item functies moet de item-id bevatten. De overige kolommen moeten waarden bevatten die het item kenmerken.

    Functies van geclassificeerde items worden genegeerd door de Score matchbox-aanbeveling, omdat deze functies tijdens de training al zijn geleerd. Daarom kunt u uw score gegevensset beperken tot koude start itemsof items die door geen enkele gebruiker zijn geclassificeerd.

    Waarschuwing

    Als het model is getraind zonder de onderdelen van het item te gebruiken, mag u geen item functies gebruiken als u een score gebruikt.

  8. Beschrijving In een voorspellend experiment kunt u een vijfde invoer poort, met de naam trainings gegevensset, gebruiken om bestaande gebruikers te verwijderen die zijn opgenomen in de trainings gegevens van het model van de Voorspellings resultaten.

    Als u dit filter wilt Toep assen, koppelt u de oorspronkelijke trainings gegevensset aan de invoer poort.

  9. Voer het experiment uit.

De gescoorde gegevensset die door Score matchbox wordt geretourneerd, geeft een lijst van de verwante items voor elk item in de invoer gegevensset.

  • De eerste kolom bevat de id van het doel item (het item dat als invoer is opgegeven).

  • Er worden aanvullende kolommen gegenereerd met de id's van gerelateerde items. Het aantal extra kolommen is afhankelijk van de waarde die u hebt ingesteld in de optie, het maximum aantal verwante items dat voor een item moet worden gevonden.

    De gerelateerde items worden geordend op basis van de sterkte van de relatie met het doel item, met het meest ververwante item in de kolom, gerelateerde item 1.

Technische opmerkingen

In deze sectie vindt u antwoorden op enkele veelgestelde vragen over het gebruik van de aanbevolen functie voor het maken van voor spellingen.

Gebruikers en aanbevelingen voor koude start

Als u aanbevelingen wilt maken, moet u in de module Score matchbox-aanbeveling dezelfde invoer gebruiken als bij het trainen van het model, met inbegrip van een gebruikers-id. Dat komt doordat het algoritme moet weten of er tijdens de training iets over deze gebruiker is geleerd.

Voor nieuwe gebruikers hebt u echter mogelijk geen gebruikers-ID, maar alleen enkele gebruikers functies, zoals leeftijd, geslacht, enzovoort.

U kunt nog steeds aanbevelingen maken voor gebruikers die nieuw zijn op uw systeem door ze te verwerken als gebruikers met een koude start. Voor dergelijke gebruikers gebruikt het aanbevelings algoritme geen eerdere geschiedenis of vorige beoordelingen, alleen gebruikers functies.

Voor de voor spelling is een koude start gebruiker gedefinieerd als een gebruiker met een ID die niet is gebruikt voor training. Om ervoor te zorgen dat de Id's niet overeenkomen met de Id's die in de training worden gebruikt, kunt u nieuwe id's maken. U kunt bijvoorbeeld wille keurige Id's binnen een opgegeven bereik genereren of een reeks Id's vooraf toewijzen voor gebruikers met een koude start.

Als u echter geen gezamenlijke filter gegevens hebt, zoals een vector van gebruikers functies, is het beter om een classificatie of regressie meer te gebruiken.

Productie gebruik van de matchbox-aanbeveling

Als u met de matchbox-aanbeveling hebt geexperimenteerd en vervolgens het model naar productie hebt verplaatst, moet u rekening houden met de volgende belang rijke verschillen bij het gebruik van de aanbeveling in de evaluatie modus en in de productie modus:

  • Voor evaluatie, per definitie, zijn voor spellingen vereist die kunnen worden gecontroleerd tegen de achterliggende waarheid in een testset. Wanneer u de aanbevolen functie evalueert, moet u daarom alleen items voors pellen die zijn geclassificeerd in de testset. Dit kan nood zakelijk zijn om de mogelijke waarden te beperken die worden voor speld.

    Wanneer u echter het model operationeel maken, wijzigt u doorgaans de Voorspellings modus om aanbevelingen te doen op basis van alle mogelijke items, om de beste voor spellingen te krijgen. Voor veel van deze voor spellingen is er geen overeenkomende grond waarheid, waardoor de nauw keurigheid van de aanbeveling niet op dezelfde manier kan worden gecontroleerd als tijdens het experimenteren.

  • Als u geen gebruikers-ID opgeeft in productie en alleen een functie Vector levert, kunt u een lijst met alle aanbevelingen voor alle mogelijke gebruikers ontvangen. Zorg ervoor dat u een gebruikers-ID opgeeft.

    Als u het aantal geretourneerde aanbevelingen wilt beperken, kunt u ook het maximum aantal items opgeven dat per gebruiker wordt geretourneerd.

  • Het is niet mogelijk om voor spellingen te genereren voor items die niet eerder zijn beoordeeld. Dit is standaard.

    De reden hiervoor is dat, als u alleen de items wilt aanbevelen die niet zijn geclassificeerd, de aanbeveling de volledige set met trainings gegevens moet opslaan met het model, waardoor uw gebruik van opslag zou toenemen.

    Als u alleen items wilt aanbevelen die niet door uw gebruiker zijn gezien, kunt u meer items aanvragen om aan te bevelen en vervolgens hand matig de classificaties uit te filteren.

Voortdurende update van de aanbevolen

Online bijwerken (of doorlopende training) van een aanbevelings model wordt momenteel niet ondersteund in Azure Machine Learning. Als u gebruikers reacties op aanbevelingen wilt vastleggen en deze wilt gebruiken voor het verbeteren van het model, kunt u het volledige model regel matig opnieuw trainen. Er kan geen stapsgewijze training worden uitgevoerd, maar u kunt een sliding window Toep assen op de trainings gegevens om ervoor te zorgen dat het gegevens volume is geminimaliseerd terwijl de meest recente gegevens worden gebruikt.

Verwachte invoer

Naam Type Beschrijving
Getrainde matchbox-aanbeveling ILearner Getrainde matchbox-aanbeveling
Gegevensset voor Score Gegevens tabel Gegevensset voor Score
Gebruikers functies Gegevens tabel Gegevensset met functies waarmee gebruikers worden beschreven

Deze gegevens zijn optioneel
Item functies Gegevens tabel Gegevensset met functies voor het beschrijven van items

Deze gegevens zijn optioneel

Module parameters

Naam Bereik Type Standaard Beschrijving
Voorspellings type Aanbevolen Lijst Voorspellings type Item aanbeveling Geef het type voor spelling op dat moet worden uitgevoerd door de aanbevolen functie
Aanbevolen item selectie Lijst Item selecteren Van geclassificeerde items (voor model evaluatie) Selecteer de set items waarvoor u aanbevelingen wilt doen
Gerelateerde gebruikers selectie Lijst Gebruikersselectie Van gebruikers die items hebben beoordeeld (voor de model evaluatie) Selecteer de set gebruikers die moet worden gebruikt bij het zoeken naar verwante items
Selectie van gerelateerde items Lijst [Item selectie Van geclassificeerde items (voor model evaluatie) Selecteer de set items die moeten worden gebruikt bij het zoeken naar verwante items

Outputs

Naam Type Beschrijving
Score gegevensset Gegevens tabel Score gegevensset

Uitzonderingen

Uitzondering Beschrijving
Fout 0022 Uitzonde ring treedt op als het aantal geselecteerde kolommen in de invoer-gegevensset niet gelijk is aan het verwachte aantal.
Fout 0036 Uitzonde ring treedt op als er meerdere functie vectoren voor een bepaalde gebruiker of een item zijn opgegeven.
Fout 0013 Er treedt een uitzonde ring op als door gegeven aan de module-leerder een ongeldig type heeft.
Fout 0035 Uitzonde ring treedt op als er geen functies voor een gegeven gebruiker of item zijn opgegeven.
Fout 0053 Uitzonde ring treedt op wanneer er geen gebruikers functies of items zijn voor matchbox-aanbevelingen.
Fout 0003 Uitzonde ring treedt op als een of meer invoer waarden null of leeg zijn.

Zie machine learning fout codesvoor een lijst met fouten die specifiek zijn voor Studio-modules (Classic).

Zie Machine Learning rest API fout codesvoor een lijst met API-uitzonde ringen.

Zie ook

Train matchbox-aanbeveling
Aanbeveling evalueren
Score