Förbättra din Custom Visions modell

I den här guiden får du lära dig hur du förbättrar kvaliteten på din Custom Vision Services modell. Kvaliteten på din klassificerare eller objekt detektor beror på mängden, kvaliteten och antalet olika märkta data som du anger och hur balanserade den övergripande data uppsättningen är. En bra modell har en bal anse rad inlärnings data uppsättning som är representativ för vad som kommer att skickas till den. Processen för att skapa en sådan modell är iterativ; Det är vanligt att ta några få avvisningar för att uppnå förväntade resultat.

Följande är ett allmänt mönster som hjälper dig att träna en mer exakt modell:

  1. Första rundade utbildningen
  2. Lägg till fler bilder och Balance data; omtrimma
  3. Lägg till bilder med varierande bakgrund, belysning, objekt storlek, kamera vinkel och stil; omtrimma
  4. Använd nya avbildningar för att testa förutsägelse
  5. Ändra befintliga tränings data enligt förutsägelse resultat

Förhindra överanpassning

Ibland kan en modell lära sig att göra förutsägelser baserade på valfria egenskaper som dina bilder har gemensamt. Om du till exempel skapar en klassificerare för äpplen eller citrus, och du har använt bilder av äpplen i händerna och av citrus på vita plåtar, kan klassificeraren ge onödigt stor betydelse för praktiska och plåtar i stället för äpplen eller citrus.

Bild av oväntad klassificering

Du kan åtgärda det här problemet genom att ange bilder med olika vinklar, bakgrunder, objekt storlek, grupper och andra variationer. I följande avsnitt expanderas dessa begrepp.

Data mängd

Antalet utbildnings bilder är den viktigaste faktorn för din data uppsättning. Vi rekommenderar att du använder minst 50 bilder per etikett som start punkt. Med färre avbildningar, finns det en högre risk för överanpassning, och när prestanda siffrorna kan föreslå bra kvalitet kan din modell ha problem med verkliga data.

Data balans

Det är också viktigt att överväga de relativa mängderna av dina utbildnings data. Till exempel kan du använda 500-bilder för en etikett och 50 bilder för en annan etikett för en data uppsättning som är i balans. Detta gör att modellen är mer korrekt för att förutsäga en etikett än en annan. Du får förmodligen bättre resultat om du behåller minst ett 1:2-förhållande mellan etiketten med minst bilder och etiketten med de flesta bilderna. Om etiketten med de flesta bilder till exempel har 500 bilder bör etiketten med minst bilder ha minst 250 bilder för träning.

Data mängd

Se till att använda bilder som är representativa för vad som kommer att skickas till klassificeraren under normal användning. Annars kan din modell lära sig att fatta förutsägelser baserat på valfria egenskaper som dina bilder har gemensamt. Om du till exempel skapar en klassificerare för äpplen eller citrus, och du har använt bilder av äpplen i händerna och av citrus på vita plåtar, kan klassificeraren ge onödigt stor betydelse för praktiska och plåtar i stället för äpplen eller citrus.

Bild av oväntad klassificering

Du kan åtgärda det här problemet genom att inkludera en mängd olika avbildningar för att se till att modellen kan generaliseras bra. Nedan visas några exempel på hur du kan göra inlärningen Mer Diverse:

  • Bakgrund: Ange bilder för ditt objekt framför olika bakgrunder. Foton i naturliga sammanhang är bättre än foton framför neutrala bakgrunder eftersom de ger mer information om klassificeraren.

    Bild av bakgrunds exempel

  • Belysning: Ge bilder med varierande belysning (det vill säga med blixt, hög exponering och så vidare), särskilt om de bilder som används för förutsägelsen har olika belysning. Det är också användbart att använda bilder med varierande mättnad, nyans och ljus styrka.

    Bild av belysnings exempel

  • Objekt storlek: Ange bilder där objekten varierar i storlek och nummer (till exempel ett foto av bananer och en närbild av en enda banan). Olika storlekar hjälper klassificeraren att generaliseras bättre.

    Bild av storleks exempel

  • Kamera vinkel: Ange bilder tagna med olika kamera vinklar. Alternativt, om alla dina foton måste tas med fasta kameror (till exempel övervaknings kameror), måste du tilldela en annan etikett till varje objekt som utförs regelbundet för att undvika överanpassning av — orelaterade objekt (till exempel lampposts) som nyckel funktion.

    Bild av vinkel exempel

  • Format: Ange bilder av olika format för samma klass (till exempel olika sorters frukt). Men om du har objekt av drastiskt olika format (t. ex. Mickey mus eller en verklig mus) rekommenderar vi att du ger dem etiketter som separata klasser för att bättre representera deras distinkta funktioner.

    Bild av format exempel

Negativa bilder (endast klassificerare)

Om du använder en bild klassificerare kan du behöva lägga till negativa exempel för att göra din klassificerar bättre. Negativa exempel är bilder som inte matchar någon av de andra taggarna. När du överför de här avbildningarna ska du använda den speciella negativa etiketten på dem.

Objekt identifieringar hanterar negativa prover automatiskt, eftersom alla bild områden utanför de ritade avgränsnings rutorna betraktas som negativa.

Anteckning

Custom Vision Service stöder viss automatisk negativ bild hantering. Om du till exempel skapar en druvmust för druvmust och banan och skickar en bild av en sko för förutsägelse, bör klassificeraren lägga ut bilden som nära 0% för både druvmust och banan.

Å andra sidan, i de fall där de negativa bilderna bara är en variation av de bilder som används i utbildningen, är det troligt att modellen klassificerar de negativa bilderna som en etikettad klass på grund av fantastiska likheter. Om du till exempel har en orange vs. grapefrukt-klassificerare och du matar in en bild av en Clementine kan det leda till att Clementine är orange eftersom många funktioner i Clementine liknar dem för apelsiner. Om dina negativa bilder är av samma typ, rekommenderar vi att du skapar en eller flera ytterligare Taggar (till exempel andra) och etiketterar de negativa bilderna med den här taggen under träningen så att modellen bättre skiljer sig mellan dessa klasser.

Överväg ocklusion och trunkering (endast objekt identifieringar)

Om du vill att objekt identifieraren ska identifiera trunkerade objekt (objektet är delvis klipp ut från bilden) eller Occluded objekt (objektet är delvis blockerat av ett annat objekt i bilden) måste du inkludera utbildnings avbildningar som omfattar dessa fall.

Anteckning

Problemet med objekt som Occluded av andra objekt kan inte förväxlas med överlappande tröskel, en parameter för bedömnings modell prestanda. Skjutreglaget för överlappande tröskelCustom vision webbplats hanterar hur mycket en förväntad markerings ram måste överlappa med den sanna gräns rutan för att anses korrekt.

Använd förutsägelse avbildningar för ytterligare utbildning

När du använder eller testar modellen genom att skicka avbildningar till förutsägelse slut punkten, lagrar Custom Vision tjänsten de avbildningarna. Du kan sedan använda dem för att förbättra modellen.

  1. Om du vill visa bilder som skickats till modellen öppnar du Custom vision webb sidan, går till projektet och väljer fliken förutsägelser . Standardvyn visar bilder från den aktuella iterationen. Du kan använda List menyn iteration för att visa bilder som skickats under föregående iterationer.

    skärm bild av fliken förutsägelser med bilder i vyn

  2. Hovra över en bild för att se de taggar som förutsägs av modellen. Bilderna sorteras så att de som kan ta de flesta förbättringar av modellen visas överst. Om du vill använda en annan sorterings metod gör du ett val i avsnittet Sortera .

    Om du vill lägga till en bild i dina befintliga utbildnings data väljer du bilden, anger rätt tagg (er) och klickar på Spara och Stäng. Bilden tas bort från förutsägelserna och läggs till i uppsättningen med utbildnings bilder. Du kan visa den genom att välja fliken träna bilder .

    Bild av taggnings Sidan

  3. Använd sedan knappen träna för att träna om modellen.

Granska förutsägelser visuellt

Om du vill kontrol lera bild förutsägelserna går du till fliken inlärnings bilder , väljer din tidigare inlärning på upprepnings menyn och markerar en eller flera taggar under avsnittet taggar . Vyn bör nu visa en röd ruta runt var och en av de bilder som modellen inte kunde förutsäga den angivna taggen på rätt sätt.

Bild av upprepnings historiken

Ibland kan en visuell granskning identifiera mönster som du sedan kan korrigera genom att lägga till fler utbildnings data eller ändra befintliga tränings data. En klassificerare för äpplen eller kalk kan till exempel felaktigt märka alla gröna äpplen som kalk. Du kan sedan åtgärda problemet genom att lägga till och tillhandahålla tränings data som innehåller taggade bilder av grön äpplen.

Nästa steg

I den här hand boken har du lärt dig flera tekniker för att göra din anpassade bild klassificerings modell eller objekt detektor modell mer exakt. Nu ska du lära dig hur du testar bilder genom programmering genom att skicka dem till förutsägelse-API: et.