Snabbstart: Skapa en objektdetektor med Custom Vision webbplats
I den här snabbstarten lär du dig att använda webbplatsen Custom Vision för att skapa en objektdetektormodell. När du har byggt en modell kan du testa den med nya bilder och så småningom integrera den i din egen bildigenkänningsapp.
Om du inte har någon Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.
Förutsättningar
- En uppsättning bilder som du kan använda för att träna din detektormodell. Du kan använda uppsättningen exempelbilder på GitHub. Eller så kan du välja egna bilder med hjälp av tipsen nedan.
Skapa Custom Vision resurser
Om du vill använda Custom Vision Service måste du skapa Custom Vision utbildning och förutsägelse resurser i Azure. Om du vill göra det i Azure Portal fyller du i dialog rutan på sidan skapa Custom vision för att skapa både en utbildnings-och förutsägelse resurs.
Skapa ett nytt projekt
I webbläsaren navigerar du till Custom Vision och väljer Logga in. Logga in med samma konto som du använde för att logga in på Azure Portal.

Om du vill skapa ditt första projekt väljer du Nytt Project. Dialogrutan Skapa nytt projekt visas.

Ange ett namn och en beskrivning för projektet. Välj sedan en resursgrupp. Om ditt inloggade konto är associerat med ett Azure-konto visar listrutan Resursgrupp alla dina Azure-resursgrupper som innehåller en Custom Vision-tjänstresurs.
Anteckning
Om ingen resursgrupp är tillgänglig bekräftar du att du har loggat in på customvision.ai med samma konto som du använde för att logga in på Azure Portal. Kontrollera också att du har valt samma "katalog" på Custom Vision webbplats som katalogen i den Azure Portal där Custom Vision resurserna finns. På båda platserna kan du välja din katalog från den nedrullningsna kontomenyn i det övre högra hörnet på skärmen.
Välj Objektidentifiering under Project Typer.
Välj sedan en av de tillgängliga domänerna. Varje domän optimerar detektorn för specifika typer av bilder, enligt beskrivningen i följande tabell. Du kommer att kunna ändra domänen senare om du vill.
Domain Syfte Allmänt Optimerad för en mängd olika objektidentifieringsuppgifter. Om ingen av de andra domänerna är lämplig, eller om du är osäker på vilken domän du ska välja, väljer du domänen Generisk. Logotyp Optimerad för att hitta varumärkeslogotyp i bilder. Produkter på hyllor Optimerad för att identifiera och klassificera produkter på hyllor. Kompakta domäner Optimerad för begränsningar för objektidentifiering i realtid på mobila enheter. Modeller som genereras av kompakta domäner kan exporteras för att köras lokalt. Välj slutligen Skapa projekt.
Välj träningsbilder
Som ett minimum rekommenderar vi att du använder minst 30 bilder per tagg i den inledande träningsuppsättningen. Du vill också samla in några extra bilder för att testa din modell när den har tränats.
Använd bilder med visuell variation för att träna din modell effektivt. Välj bilder som varierar beroende på:
- Kameravinkel
- Belysning
- bakgrund
- visuellt format
- enskilda/grupperade ämne
- ikoner
- typ
Kontrollera också att alla dina träningsbilder uppfyller följande kriterier:
- .jpg, .png, .bmp eller .gif format
- inte större än 6 MB (4 MB för förutsägelsebilder)
- inte mindre än 256 bildpunkter på den kortaste kanten; avbildningar som är kortare än detta skalas automatiskt upp av Custom Vision Service
Anteckning
Behöver du en bredare uppsättning bilder för att slutföra träningen? Med Trove, Microsoft Garage projekt, kan du samla in och köpa uppsättningar av bilder i utbildningssyfte. När du har samlat in dina bilder kan du ladda ned dem och sedan importera dem till ditt Custom Vision-projekt som vanligt. Besök Trove-sidan om du vill veta mer.
Ladda upp och tagga bilder
I det här avsnittet laddar du upp och taggar bilder manuellt för att träna detektorn.
Om du vill lägga till bilder väljer du Lägg till bilder och sedan Bläddra bland lokala filer. Välj Öppna för att ladda upp bilderna.

Du ser dina uppladdade bilder i avsnittet Ej taggad i användargränssnittet. Nästa steg är att manuellt tagga de objekt som du vill att detektorn ska lära sig att känna igen. Klicka på den första bilden för att öppna dialogrutan taggning.

Klicka och dra en rektangel runt objektet i bilden. Ange sedan ett nytt taggnamn + med knappen eller välj en befintlig tagg i listrutan. Det är viktigt att tagga varje instans av de objekt som du vill identifiera, eftersom detektorn använder det otaggade bakgrundsområdet som ett negativt exempel i träningen. När du är klar med taggningen klickar du på pilen till höger för att spara taggarna och gå vidare till nästa bild.

Om du vill ladda upp en annan uppsättning bilder går du tillbaka till början av det här avsnittet och upprepar stegen.
Träna detektorn
Välj knappen Träna för att träna detektormodellen. Detektorn använder alla aktuella bilder och deras taggar för att skapa en modell som identifierar varje taggat objekt.

Träningsprocessen bör bara ta några minuter. Under den här tiden visas information om träningsprocessen på fliken Prestanda.

Utvärdera detektorn
När träningen är klar beräknas och visas modellens prestanda. Tjänsten Custom Vision använder de bilder som du skickade för träning för att beräkna precision, träffsäkerhet och genomsnittlig genomsnittlig precision. Precision och träffsäkerhet är två olika mätningar av effektiviteten för en detektor:
- Precision anger bråkdelen av identifierade klassificeringar som var korrekta. Om modellen till exempel identifierade 100 bilder som hundar och 99 av dem faktiskt var av hundar skulle precisionen vara 99 %.
- Kom ihåg anger fraktionen av faktiska klassificeringar som har identifierats korrekt. Om det till exempel faktiskt fanns 100 avbildningar av äpplen och modellen identifierade 80 som äpplen skulle återkallandet vara 80 %.
- Genomsnittlig precision är genomsnittsvärdet för den genomsnittliga precisionen (AP). AP är området under precisions-/träffsäkerhetskurvan (precision ritad mot träffsäkerhet för varje förutsägelse som gjorts).

Tröskelvärde för sannolikhet
Observera skjutreglaget för sannolikhets tröskel i den vänstra rutan på fliken prestanda . Detta är den nivå av säkerhet som en förutsägelse måste ha för att anses korrekt (i syfte att beräkna precision och återkalla).
När du tolkar förutsägelse samtal med en hög sannolikhets tröskel, tenderar det att returnera resultat med hög precision vid utgiften om — att de identifierade klassificeringarna är korrekta, men många förblir oidentifierade. Ett tröskelvärde för låg sannolikhet gör att de motstående — största av de faktiska klassificeringarna upptäcks, men det finns fler falska positiva identifieringar i den uppsättningen. Med detta i åtanke bör du ställa in sannolikhets tröskeln enligt projektets speciella behov. Senare, när du får förutsägelse resultat på klient sidan, bör du använda samma sannolikhets tröskel som du använde här.
Tröskelvärde för överlappning
Skjutreglaget Överlappande tröskelvärde hanterar hur korrekt en objektförutsägelse måste anses vara "korrekt" i träningen. Den anger den minsta tillåtna överlappningen mellan det förutsagda objektets begränsningsruta och den faktiska användarangivet begränsningsrutan. Om begränsningsrutorna inte överlappar till den här graden anses inte förutsägelsen vara korrekt.
Hantera tränings iterationer
Varje gång du tränar detektorn skapar du en ny iteration med egna uppdaterade prestandamått. Du kan visa alla iterationer i den vänstra rutan på fliken Prestanda. I den vänstra rutan hittar du även knappen Ta bort, som du kan använda för att ta bort en iteration om den är föråldrad. När du tar bort en iteration tar du bort alla avbildningar som är unikt associerade med den.
Se Använda din modell med förutsägelse-API:et för att lära dig hur du kommer åt dina tränade modeller programmatiskt.
Nästa steg
I den här snabbstarten har du lärt dig hur du skapar och tränar en objektdetektormodell med Custom Vision webbplats. Nu ska du få mer information om den iterativa processen för att förbättra din modell.