Snabbstart: Skapa en klassificerare med Custom Vision webbplats
I den här snabbstarten lär du dig att använda Custom Vision för att skapa en bildklassificeringsmodell. När du har byggt en modell kan du testa den med nya bilder och så småningom integrera den i din egen bildigenkänningsapp.
Om du inte har någon Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.
Förutsättningar
- En uppsättning bilder som klassificeraren ska tränas med. Nedan finns tips om hur du väljer bilder.
Skapa Custom Vision resurser
Om du vill använda Custom Vision Service måste du skapa Custom Vision utbildning och förutsägelse resurser i Azure. Om du vill göra det i Azure Portal fyller du i dialog rutan på sidan skapa Custom vision för att skapa både en utbildnings-och förutsägelse resurs.
Skapa ett nytt projekt
I webbläsaren navigerar du till Custom Vision och väljer Logga in. Logga in med samma konto som du använde för att logga in på Azure Portal.

Om du vill skapa ditt första projekt väljer du Nytt Project. Dialogrutan Skapa nytt projekt visas.

Ange ett namn och en beskrivning för projektet. Välj sedan en resursgrupp. Om ditt inloggade konto är associerat med ett Azure-konto visar listrutan Resursgrupp alla dina Azure-resursgrupper som innehåller en Custom Vision-tjänstresurs.
Anteckning
Om ingen resursgrupp är tillgänglig bekräftar du att du har loggat in på customvision.ai med samma konto som du använde för att logga in på Azure Portal. Kontrollera också att du har valt samma "katalog" på Custom Vision webbplats som katalogen i den Azure Portal där Custom Vision resurserna finns. På båda platserna kan du välja din katalog från den nedrullningsna kontomenyn i det övre högra hörnet på skärmen.
Välj Klassificering under Project Typer. Under Klassificeringstyper väljer du sedan antingen Multilabel eller Multiclass, beroende på ditt användningsfall. Klassificering med flera etiketter tillämpar val annat antal taggar på en bild (noll eller fler), medan klassificering med flera klasser sorterar bilder i enskilda kategorier (varje bild som du skickar sorteras i den mest sannolika taggen). Du kommer att kunna ändra klassificeringstypen senare om du vill.
Välj sedan en av de tillgängliga domänerna. Varje domän optimerar klassificeraren för specifika typer av bilder, enligt beskrivningen i följande tabell. Du kommer att kunna ändra domänen senare om du vill.
Domain Syfte Allmänna Optimerad för en mängd olika bildklassificeringsuppgifter. Om ingen av de andra domänerna är lämplig, eller om du är osäker på vilken domän du ska välja, väljer du domänen Generisk. Mat Optimerad för fotografier av nunna som du skulle se dem på en restaurangmeny. Om du vill klassificera fotografier av enskilda individer eller individer använder du domänen Mat. Landmärken Optimerad för identifierbara landmärken, både naturliga och artificiella. Den här domänen fungerar bäst när landmärket syns tydligt på fotot. Den här domänen fungerar även om landmärket är något upphetsat av personer framför den. Retail Optimerad för bilder som finns i en shoppingkatalog eller shoppingwebbplats. Om du vill klassificera med hög precision mellan adresser, pojkar och dräkter använder du den här domänen. Kompakta domäner Optimerad för begränsningar i realtidsklassificering på mobila enheter. Modeller som genereras av kompakta domäner kan exporteras för att köras lokalt. Välj slutligen Skapa projekt.
Välj träningsbilder
Som ett minimum rekommenderar vi att du använder minst 30 bilder per tagg i den inledande träningsuppsättningen. Du vill också samla in några extra bilder för att testa din modell när den har tränats.
Använd bilder med visuell variation för att träna din modell effektivt. Välj bilder som varierar beroende på:
- Kameravinkel
- Belysning
- bakgrund
- visuellt format
- enskilda/grupperade ämne
- ikoner
- typ
Kontrollera också att alla dina träningsbilder uppfyller följande kriterier:
- .jpg, .png, .bmp eller .gif format
- inte större än 6 MB (4 MB för förutsägelsebilder)
- inte mindre än 256 bildpunkter på den kortaste kanten; avbildningar som är kortare än detta skalas automatiskt upp av Custom Vision Service
Anteckning
Behöver du en bredare uppsättning bilder för att slutföra träningen? Med Trove, Microsoft Garage projekt, kan du samla in och köpa uppsättningar av bilder i utbildningssyfte. När du har samlat in dina bilder kan du ladda ned dem och sedan importera dem till ditt Custom Vision-projekt som vanligt. Besök Trove-sidan om du vill veta mer.
Ladda upp och tagga bilder
I det här avsnittet laddar du upp och taggar bilder manuellt för att träna klassificeraren.
Om du vill lägga till bilder väljer du Lägg till bilder och sedan Bläddra bland lokala filer. Välj Öppna för att gå till taggning. Ditt taggval tillämpas på hela gruppen med bilder som du har valt att ladda upp, så det är enklare att ladda upp bilder i separata grupper enligt deras tillämpade taggar. Du kan också ändra taggarna för enskilda bilder när de har laddats upp.

Om du vill skapa en tagg anger du text i fältet Mina taggar och trycker på Retur. Om taggen redan finns visas den i en listmeny. I ett projekt med flera etiketter kan du lägga till fler än en tagg i dina bilder, men i ett projekt med flera klasser kan du bara lägga till en. För att slutföra uppladdningen av bilderna använder du knappen Upload [number]-filer.

Välj Klar när bilderna har laddats upp.

Om du vill ladda upp en annan uppsättning bilder går du tillbaka till början av det här avsnittet och upprepar stegen.
Träna klassificeraren
Om du vill träna klassificeraren väljer du knappen Träna. Klassificeraren använder alla aktuella bilder för att skapa en modell som identifierar de visuella egenskaperna för varje tagg.

Träningsprocessen bör bara ta några minuter. Under den här tiden visas information om träningsprocessen på fliken Prestanda.

Utvärdera klassificeraren
När träningen är klar beräknas och visas modellens prestanda. I Custom Vision Service används de bilder som du skickade för träning för att beräkna precision och träffsäkerhet, med hjälp av en process som kallas k-fold cross validation. Precision och träffsäkerhet är två olika mätningar av effektiviteten hos en klassificerare:
- Precision anger bråkdelen av identifierade klassificeringar som var korrekta. Om modellen till exempel identifierade 100 bilder som hundar och 99 av dem faktiskt var av hundar skulle precisionen vara 99 %.
- Kom ihåg anger fraktionen av faktiska klassificeringar som har identifierats korrekt. Om det till exempel faktiskt fanns 100 avbildningar av äpplen och modellen identifierade 80 som äpplen skulle återkallandet vara 80 %.

Tröskelvärde för sannolikhet
Observera skjutreglaget för sannolikhets tröskel i den vänstra rutan på fliken prestanda . Detta är den nivå av säkerhet som en förutsägelse måste ha för att anses korrekt (i syfte att beräkna precision och återkalla).
När du tolkar förutsägelse samtal med en hög sannolikhets tröskel, tenderar det att returnera resultat med hög precision vid utgiften om — att de identifierade klassificeringarna är korrekta, men många förblir oidentifierade. Ett tröskelvärde för låg sannolikhet gör att de motstående — största av de faktiska klassificeringarna upptäcks, men det finns fler falska positiva identifieringar i den uppsättningen. Med detta i åtanke bör du ställa in sannolikhets tröskeln enligt projektets speciella behov. Senare, när du får förutsägelse resultat på klient sidan, bör du använda samma sannolikhets tröskel som du använde här.
Hantera tränings iterationer
Varje gång du tränar klassificeraren skapar du en ny iteration med egna uppdaterade prestandamått. Du kan visa alla iterationer i den vänstra rutan på fliken Prestanda. Du hittar även knappen Ta bort, som du kan använda för att ta bort en iteration om den är föråldrad. När du tar bort en iteration tar du bort alla avbildningar som är unikt associerade med den.
Se Använda din modell med förutsägelse-API:et för att lära dig hur du kommer åt dina tränade modeller programmatiskt.
Nästa steg
I den här snabbstarten har du lärt dig hur du skapar och tränar en bildklassificeringsmodell med Custom Vision webbplats. Nu ska du få mer information om den iterativa processen för att förbättra din modell.