Vad är anpassad textklassificering (förhandsversion)?

Anpassad textklassificering är en av de funktioner som erbjuds av Azure Cognitive Service för språk. Det är en molnbaserad API-tjänst som använder maskininlärningsinformation så att du kan skapa anpassade modeller för textklassificeringsuppgifter.

Anpassad textklassificering erbjuds som en del av de anpassade funktionerna i Azure Cognitive for Language. Med den här funktionen kan användarna skapa anpassade AI-modeller för att klassificera text i anpassade kategorier som definierats av användaren. Genom att skapa ett projekt för anpassad klassificering kan utvecklare iterativt tagga data, träna, utvärdera och förbättra modellprestanda innan de blir tillgängliga för användning. Kvaliteten på taggade data påverkar modellens prestanda kraftigt. För att förenkla skapandet och anpassningen av din modell erbjuder tjänsten en anpassad webbportal som kan nås via Language Studio. Du kan enkelt komma igång med tjänsten genom att följa stegen i den här snabbstarten.

Anpassad textklassificering stöder två typer av projekt:

  • Klassificering med enskild etikett – du kan tilldela en enda klass för varje fil i datauppsättningen. Ett filmskript kan till exempel bara klassificeras som "Åtgärd" eller "Lycksa".
  • Klassificering av flera etiketter – Du kan tilldela flera klasser för varje fil i datauppsättningen. Ett filmskript kan till exempel klassificeras som "Action" eller "Action and Decker".

Den här dokumentationen innehåller följande artikeltyper:

  • Snabbstarter är komma igång-instruktioner som vägleder dig genom att göra begäranden till tjänsten.
  • Begrepp ger förklaringar av tjänstens funktioner och funktioner.
  • Instruktionsguider innehåller instruktioner för att använda tjänsten på mer specifika eller anpassade sätt.

Exempel på användningsscenarier

Automatisk e-post-/biljettsdeklarering

Supportcenter av alla typer får tusentals till hundratusentals e-postmeddelanden/biljetter som innehåller ostrukturerad, friformstext och bifogade filer. Tidsenlig granskning, bekräftelse och routning till ämnesexperter i interna team är avgörande. E-postdetriering i den här skala som involverar användare att granska och dirigera till rätt avdelningar tar dock tid och värdefulla resurser. Anpassad klassificering kan användas för att analysera inkommande textklassificering och kategorisera innehållet som ska dirigeras automatiskt till relevant avdelning för att vidta nödvändiga åtgärder.

Sökning är grundläggande för appar som visar textinnehåll för användare, med vanliga scenarier som katalog- eller dokumentsökning, produktsökning i detaljhandeln eller kunskapsutvinning för datavetenskap.Många företag i olika branscher försöker skapa en omfattande sökupplevelse för privat, heterogent innehåll, som innehåller både strukturerade och ostrukturerade dokument. Som en del av sin pipeline kan utvecklare använda anpassad klassificering för att kategorisera text i klasser som är relevanta för deras bransch. De förutsagda klasserna kan användas för att utöka indexeringen av filen för en mer anpassad sökupplevelse.

Project utvecklingslivscykel

Att skapa ett anpassat klassificeringsprojekt omfattar vanligtvis flera olika steg.

Utvecklingslivscykeln

Följ dessa steg för att få ut det mesta av din modell:

  1. Definiera schema: Känna till dina data och identifiera de klasser som du vill skilja mellan, undvik tvetydighet.

  2. Tagga data: Kvaliteten på datataggning är en viktig faktor för att fastställa modellens prestanda. Tagga alla filer som du vill inkludera i träningen. Filer som tillhör samma klass bör alltid ha samma klass, om du har en fil som kan tillhöra två klasser använder du flera klassklassificeringsprojekt. Undvik tvetydighet för klassen, se till att klasserna är tydligt åtskiljbara från varandra, särskilt med projekt för enkel klassklassificering.

  3. Träna modell: Din modell börjar lära sig från dina taggade data.

  4. Visa information om modellutvärdering: Visa utvärderingsinformationen för din modell för att avgöra hur bra den presterar när den introduceras för nya data.

  5. Förbättra modellen: Arbeta med att förbättra modellens prestanda genom att undersöka felaktiga modellförutsägelser och undersöka datadistributionen.

  6. Distribuera modell: När du distribuerar en modell blir den tillgänglig för användning via API:et Analysera.

  7. Klassificera text: Använd din anpassade modell för textklassificeringsuppgifter.

Nästa steg