Vad är Custom Igenkänning av namngiven entitet (NER) (förhandsversion)?

Custom NER är en av de funktioner som erbjuds av Azure Cognitive Service for Language. Det är en molnbaserad API-tjänst som använder maskininlärningsinformation så att du kan skapa anpassade modeller för anpassade NER-textuppgifter.

Custom NER erbjuds som en del av de anpassade funktionerna i Azure Cognitive Service for Language. Med den här funktionen kan användarna skapa anpassade AI-modeller för att extrahera domänspecifika entiteter från ostrukturerad text, till exempel kontrakt eller finansiella dokument. Genom att skapa ett anpassat NER-projekt kan utvecklare iterativt tagga data, träna, utvärdera och förbättra modellprestanda innan de blir tillgängliga för användning. Kvaliteten på taggade data påverkar modellens prestanda kraftigt. För att förenkla skapandet och anpassningen av din modell erbjuder tjänsten en anpassad webbportal som kan nås via Language Studio. Du kan enkelt komma igång med tjänsten genom att följa stegen i den här snabbstarten.

Den här dokumentationen innehåller följande artikeltyper:

  • Snabbstarter är komma igång-instruktioner som vägleder dig genom att göra begäranden till tjänsten.
  • Begrepp ger förklaringar av tjänstens funktioner och funktionalitet.
  • Instruktionsguider innehåller instruktioner för att använda tjänsten på mer specifika eller anpassade sätt.

Exempel på användningsscenarier

Extrahering av information

Många finansiella och juridiska organisationer extraherar och normaliserar data från tusentals komplexa ostrukturerade text, till exempel bankutdrag, juridiska avtal eller bankformulär dagligen. I stället för att manuellt bearbeta dessa formulär kan anpassade NER hjälpa till att automatisera den här processen och spara kostnader, tid och arbete.

Sökning är grundläggande för alla appar som visar textinnehåll för användare, med vanliga scenarier som katalog- eller dokumentsökning, produktsökning i detaljhandeln eller kunskapsutvinning för dataforskning.Många företag i olika branscher vill skapa en omfattande sökupplevelse för privat, heterogent innehåll, som innehåller både strukturerade och ostrukturerade dokument. Som en del av sin pipeline kan utvecklare använda Custom NER för att extrahera entiteter från den text som är relevant för deras bransch. Dessa entiteter kan användas för att utöka indexeringen av filen för en mer anpassad sökupplevelse.

Granskning och efterlevnad

I stället för att manuellt granska mycket långa textfiler för att granska och tillämpa principer kan IT-avdelningar i finansiella eller juridiska företag använda anpassade NER för att skapa automatiserade lösningar. Dessa lösningar hjälper till att genomdriva efterlevnadsprinciper och konfigurera nödvändiga affärsregler baserat på kunskapsutvinningspipelines som bearbetar strukturerat och ostrukturerat innehåll.

Programutvecklingslivscykel

Användning av Custom NER omfattar vanligtvis flera olika steg.

Utvecklingslivscykeln

  1. Definiera schemat: Känna till dina data och identifiera de entiteter som du vill extrahera. Undvik tvetydighet.

  2. Tagga dina data: Taggning av data är en viktig faktor för att fastställa modellens prestanda. Tagga exakt, konsekvent och helt.

    1. Tagga exakt: Tagga varje entitet till rätt typ alltid. Ta bara med det du vill extrahera, undvik onödiga data i taggen.
    2. Tagga konsekvent: Samma entitet ska ha samma tagg i alla filer.
    3. Tagga helt: Tagga alla instanser av entiteten i alla dina filer.
  3. Träna modell: Din modell börjar lära sig från taggade data.

  4. Visa information om modellutvärderingen: När träningen är klar kan du visa modellens utvärderingsinformation och dess prestanda.

  5. Förbättra modellen: När du har granskat modellutvärderingsinformationen kan du gå vidare och lära dig hur du kan förbättra modellen.

  6. Distribuera modellen: Att distribuera en modell är att göra den tillgänglig för användning.

  7. Extrahera entiteter: Använd dina anpassade modeller för entitets extraheringsuppgifter.

Nästa steg