Wat is aangepaste benoemde entiteitsherkenning?

Aangepaste NER is een van de aangepaste functies die worden aangeboden door Azure AI Language. Het is een cloudgebaseerde API-service die machine learning-intelligentie toepast, zodat u aangepaste modellen kunt bouwen voor aangepaste benoemde entiteitsherkenningstaken.

Met Aangepaste NER kunnen gebruikers aangepaste AI-modellen bouwen om domeinspecifieke entiteiten te extraheren uit ongestructureerde tekst, zoals contracten of financiële documenten. Door een aangepast NER-project te maken, kunnen ontwikkelaars gegevens iteratief labelen, de modelprestaties trainen, evalueren en verbeteren voordat ze deze beschikbaar maken voor gebruik. De kwaliteit van de gelabelde gegevens heeft een grote invloed op de modelprestaties. Om het bouwen en aanpassen van uw model te vereenvoudigen, biedt de service een aangepaste webportal die toegankelijk is via De Taalstudio. U kunt eenvoudig aan de slag met de service door de stappen in deze quickstart te volgen.

Deze documentatie bevat de volgende artikeltypen:

  • Quickstarts zijn aan de slag-instructies om u te helpen bij het indienen van aanvragen bij de service.
  • Concepten bieden uitleg over de functionaliteit en functies van de service.
  • Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.

Voorbeeld van gebruiksscenario's

Aangepaste benoemde entiteitsherkenning kan worden gebruikt in meerdere scenario's in verschillende branches:

Gegevensextractie

Veel financiële en juridische organisaties extraheren en normaliseren dagelijks gegevens uit duizenden complexe, ongestructureerde tekstbronnen. Dergelijke bronnen zijn bankafschriften, juridische overeenkomsten of bankformulieren. Het kan bijvoorbeeld enkele dagen duren voordat gegevens uit een hypotheekaanvraag handmatig zijn geëxtraheerd door menselijke revisoren. Het automatiseren van deze stappen door een aangepast NER-model te bouwen vereenvoudigt het proces en bespaart kosten, tijd en moeite.

Zoeken is fundamenteel voor elke app die tekstinhoud beschikbaar maakt voor gebruikers. Veelvoorkomende scenario's zijn zoeken in catalogussen of documenten, zoeken naar producten in de detailhandel of kennisanalyse voor gegevenswetenschap. Veel ondernemingen in verschillende branches willen een uitgebreide zoekervaring bouwen op persoonlijke, heterogene inhoud, die zowel gestructureerde als ongestructureerde documenten bevat. Als onderdeel van hun pijplijn kunnen ontwikkelaars aangepaste NER gebruiken voor het extraheren van entiteiten uit de tekst die relevant zijn voor hun branche. Deze entiteiten kunnen worden gebruikt om de indexering van het bestand te verrijken voor een meer aangepaste zoekervaring.

Controle en naleving

In plaats van aanzienlijk lange tekstbestanden handmatig te controleren en beleid toe te passen, kunnen IT-afdelingen in financiële of juridische ondernemingen aangepaste NER gebruiken om geautomatiseerde oplossingen te bouwen. Deze oplossingen kunnen handig zijn voor het afdwingen van nalevingsbeleid en het instellen van de benodigde bedrijfsregels op basis van kennisanalysepijplijnen die gestructureerde en ongestructureerde inhoud verwerken.

Levenscyclus van projectontwikkeling

Het gebruik van aangepaste NER omvat meestal verschillende stappen.

De ontwikkelingslevenscyclus

  1. Definieer uw schema: ken uw gegevens en identificeer de entiteiten die u wilt ophalen. Vermijd dubbelzinnigheid.

  2. Label uw gegevens: Het labelen van gegevens is een belangrijke factor bij het bepalen van modelprestaties. Label nauwkeurig, consistent en volledig.

    1. Label nauwkeurig: label elke entiteit altijd op het juiste type. Neem alleen op wat u wilt geëxtraheerd, vermijd onnodige gegevens in uw labels.
    2. Consistent labelen: dezelfde entiteit moet hetzelfde label hebben voor alle bestanden.
    3. Label volledig: Label alle exemplaren van de entiteit in al uw bestanden.
  3. Het model trainen: uw model begint te leren van uw gelabelde gegevens.

  4. Bekijk de prestaties van het model: nadat de training is voltooid, bekijkt u de evaluatiedetails van het model, de prestaties en richtlijnen voor het verbeteren ervan.

  5. Het model implementeren: als u een model implementeert, is het beschikbaar voor gebruik via de Analyse-API.

  6. Entiteiten extraheren: gebruik uw aangepaste modellen voor entiteitsextractietaken.

Referentiedocumentatie en codevoorbeelden

Als u aangepaste NER gebruikt, raadpleegt u de volgende referentiedocumentatie en voorbeelden voor Azure AI Language:

Ontwikkelingsoptie/taal Referentiedocumentatie Voorbeelden
REST API's (ontwerpen) REST API-documentatie
REST API's (runtime) REST API-documentatie
C# (runtime) C#-documentatie C#-voorbeelden
Java (runtime) Java-documentatie Java-voorbeelden
JavaScript (runtime) Documentatie over JavaScript JavaScript-voorbeelden
Python (runtime) Python-documentatie Python-voorbeelden

Verantwoordelijke AI

Een AI-systeem omvat niet alleen de technologie, maar ook de mensen die het gaan gebruiken, de mensen die er last van hebben en de omgeving waarin het wordt geïmplementeerd. Lees de transparantienotitie voor aangepaste NER voor meer informatie over verantwoord ai-gebruik en -implementatie in uw systemen. U kunt ook de volgende artikelen bekijken voor meer informatie:

Volgende stappen

  • Gebruik het quickstart-artikel om aangepaste benoemde entiteitsherkenning te gebruiken.

  • Als u de levenscyclus van de projectontwikkeling doorloopt, raadpleegt u de woordenlijst voor meer informatie over de termen die in de documentatie voor deze functie worden gebruikt.

  • Vergeet niet om de servicelimieten te bekijken voor informatie zoals regionale beschikbaarheid.