Wat is aangepaste benoemde entiteitsherkenning?
Aangepaste NER is een van de aangepaste functies die worden aangeboden door Azure AI Language. Het is een cloudgebaseerde API-service die machine learning-intelligentie toepast, zodat u aangepaste modellen kunt bouwen voor aangepaste benoemde entiteitsherkenningstaken.
Met Aangepaste NER kunnen gebruikers aangepaste AI-modellen bouwen om domeinspecifieke entiteiten te extraheren uit ongestructureerde tekst, zoals contracten of financiële documenten. Door een aangepast NER-project te maken, kunnen ontwikkelaars gegevens iteratief labelen, de modelprestaties trainen, evalueren en verbeteren voordat ze deze beschikbaar maken voor gebruik. De kwaliteit van de gelabelde gegevens heeft een grote invloed op de modelprestaties. Om het bouwen en aanpassen van uw model te vereenvoudigen, biedt de service een aangepaste webportal die toegankelijk is via De Taalstudio. U kunt eenvoudig aan de slag met de service door de stappen in deze quickstart te volgen.
Deze documentatie bevat de volgende artikeltypen:
- Quickstarts zijn aan de slag-instructies om u te helpen bij het indienen van aanvragen bij de service.
- Concepten bieden uitleg over de functionaliteit en functies van de service.
- Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
Voorbeeld van gebruiksscenario's
Aangepaste benoemde entiteitsherkenning kan worden gebruikt in meerdere scenario's in verschillende branches:
Gegevensextractie
Veel financiële en juridische organisaties extraheren en normaliseren dagelijks gegevens uit duizenden complexe, ongestructureerde tekstbronnen. Dergelijke bronnen zijn bankafschriften, juridische overeenkomsten of bankformulieren. Het kan bijvoorbeeld enkele dagen duren voordat gegevens uit een hypotheekaanvraag handmatig zijn geëxtraheerd door menselijke revisoren. Het automatiseren van deze stappen door een aangepast NER-model te bouwen vereenvoudigt het proces en bespaart kosten, tijd en moeite.
Kennisanalyse om semantisch zoeken te verbeteren/verrijken
Zoeken is fundamenteel voor elke app die tekstinhoud beschikbaar maakt voor gebruikers. Veelvoorkomende scenario's zijn zoeken in catalogussen of documenten, zoeken naar producten in de detailhandel of kennisanalyse voor gegevenswetenschap. Veel ondernemingen in verschillende branches willen een uitgebreide zoekervaring bouwen op persoonlijke, heterogene inhoud, die zowel gestructureerde als ongestructureerde documenten bevat. Als onderdeel van hun pijplijn kunnen ontwikkelaars aangepaste NER gebruiken voor het extraheren van entiteiten uit de tekst die relevant zijn voor hun branche. Deze entiteiten kunnen worden gebruikt om de indexering van het bestand te verrijken voor een meer aangepaste zoekervaring.
Controle en naleving
In plaats van aanzienlijk lange tekstbestanden handmatig te controleren en beleid toe te passen, kunnen IT-afdelingen in financiële of juridische ondernemingen aangepaste NER gebruiken om geautomatiseerde oplossingen te bouwen. Deze oplossingen kunnen handig zijn voor het afdwingen van nalevingsbeleid en het instellen van de benodigde bedrijfsregels op basis van kennisanalysepijplijnen die gestructureerde en ongestructureerde inhoud verwerken.
Levenscyclus van projectontwikkeling
Het gebruik van aangepaste NER omvat meestal verschillende stappen.
Definieer uw schema: ken uw gegevens en identificeer de entiteiten die u wilt ophalen. Vermijd dubbelzinnigheid.
Label uw gegevens: Het labelen van gegevens is een belangrijke factor bij het bepalen van modelprestaties. Label nauwkeurig, consistent en volledig.
- Label nauwkeurig: label elke entiteit altijd op het juiste type. Neem alleen op wat u wilt geëxtraheerd, vermijd onnodige gegevens in uw labels.
- Consistent labelen: dezelfde entiteit moet hetzelfde label hebben voor alle bestanden.
- Label volledig: Label alle exemplaren van de entiteit in al uw bestanden.
Het model trainen: uw model begint te leren van uw gelabelde gegevens.
Bekijk de prestaties van het model: nadat de training is voltooid, bekijkt u de evaluatiedetails van het model, de prestaties en richtlijnen voor het verbeteren ervan.
Het model implementeren: als u een model implementeert, is het beschikbaar voor gebruik via de Analyse-API.
Entiteiten extraheren: gebruik uw aangepaste modellen voor entiteitsextractietaken.
Referentiedocumentatie en codevoorbeelden
Als u aangepaste NER gebruikt, raadpleegt u de volgende referentiedocumentatie en voorbeelden voor Azure AI Language:
Ontwikkelingsoptie/taal | Referentiedocumentatie | Voorbeelden |
---|---|---|
REST API's (ontwerpen) | REST API-documentatie | |
REST API's (runtime) | REST API-documentatie | |
C# (runtime) | C#-documentatie | C#-voorbeelden |
Java (runtime) | Java-documentatie | Java-voorbeelden |
JavaScript (runtime) | Documentatie over JavaScript | JavaScript-voorbeelden |
Python (runtime) | Python-documentatie | Python-voorbeelden |
Verantwoordelijke AI
Een AI-systeem omvat niet alleen de technologie, maar ook de mensen die het gaan gebruiken, de mensen die er last van hebben en de omgeving waarin het wordt geïmplementeerd. Lees de transparantienotitie voor aangepaste NER voor meer informatie over verantwoord ai-gebruik en -implementatie in uw systemen. U kunt ook de volgende artikelen bekijken voor meer informatie:
- Transparantienotitie voor Azure AI-taal
- Integratie en verantwoordelijk gebruik
- Gegevens, privacy en beveiliging
Volgende stappen
Gebruik het quickstart-artikel om aangepaste benoemde entiteitsherkenning te gebruiken.
Als u de levenscyclus van de projectontwikkeling doorloopt, raadpleegt u de woordenlijst voor meer informatie over de termen die in de documentatie voor deze functie worden gebruikt.
Vergeet niet om de servicelimieten te bekijken voor informatie zoals regionale beschikbaarheid.