Wat is Custom Herkenning van benoemde entiteiten (NER) (preview)?
Aangepaste NER is een van de functies die door Azure Cognitive Service for Language worden aangeboden. Het is een api-service in de cloud waarmee machine learning-intelligentie wordt toegepast, zodat u aangepaste modellen kunt bouwen voor aangepaste NER-taken voor tekst.
Aangepaste NER wordt aangeboden als onderdeel van de aangepaste functies in Azure Cognitive Service for Language. Met deze functie kunnen gebruikers aangepaste AI-modellen bouwen om domeinspecifieke entiteiten te extraheren uit ongestructureerde tekst, zoals contracten of financiële documenten. Door een aangepast NER-project te maken, kunnen ontwikkelaars iteratief gegevens taggen, modelprestaties trainen, evalueren en verbeteren voordat ze deze beschikbaar maken voor gebruik. De kwaliteit van de getagde gegevens heeft een grote invloed op de modelprestaties. Om het bouwen en aanpassen van uw model te vereenvoudigen, biedt de service een aangepaste webportal die toegankelijk is via Language Studio. U kunt eenvoudig aan de slag met de service door de stappen in deze quickstart te volgen.
Deze documentatie bevat de volgende artikeltypen:
- Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
- Concepten bieden uitleg over de servicefunctionaliteit en -functies.
- Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
Voorbeeld van gebruiksscenario's
Gegevensextractie
Veel financiële en juridische organisaties extraheren en normaliseren gegevens uit duizenden complexe ongestructureerde tekst, zoals bankverklaringen, juridische overeenkomsten of bankformulieren. In plaats van deze formulieren handmatig te verwerken, kan aangepaste NER helpen dit proces te automatiseren en kosten, tijd en moeite te besparen.
Kennismining om semantische zoekopdrachten te verbeteren/verrijken
Zoeken is een basis voor elke app die tekstinhoud beschikbaar maakt voor gebruikers, met veelvoorkomende scenario's zoals zoeken in catalogussen of documenten, zoeken naar producten in de detailhandel of kennismining voor gegevenswetenschap.Veel bedrijven in verschillende branches willen een uitgebreide zoekervaring ontwikkelen voor privé- en heterogene inhoud, die zowel gestructureerde als ongestructureerde documenten bevat. Als onderdeel van hun pijplijn kunnen ontwikkelaars Aangepaste NER gebruiken voor het extraheren van entiteiten uit de tekst die relevant zijn voor hun branche. Deze entiteiten kunnen worden gebruikt om de indexering van het bestand te verrijken voor een meer aangepaste zoekervaring.
Controle en naleving
In plaats van handmatig aanzienlijk lange tekstbestanden te controleren en beleid toe te passen, kunnen IT-afdelingen in financiële of juridische ondernemingen aangepaste NER gebruiken om geautomatiseerde oplossingen te bouwen. Deze oplossingen helpen nalevingsbeleid af te dwingen en de benodigde bedrijfsregels in te stellen op basis van knowledge mining-pijplijnen die gestructureerde en ongestructureerde inhoud verwerken.
Levenscyclus van toepassingsontwikkeling
Het gebruik van Aangepaste NER omvat doorgaans verschillende stappen.
Definieer uw schema: ken uw gegevens en identificeer de entiteiten die u wilt extraheren. Vermijd dubbelzinnigheid.
Uw gegevens taggen: Het taggen van gegevens is een belangrijke factor bij het bepalen van de modelprestaties. Nauwkeurig, consistent en volledig taggen.
- Nauwkeurig taggen: Tag elke entiteit altijd op het juiste type. Neem alleen op wat u wilt extraheren, vermijd onnodige gegevens in uw tag.
- Consistent taggen: dezelfde entiteit moet dezelfde tag hebben voor alle bestanden.
- Volledig taggen: tag alle exemplaren van de entiteit in al uw bestanden.
Model trainen: uw model begint te leren van uw gelabelde gegevens.
Bekijk de details van de modelevaluatie: nadat de training is voltooid, bekijkt u de evaluatiedetails en de prestaties van het model.
Het model verbeteren: nadat u de details van de modelevaluatie hebt beoordeeld, kunt u verder gaan en leren hoe u het model kunt verbeteren.
Het model implementeren: het implementeren van een model is om het beschikbaar te maken voor gebruik.
Entiteiten extraheren: gebruik uw aangepaste modellen voor entiteitextractietaken.
Volgende stappen
Gebruik het quickstart-artikel om aangepaste tekstclassificatie te gaan gebruiken.
Als u de levenscyclus voor het ontwikkelen van toepassingen doorloop, bekijkt u de woordenlijst voor meer informatie over de termen die in de documentatie voor deze functie worden gebruikt.
Vergeet niet om de servicelimieten weer te geven voor informatie zoals regionale beschikbaarheid.