Aangepaste definities en termen voor herkenning van benoemde entiteiten

Artikel
12/19/2023

Gebruik dit artikel voor meer informatie over enkele definities en termen die u kunt tegenkomen bij het gebruik van aangepaste NER.

Entiteit

Een entiteit is een reeks tekst die een bepaald type informatie aangeeft. Het tekstbereik kan bestaan uit een of meer woorden. In het bereik van aangepaste NER vertegenwoordigen entiteiten de informatie die de gebruiker uit de tekst wil extraheren. Ontwikkelaars taggen entiteiten in hun gegevens met de benodigde entiteiten voordat ze deze doorgeven aan het model voor training. Bijvoorbeeld 'Factuurnummer', 'Begindatum', 'Verzendnummer', 'Geboorteplaats', 'Plaats van oorsprong', 'Naam leverancier' of 'Klantadres'.

In de zin 'John heeft 25.000 USD geleend van Fred', kunnen de entiteiten bijvoorbeeld zijn:

Entiteitsnaam/-type	Entiteit
Naam van de kredietnemer	Jan
Naam van kredietverstrekker	Fred
Bedrag van de lening	25.000 USD

F1-score

De F1-score is een functie van Precisie en Relevante overeenkomsten. Dit is nodig wanneer u een balans zoekt tussen precisie en relevante overeenkomsten.

Model

Een model is een object dat is getraind om een bepaalde taak uit te voeren, in dit geval aangepaste entiteitsherkenning. Modellen worden getraind door gelabelde gegevens op te geven om van te leren, zodat ze later kunnen worden gebruikt voor herkenningstaken.

Modeltraining is het proces van het leren van uw model wat er moet worden geëxtraheerd op basis van uw gelabelde gegevens.
Modelevaluatie is het proces dat direct na de training plaatsvindt om te weten hoe goed uw model presteert.
Implementatie is het proces van het toewijzen van uw model aan een implementatie om het beschikbaar te maken voor gebruik via de voorspellings-API.

Precisie

Meet hoe nauwkeurig/nauwkeurig uw model is. Dit is de verhouding tussen de correct geïdentificeerde positieven (terecht-positieven) en alle geïdentificeerde positieven. De metrische precisie laat zien hoeveel van de voorspelde klassen correct zijn gelabeld.

Project

Een project is een werkgebied voor het bouwen van uw aangepaste ML-modellen op basis van uw gegevens. Uw project kan alleen worden geopend door u en anderen die toegang hebben tot de Azure-resource die wordt gebruikt. Als vereiste voor het maken van een aangepast entiteitextractieproject moet u uw resource verbinden met een opslagaccount met uw gegevensset wanneer u een nieuw project maakt. Uw project bevat automatisch alle .txt bestanden die beschikbaar zijn in uw container.

Binnen uw project kunt u de volgende acties uitvoeren:

Uw gegevens labelen: het proces van het labelen van uw gegevens, zodat wanneer u uw model traint, het leert wat u wilt extraheren.
Uw model bouwen en trainen: de kernstap van uw project, waarbij uw model begint te leren van uw gelabelde gegevens.
Details van modelevaluatie weergeven: controleer de prestaties van uw model om te bepalen of er ruimte is voor verbetering of dat u tevreden bent met de resultaten.
Implementatie: nadat u de prestaties van het model hebt bekeken en hebt besloten dat het kan worden gebruikt in uw omgeving, moet u het toewijzen aan een implementatie om het te gebruiken. Als u het model toewijst aan een implementatie, is het beschikbaar voor gebruik via de voorspellings-API.
Testmodel: nadat u uw model hebt geïmplementeerd, test u uw implementatie in Language Studio om te zien hoe deze in productie zou presteren.

Relevante overeenkomsten

Meet het vermogen van het model om werkelijke positieve klassen te voorspellen. Het is de verhouding tussen de voorspelde echte positieven en wat daadwerkelijk is getagd. De metrische gegevens over intrekken laten zien hoeveel van de voorspelde klassen juist zijn.