Termen en definities die worden gebruikt in aangepaste tekstclassificatie

Artikel
12/19/2023

Gebruik dit artikel voor meer informatie over enkele definities en termen die u kunt tegenkomen bij het gebruik van aangepaste tekstclassificatie.

Klas

Een klasse is een door de gebruiker gedefinieerde categorie die de algehele classificatie van de tekst aangeeft. Ontwikkelaars labelen hun gegevens met hun klassen voordat ze deze doorgeven aan het model voor training.

F1-score

De F1-score is een functie van Precisie en Relevante overeenkomsten. Dit is nodig wanneer u een balans zoekt tussen precisie en relevante overeenkomsten.

Model

Een model is een object dat is getraind om een bepaalde taak uit te voeren, in dit geval taken voor tekstclassificatie. Modellen worden getraind door gelabelde gegevens op te geven om van te leren, zodat ze later kunnen worden gebruikt voor classificatietaken.

Modeltraining is het proces van het leren van uw model hoe u documenten kunt classificeren op basis van uw gelabelde gegevens.
Modelevaluatie is het proces dat direct na de training plaatsvindt om te weten hoe goed uw model presteert.
Implementatie is het proces van het toewijzen van uw model aan een implementatie om het beschikbaar te maken voor gebruik via de voorspellings-API.

Precisie

Meet hoe nauwkeurig/nauwkeurig uw model is. Dit is de verhouding tussen de correct geïdentificeerde positieven (terecht-positieven) en alle geïdentificeerde positieven. De precisiemetriek laat zien hoeveel van de voorspelde klassen correct zijn gelabeld.

Project

Een project is een werkgebied voor het bouwen van uw aangepaste ML-modellen op basis van uw gegevens. Uw project kan alleen worden geopend door u en anderen die toegang hebben tot de Azure-resource die wordt gebruikt. Als vereiste voor het maken van een aangepast tekstclassificatieproject moet u uw resource koppelen aan een opslagaccount met uw gegevensset wanneer u een nieuw project maakt. Uw project bevat automatisch alle .txt bestanden die beschikbaar zijn in uw container.

Binnen uw project kunt u het volgende doen:

Uw gegevens labelen: het proces van het labelen van uw gegevens, zodat wanneer u uw model traint, het leert wat u wilt extraheren.
Uw model bouwen en trainen: de kernstap van uw project, waarbij uw model begint te leren van uw gelabelde gegevens.
Details van modelevaluatie weergeven: controleer de prestaties van uw model om te bepalen of er ruimte is voor verbetering of dat u tevreden bent met de resultaten.
Implementatie: nadat u de prestaties van het model hebt gecontroleerd en besluit dat het geschikt is om te worden gebruikt in uw omgeving; U moet deze toewijzen aan een implementatie om er query's op te kunnen uitvoeren. Als u het model toewijst aan een implementatie, wordt het beschikbaar voor gebruik via de voorspellings-API.
Testmodel: nadat u uw model hebt geïmplementeerd, kunt u deze bewerking in Language Studio gebruiken om uw implementatie uit te proberen en te zien hoe het zou presteren in productie.

Projecttypen

Aangepaste tekstclassificatie ondersteunt twee typen projecten

Classificatie van één label : u kunt één klasse toewijzen aan elk document in uw gegevensset. Een filmscript kan bijvoorbeeld alleen worden geclassificeerd als 'Romance' of 'Comedy'.
Classificatie met meerdere labels : u kunt meerdere klassen toewijzen voor elk document in uw gegevensset. Een filmscript kan bijvoorbeeld worden geclassificeerd als 'Komedie' of 'Romaans' en 'Komedie'.

Relevante overeenkomsten

Meet het vermogen van het model om werkelijke positieve klassen te voorspellen. Dit is de verhouding tussen de voorspelde terecht-positieven en wat daadwerkelijk is getagd. De metrische gegevens voor terughalen laten zien hoeveel van de voorspelde klassen juist zijn.

Share via