Wat is aangepaste tekstclassificatie?

Artikel
12/19/2023

Aangepaste tekstclassificatie is een van de aangepaste functies van Azure AI Language. Het is een cloudgebaseerde API-service die machine learning-intelligentie toepast, zodat u aangepaste modellen voor tekstclassificatietaken kunt bouwen.

Met aangepaste tekstclassificatie kunnen gebruikers aangepaste AI-modellen bouwen om tekst te classificeren in aangepaste klassen die vooraf door de gebruiker zijn gedefinieerd. Door een aangepast tekstclassificatieproject te maken, kunnen ontwikkelaars gegevens iteratief labelen, de modelprestaties trainen, evalueren en verbeteren voordat ze deze beschikbaar maken voor gebruik. De kwaliteit van de gelabelde gegevens heeft een grote invloed op de modelprestaties. Om het bouwen en aanpassen van uw model te vereenvoudigen, biedt de service een aangepaste webportal die toegankelijk is via De Taalstudio. U kunt eenvoudig aan de slag met de service door de stappen in deze quickstart te volgen.

Aangepaste tekstclassificatie ondersteunt twee soorten projecten:

Classificatie van één label : u kunt één klasse toewijzen voor elk document in uw gegevensset. Een filmscript kan bijvoorbeeld alleen worden geclassificeerd als 'Romantiek' of 'Komedie'.
Classificatie met meerdere labels : u kunt meerdere klassen toewijzen voor elk document in uw gegevensset. Een filmscript kan bijvoorbeeld worden geclassificeerd als 'Komedie' of 'Romantiek' en 'Komedie'.

Deze documentatie bevat de volgende artikeltypen:

Quickstarts zijn aan de slag-instructies om u te helpen bij het indienen van aanvragen bij de service.
Concepten bieden uitleg over de functionaliteit en functies van de service.
Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.

Voorbeeld van gebruiksscenario's

Aangepaste tekstclassificatie kan worden gebruikt in meerdere scenario's in verschillende branches:

Automatische e-mailberichten of ticketsorage

Ondersteuningscentra van alle typen ontvangen een groot aantal e-mails of tickets met ongestructureerde, vrije vorm tekst en bijlagen. Tijdige beoordeling, bevestiging en routering naar deskundigen binnen interne teams is van cruciaal belang. Email op deze schaal moeten mensen de juiste afdelingen controleren en doorsturen. Dit kost tijd en middelen. Aangepaste tekstclassificatie kan worden gebruikt voor het analyseren van binnenkomende tekst en het sorteren en categoriseren van de inhoud die automatisch naar de relevante afdelingen moet worden gerouteerd voor verdere actie.

Kennisanalyse om semantisch zoeken te verbeteren/verrijken

Zoeken is fundamenteel voor elke app die tekstinhoud beschikbaar maakt voor gebruikers. Veelvoorkomende scenario's zijn zoekopdrachten in catalogussen of documenten, zoekopdrachten naar retailproducten of kennisanalyse voor gegevenswetenschap. Veel ondernemingen in verschillende branches willen een uitgebreide zoekervaring bouwen op persoonlijke, heterogene inhoud, die zowel gestructureerde als ongestructureerde documenten bevat. Als onderdeel van hun pijplijn kunnen ontwikkelaars aangepaste tekstclassificatie gebruiken om hun tekst te categoriseren in klassen die relevant zijn voor hun branche. De voorspelde klassen kunnen worden gebruikt om de indexering van het bestand te verrijken voor een meer aangepaste zoekervaring.

Levenscyclus van projectontwikkeling

Het maken van een aangepast tekstclassificatieproject omvat meestal verschillende stappen.

Volg deze stappen om optimaal gebruik te maken van uw model:

Definieer uw schema: ken uw gegevens en identificeer de klassen die u wilt onderscheiden, om dubbelzinnigheid te voorkomen.
Uw gegevens labelen: de kwaliteit van gegevenslabels is een belangrijke factor bij het bepalen van modelprestaties. Documenten die tot dezelfde klasse behoren, moeten altijd dezelfde klasse hebben, als u een document hebt dat in twee klassen kan worden ingedeeld, gebruik dan multilabelclassificatieprojecten . Vermijd dubbelzinnigheid in klassen en zorg ervoor dat uw klassen duidelijk van elkaar kunnen worden gescheiden, met name bij classificatieprojecten met één label.
Het model trainen: uw model begint te leren van uw gelabelde gegevens.
De prestaties van het model weergeven: bekijk de evaluatiedetails voor uw model om te bepalen hoe goed het presteert wanneer het wordt geïntroduceerd in nieuwe gegevens.
Het model implementeren: als u een model implementeert, is het beschikbaar voor gebruik via de Analyse-API.
Tekst classificeren: gebruik uw aangepaste model voor aangepaste tekstclassificatietaken.

Referentiedocumentatie en codevoorbeelden

Wanneer u aangepaste tekstclassificatie gebruikt, raadpleegt u de volgende referentiedocumentatie en voorbeelden voor Azure AI Language:

Ontwikkelingsoptie/taal	Referentiedocumentatie	Voorbeelden
REST API's (ontwerpen)	REST API-documentatie
REST API's (runtime)	REST API-documentatie
C# (runtime)	C#-documentatie	C#-voorbeelden - C#-voorbeelden voor classificatie met één label - Classificatie met meerdere labels
Java (runtime)	Java-documentatie	Java-voorbeelden - Classificatie van één label Java-voorbeelden - Classificatie met meerdere labels
JavaScript (runtime)	Documentatie over JavaScript	JavaScript-voorbeelden -JavaScript-voorbeelden met één labelclassificatie - Classificatie met meerdere labels
Python (runtime)	Python-documentatie	Python-voorbeelden - Python-voorbeelden voor classificatie met één label - Classificatie met meerdere labels

Verantwoordelijke AI

Een AI-systeem omvat niet alleen de technologie, maar ook de mensen die het gaan gebruiken, de mensen die er last van hebben en de omgeving waarin het wordt geïmplementeerd. Lees de transparantienotitie voor aangepaste tekstclassificatie voor meer informatie over verantwoord gebruik en implementatie van AI in uw systemen. U kunt ook de volgende artikelen bekijken voor meer informatie:

Volgende stappen

Gebruik het quickstart-artikel om aan de slag te gaan met aangepaste tekstclassificatie.
Als u de levenscyclus van de projectontwikkeling doorloopt, raadpleegt u de woordenlijst voor meer informatie over de termen die in de documentatie voor deze functie worden gebruikt.
Vergeet niet om de servicelimieten te bekijken voor informatie zoals regionale beschikbaarheid.