Wat is aangepaste tekstclassificatie (preview)?

Aangepaste tekstclassificatie is een van de functies van Azure Cognitive Service for Language. Het is een api-service in de cloud waarmee machine learning-intelligentie wordt toegepast, zodat u aangepaste modellen kunt bouwen voor tekstclassificatietaken.

Aangepaste tekstclassificatie wordt aangeboden als onderdeel van de aangepaste functies in Azure Cognitive for Language. Met deze functie kunnen gebruikers aangepaste AI-modellen bouwen om tekst te classificeren in aangepaste categorieën die vooraf zijn gedefinieerd door de gebruiker. Door een aangepast classificatieproject te maken, kunnen ontwikkelaars iteratief gegevens taggen, modelprestaties trainen, evalueren en verbeteren voordat ze ze beschikbaar maken voor gebruik. De kwaliteit van de getagde gegevens heeft een grote invloed op de prestaties van het model. Om het bouwen en aanpassen van uw model te vereenvoudigen, biedt de service een aangepaste webportal die toegankelijk is via Language Studio. U kunt eenvoudig aan de slag met de service door de stappen in deze quickstart te volgen.

Aangepaste tekstclassificatie ondersteunt twee typen projecten:

  • Classificatie met één label: u kunt één klasse toewijzen voor elk bestand van uw gegevensset. Een filmscript kan bijvoorbeeld alleen worden geclassificeerd als Actie of Als.
  • Classificatie van meerdere labels: u kunt meerdere klassen toewijzen voor elk bestand van uw gegevensset. Een filmscript kan bijvoorbeeld worden geclassificeerd als 'Actie' of 'Actie en Moet'.

Deze documentatie bevat de volgende artikeltypen:

  • Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
  • Concepten bieden uitleg over de servicefunctionaliteit en -functies.
  • Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.

Voorbeeld van gebruiksscenario's

Automatische e-mails/ticket triage

Ondersteuningscentra van alle typen ontvangen duizenden tot honderdduizenden e-mailberichten/tickets met ongestructureerde vrije tekst en bijlagen. Tijdige beoordeling, bevestiging en routering naar deskundigen binnen interne teams is essentieel. E-mailsemanage op deze schaal waarbij mensen betrokken zijn om de juiste afdelingen te controleren en naar de juiste afdelingen te sturen, kost echter tijd en kostbare resources. Aangepaste classificatie kan worden gebruikt voor het analyseren van binnenkomende tekstsortificatie en categoriseren van de inhoud die automatisch moet worden doorgeleid naar de relevante afdeling om de benodigde acties uit te voeren.

Zoeken is een basis voor apps die tekstinhoud weergeven voor gebruikers, met veelvoorkomende scenario's zoals: zoeken in catalogussen of documenten, zoeken naar retailproducten of kennismining voor gegevenswetenschap.Veel bedrijven in verschillende branches willen een uitgebreide zoekervaring ontwikkelen voor persoonlijke, heterogene inhoud, die zowel gestructureerde als ongestructureerde documenten bevat. Als onderdeel van hun pijplijn kunnen ontwikkelaars aangepaste classificatie gebruiken om tekst te categoriseren in klassen die relevant zijn voor hun branche. De voorspelde klassen kunnen worden gebruikt om de indexering van het bestand te verrijken voor een meer aangepaste zoekervaring.

Project ontwikkelingslevenscyclus

Het maken van een aangepast classificatieproject omvat doorgaans verschillende stappen.

De ontwikkelingslevenscyclus

Volg deze stappen om het meeste uit uw model te halen:

  1. Schema definiëren: kent uw gegevens en identificeer de klassen waartussen u onderscheid wilt maken, vermijd ambiguïteit.

  2. Gegevens taggen: De kwaliteit van het taggen van gegevens is een belangrijke factor bij het bepalen van de modelprestaties. Tag alle bestanden die u wilt opnemen in de training. Bestanden die tot dezelfde klasse behoren, moeten altijd dezelfde klasse hebben, als u een bestand hebt dat in twee klassen kan vallen. Gebruik meerdere klasseclassificatieprojecten. Vermijd ambiguïteit in klassen, zorg ervoor dat uw klassen duidelijk van elkaar zijn gescheiden, met name bij classificatieprojecten met één klasse.

  3. Train model: uw model begint te leren van uw getagde gegevens.

  4. Details van modelevaluatie weergeven: bekijk de evaluatiedetails voor uw model om te bepalen hoe goed het presteert wanneer het wordt geïntroduceerd in nieuwe gegevens.

  5. Model verbeteren: werk aan het verbeteren van de prestaties van uw model door de onjuiste modelvoorspellingen te onderzoeken en de gegevensdistributie te onderzoeken.

  6. Model implementeren: als u een model implementeert, is het beschikbaar voor gebruik via de Analyze API.

  7. Tekst classificeren: gebruik uw aangepaste model voor tekstclassificatietaken.

Volgende stappen

  • Gebruik het quickstart-artikel om aangepaste tekstclassificatie te gaan gebruiken.

  • Als u de levenscyclus van projectontwikkeling doorloop, bekijkt u de woordenlijst voor meer informatie over de termen die in de documentatie voor deze functie worden gebruikt.

  • Vergeet niet om de servicelimieten weer te geven voor informatie zoals regionale beschikbaarheid.