Een Custom Speech-model trainen en implementeren

In dit artikel leert u hoe u Custom Speech-modellen traint en implementeert. Het trainen van een spraak-naar-tekst-model kan de nauwkeurigheid van de herkenning verbeteren voor het Basislijnmodel van Microsoft. U gebruikt door mensen gelabelde transcripties en gerelateerde tekst om een model te trainen. Deze gegevenssets, samen met eerder geüploade audiogegevens, worden gebruikt om het spraak-naar-tekst-model te verfijnen en te trainen.

Training gebruiken om nauwkeurigheidsproblemen op te lossen

Als u herkenningsproblemen ondervindt met een basismodel, kunt u door mensen gelabelde transcripten en gerelateerde gegevens gebruiken om een aangepast model te trainen en de nauwkeurigheid te verbeteren. Gebruik deze tabel om te bepalen welke gegevensset u moet gebruiken om uw problemen op te lossen:

Gebruiksvoorbeeld Gegevenstype
De nauwkeurigheid van de herkenning verbeteren voor branchespecifieke woordenlijst en grammatica, zoals medische terminologie of IT-jargon Tekst zonder tekst of gestructureerde tekstgegevens
Definieer de phonetische en weergegeven vorm van een woord of term die niet-standaard uitspraak heeft, zoals productnamen of acroniemen Uitspraakgegevens of phonetische uitspraak in gestructureerde tekst
De nauwkeurigheid van de herkenning verbeteren voor spreekstijlen, accenten of specifieke achtergrondgeluiden Audio en door mensen gelabelde transcripten

Een model trainen en evalueren

De eerste stap voor het trainen van een model bestaat uit het uploaden van trainingsgegevens. Zie Uw gegevens voorbereiden en testen voor stapsgewijze instructies om door mensen gelabelde transcripties en gerelateerde tekst (uitingen en uitspraak) voor te bereiden. Nadat u trainingsgegevens hebt geüpload, volgt u deze instructies om te beginnen met het trainen van uw model:

  1. Meld u aan bij de Custom Speech-portal. Als u van plan bent om een model te trainen met gegevenssets met audio en transcriptie met menselijke labels, kiest u een Spraak-abonnement in een regio met toegewezen hardware voor training.
  2. Ga naar Spraak-naar-tekst > Aangepaste spraak > [naam van project] > Training.
  3. Selecteer Model trainen.
  4. Geef uw training een naam en beschrijving.
  5. Selecteer in de lijst Scenario en Basislijnmodel het scenario dat het beste bij uw domein past. Als u niet zeker weet welk scenario u moet kiezen, selecteert u Algemeen. Het basislijnmodel is het beginpunt voor de training. Het meest recente model is meestal de beste keuze.
  6. Kies op de pagina Trainingsgegevens selecteren een of meer gerelateerde tekstgegevenssets of audio- en door mensen gelabelde transcriptiegegevenssets die u wilt gebruiken voor de training.

Notitie

Wanneer u een nieuw model traint, begint u met gerelateerde tekst; Het trainen met audio en door mensen gelabelde transcriptie kan veel langer duren (tot enkele dagen).

Notitie

Niet alle basismodellen ondersteunen training met audio. Als een basismodel dit niet ondersteunt, gebruikt de Speech-service alleen de tekst uit de transcripten en negeert de audio. Zie Taalondersteuning voor een lijst met basismodellen die ondersteuning bieden voor training met audiogegevens.

Notitie

Als u het basismodel wijzigt dat wordt gebruikt voor training en u audio in de trainingsgegevensset hebt, controleert u altijd of het nieuwe geselecteerde basismodel training met audiogegevens ondersteunt. Als het eerder gebruikte basismodel geen ondersteuning biedt voor training met audiogegevens en de trainingsgegevensset audio bevat, neemt de training met het nieuwe basismodel drastisch toe en kan deze eenvoudig van enkele uren naar enkele dagen en meer gaan. Dit geldt met name als uw abonnement op de Speech-service zich niet in een regio met de toegewezen hardware voor training.

Als u te maken hebt met het probleem dat in de bovenstaande alinea wordt beschreven, kunt u de training snel verkorten door de hoeveelheid audio in de gegevensset te verminderen of deze volledig te verwijderen en alleen de tekst te verlaten. De laatste optie wordt ten zeerste aanbevolen als uw Speech Service-abonnement zich niet in een regio met de toegewezen hardware voor training.

  1. Nadat de training is voltooid, kunt u nauwkeurigheidstests uitvoeren op het zojuist getrainde model. Deze stap is optioneel.
  2. Selecteer Maken om uw aangepaste model te bouwen.

In de tabel Training wordt een nieuwe vermelding weergegeven die overeenkomt met het nieuwe model. In de tabel wordt ook de status weergegeven: Verwerken, Geslaagd of Mislukt.

Zie de informatie over het evalueren en verbeteren van de nauwkeurigheid van het Custom Speech-model. Als u ervoor kiest om de nauwkeurigheid te testen, is het belangrijk om een akoestische gegevensset te selecteren die verschilt van de gegevensset die u met uw model hebt gebruikt om een realistisch beeld te krijgen van de prestaties van het model.

Notitie

Zowel basismodellen als aangepaste modellen kunnen slechts tot een bepaalde datum worden gebruikt (zie Levenscyclus van model en eindpunt). Speech Studio geeft deze datum weer in de kolom Verloop voor elk model en eindpunt. Na die datum kan de aanvraag voor een eindpunt of batchtranscriptie mislukken of terugvallen op het basismodel.

U moet uw model opnieuw trainen met behulp van het meest recente basismodel om te profiteren van nauwkeurigheidsverbeteringen en om te voorkomen dat uw model verloopt.

Aangepaste model implementeren

Nadat u gegevens hebt geüpload en gecontroleerd, nauwkeurigheid hebt geëvalueerd en een aangepast model hebt trainen, kunt u een aangepast eindpunt implementeren voor gebruik met uw apps, hulpprogramma's en producten.

Meld u aan bij de Custom Speech-portalom een aangepast eindpunt te maken. Selecteer Implementatie in het menu Custom Speech bovenaan de pagina. Als dit uw eerste run is, ziet u dat er geen eindpunten worden vermeld in de tabel. Nadat u een eindpunt hebt gemaakt, gebruikt u deze pagina om elk geïmplementeerd eindpunt bij te houden.

Selecteer vervolgens Eindpunt toevoegen en voer een naam en beschrijving in voor uw aangepaste eindpunt. Selecteer vervolgens het aangepaste model dat u wilt koppelen aan het eindpunt. U kunt logboekregistratie ook inschakelen vanaf deze pagina. Met logboekregistratie kunt u eindpuntverkeer bewaken. Als logboekregistratie is uitgeschakeld, wordt het verkeer niet opgeslagen.

Schermopname van de pagina Nieuw eindpunt.

Notitie

Vergeet niet om de gebruiksvoorwaarden en prijsinformatie te accepteren.

Selecteer vervolgens Maken. Met deze actie keert u terug naar de pagina Implementatie. De tabel bevat nu een vermelding die overeenkomt met uw aangepaste eindpunt. De status van het eindpunt geeft de huidige status weer. Het kan tot 30 minuten duren voordat een nieuw eindpunt is gemaakt met behulp van uw aangepaste modellen. Wanneer de status van de implementatie wordt gewijzigd in Voltooien, is het eindpunt klaar voor gebruik.

Nadat uw eindpunt is geïmplementeerd, wordt de naam van het eindpunt weergegeven als een koppeling. Selecteer de koppeling om informatie te zien die specifiek is voor uw eindpunt, zoals de eindpuntsleutel, eindpunt-URL en voorbeeldcode. Noteer de vervaldatum en werk het eindpuntmodel vóór die datum bij om een ononderbroken service te garanderen.

Logboekgegevens weergeven

Logboekgegevens kunnen worden geëxporteerd als u naar de pagina van het eindpunt gaat onder Implementaties.

Notitie

Logboekregistratiegegevens zijn 30 dagen beschikbaar in opslag van Microsoft. Deze wordt later verwijderd. Als een opslagaccount van de klant is gekoppeld aan het Cognitive Services-abonnement, worden de logboekgegevens niet automatisch verwijderd.

Volgende stappen

Aanvullende bronnen