Aan de slag met Aangepaste neurale stem
Aangepaste neurale stem is een set onlinehulpprogramma's waarmee u een herkenbare, unieke stem voor uw merk kunt maken. U hebt alleen een aantal audiobestanden en de bijbehorende transcripties nodig om aan de slag te gaan. Volg de onderstaande koppelingen om een aangepaste tekst-naar-spraak-ervaring te maken. Zie de ondersteunde talen en regio's voor Aangepaste neurale stem.
Notitie
Als onderdeel van de toezegging van Microsoft om verantwoorde AI te ontwerpen, hebben we het gebruik van Aangepaste neurale stem. U kunt pas toegang krijgen tot de technologie nadat uw toepassingen zijn beoordeeld en u zich ervoor hebt ingezet om deze te gebruiken in overeenstemming met onze principes voor verantwoorde AI. Meer informatie over ons beleid voor het beperken van toegang en hier toepassen.
Uw Azure-account instellen
Een abonnement op de Speech-service is vereist voordat u een Aangepaste neurale stem. Volg deze instructies voor het maken van een Speech Service-abonnement in Azure. Als u geen Azure-account hebt, kunt u zich registreren voor een nieuw account.
Nadat u een Azure-account en een Speech Service-abonnement hebt gemaakt, moet u zich aanmelden bij Speech Studio en verbinding maken met uw abonnement.
- Haal uw abonnementssleutel voor de Speech-service op uit Azure Portal.
- Meld u aan bij Speech Studioen klik vervolgens op Custom Voice.
- Selecteer uw abonnement en maak een spraakproject.
- Als u wilt overschakelen naar een ander Spraak-abonnement, gebruikt u het cog-pictogram in de bovenste navigatiebalk.
Notitie
U moet een F0- of S0 Speech-servicesleutel hebben gemaakt in Azure voordat u de service kunt gebruiken. Aangepaste neurale stem ondersteunt alleen de S0-laag.
Een project maken
Inhoud zoals gegevens, modellen, tests en eindpunten zijn ingedeeld in Projecten in Speech Studio. Elk project is specifiek voor een land/taal en het geslacht van de stem die u wilt maken. U kunt bijvoorbeeld een project maken voor een vrouwenstem voor de chatbots van uw callcenter die Engels gebruiken in de Verenigde Staten ('en-US').
Als u uw eerste project wilt maken, selecteert u het tabblad Text-to-Speech/Custom Voice en klikt u vervolgens op Project maken. Volg de instructies van de wizard om uw project te maken. Nadat u een project hebt gemaakt, ziet u vier tabbladen: Spraak talent instellen, Trainingsgegevens voorbereiden, Model trainen en Model implementeren. Gebruik de koppelingen in de volgende stappen voor meer informatie over het gebruik van elk tabblad.
Tips voor het maken van een aangepaste neurale stem
Voor het maken van een geweldige aangepaste stem is een zorgvuldige kwaliteitscontrole vereist in elke stap, van spraakontwerp en gegevensvoorbereiding tot de implementatie van het spraakmodel op uw systeem. Hieronder volgen enkele belangrijke stappen die u moet nemen bij het maken van een aangepaste neurale stem voor uw organisatie.
Persona-ontwerp
Ontwerp eerst een persona van de stem die uw merk vertegenwoordigt aan de hand van een persoonlijk document dat elementen definieert, zoals de functies van de stem en het teken achter de stem. Dit helpt u bij het maken van een aangepast spraakmodel, inclusief het definiëren van de scripts, het selecteren van uw spraak talent, training en stemafstemming.
Scriptselectie
Selecteer zorgvuldig het opnamescript om de gebruikersscenario's voor uw stem weer te geven. U kunt bijvoorbeeld de zinnen uit botgesprekken gebruiken als uw opnamescript als u een klantenservicebot maakt. Neem verschillende zinstypen op in uw scripts, waaronder instructies, vragen, uitroepen, enzovoort.
Trainingsgegevens voorbereiden
We raden u aan om de audio-opnamen vast te maken in een professionele opnamestudio om een hoge signaal-ruisverhouding te bereiken. De kwaliteit van het spraakmodel is sterk afhankelijk van uw trainingsgegevens. Consistent volume, spreeksnelheid, toonhoogte en consistentie op expressieve manier van spraak zijn vereist.
Zodra de opnamen gereed zijn, volgt u Trainingsgegevens voorbereiden om de trainingsgegevens in de juiste indeling voor te bereiden.
Training
Nadat u de trainingsgegevens hebt voorbereid, gaat u naar Speech Studio uw aangepaste neurale stem te maken. U moet ten minste 300 utterances selecteren om een aangepaste neurale stem te maken. Er wordt automatisch een reeks gegevenskwaliteitscontroles uitgevoerd wanneer u ze uploadt. Als u spraakmodellen van hoge kwaliteit wilt bouwen, moet u de fouten corrigeren en opnieuw verzenden.
Testen
Bereid testscripts voor uw spraakmodel voor die betrekking hebben op de verschillende gebruiksgevallen voor uw apps. Het is raadzaam om scripts binnen en buiten de trainingsset te gebruiken, zodat u de kwaliteit breder kunt testen voor verschillende inhoud.
Afstemmen en aanpassen
De stijl en de kenmerken van het getrainde spraakmodel zijn afhankelijk van de stijl en de kwaliteit van de opnamen van het spraak talent dat wordt gebruikt voor de training. Er kunnen echter verschillende aanpassingen worden aangebracht met behulp van SSML (Speech Synthesis Markup Language) wanneer u de API-aanroepen naar uw spraakmodel maakt om synthetische spraak te genereren. SSML is de markeringstaal die wordt gebruikt om te communiceren met de TTS-service om tekst om te zetten in audio. De aanpassingen omvatten wijziging van de toonhoogte, snelheid, intonatie en uitspraakcorrectie. Als het spraakmodel is gebouwd met meerdere stijlen, kan SSML ook worden gebruikt om van stijlen te wisselen.
Migreren naar Aangepaste neurale stem
De standaard/niet-neurale trainingslaag (statistische parametrische, concacenatieve) van Custom Voice wordt afgeschaft. De aankondiging is verzonden naar alle bestaande Spraak-abonnementen vóór 28-2-2021. Tijdens de afschaffingsperiode (1-3-2021 - 29-2024) kunnen bestaande standaardgebruikers hun niet-neurale modellen blijven gebruiken. Alle nieuwe gebruikers/nieuwe spraakresources moeten worden verplaatst naar de neurale laag/Aangepaste neurale stem. Na 29-2-2024 worden alle standaard/niet-neurale aangepaste stemmen niet meer ondersteund.
Als u niet-neurale/standaard-Custom Voice gebruikt, migreert u naar Aangepaste neurale stem stappen hieronder. Door over te gaan naar Aangepaste neurale stem kunt u meer realistische stemmen ontwikkelen voor nog natuurlijkere gespreksinterfaces en kunnen uw klanten en eindgebruikers op een verantwoorde manier profiteren van de nieuwste Text-to-Speech-technologie.
- Meer informatie over ons beleid voor het beperken van toegang en hier toepassen. Houd er rekening mee dat de toegang tot de Aangepaste neurale stem-service afhankelijk is van de discretie van Microsoft op basis van onze geschiktheidscriteria. Klanten kunnen pas toegang krijgen tot de technologie nadat hun toepassing is beoordeeld en ze hebben zich verplicht om deze te gebruiken in overeenstemming met onze principes voor verantwoorde AI en de gedragscode.
- Zodra uw toepassing is goedgekeurd, krijgt u toegang tot de functie neurale training. Zorg ervoor dat u zich aanmeldt bij Speech Studio met hetzelfde Azure-abonnement dat u in uw toepassing hebt verstrekt.
Belangrijk
Om spraak talent te beschermen en te voorkomen dat spraakmodellen worden getraind met niet-geautoriseerde opname of zonder bevestiging van het spraak talent, moeten we de klant een vastgelegde verklaring van het spraak talent uploaden dat toestemming geeft. Zorg ervoor dat u deze zin opneemt wanneer u het opnamescript voorbereidt. "Ik [mijn voor- en achternaam] weet dat opnamen van mijn stem door [de naam van het bedrijf] worden gebruikt om een synthetische versie van mijn stem te maken en te gebruiken. Deze zin moet worden geüpload naar het tabblad Spraak talent instellen als een bestand met gesproken toestemming. Deze wordt gebruikt om te controleren of de opnamen in uw trainingsgegevenssets worden uitgevoerd door dezelfde persoon die toestemming geeft.
- Nadat het Aangepaste neurale stem model is gemaakt, implementeert u het spraakmodel op een nieuw eindpunt. Als u een nieuw eindpunt voor aangepaste spraak wilt maken met uw neurale spraakmodel, gaat u naar Text-to-Speech > Custom Voice > Deploy model. Selecteer Modellen implementeren en voer een naam en beschrijving in voor uw aangepaste eindpunt. Selecteer vervolgens het aangepaste neurale spraakmodel dat u aan dit eindpunt wilt koppelen en bevestig de implementatie.
- Werk uw code in uw apps bij als u een nieuw eindpunt met een nieuw model hebt gemaakt.