Začínáme s vlastním neuronové hlasem
Custom neuronové Voice je sada online nástrojů, která vám umožní vytvořit pro vaši značku rozpoznatelný hlas typu One-to-a. Vše, co vše trvá, je několik zvukových souborů a přidružených přepisů. Pomocí odkazů níže můžete začít vytvářet vlastní prostředí pro převod textu na řeč. Podívejte se na podporované jazyky a oblasti pro vlastní neuronové hlas.
Poznámka
V rámci snahy Microsoftu o návrh zodpovědného AI jsme omezili použití vlastního hlasu neuronové. Přístup k technologii můžete získat až po kontrole vašich aplikací a s potvrzením, že je budete používat v souladu s našimi zodpovědnými principy AI. Přečtěte si další informace o našich zásadách pro omezení přístupu a použijte je tady.
Nastavení účtu Azure
Aby bylo možné používat vlastní neuronové hlas, je nutné předplatné služby Speech. Podle těchto pokynů vytvořte v Azure předplatné služby Speech. Pokud nemáte účet Azure, můžete se zaregistrovat k novému.
Jakmile vytvoříte účet Azure a předplatné služby Speech, budete se muset přihlásit a připojit k předplatnému.
- Získejte klíč předplatného služby Speech z Azure Portal.
- Přihlaste se ke službě Speech Studioa pak klikněte na vlastní hlas.
- Vyberte své předplatné a vytvořte projekt řeči.
- Pokud byste chtěli přepnout na jiné předplatné řeči, použijte ikonu ozubeného kola umístěnou v horním navigačním panelu.
Poznámka
Než budete moct službu používat, musíte mít v Azure vytvořený klíč služby F0 nebo S0 Speech. Vlastní neuronové hlas podporuje pouze vrstvu S0.
Vytvoření projektu
Obsah, který je podobný datům, modelům, testům a koncovým bodům, je uspořádán do projektů v aplikaci Speech Studio. Každý projekt je specifický pro zemi nebo jazyk a pohlaví hlasu, který chcete vytvořit. Můžete například vytvořit projekt pro žena Voice pro chat roboty vašeho centra volání, který používá angličtinu v USA (EN-US).
Pokud chcete vytvořit svůj první projekt, vyberte kartu Převod textu na řeč nebo vlastní hlas a pak klikněte na vytvořit projekt. Postupujte podle pokynů průvodce a vytvořte projekt. Po vytvoření projektu se zobrazí čtyři karty: nastavení hlasových talentů, Příprava školicích dat, model výuky a model nasazení. Pomocí odkazů uvedených v následujících krocích se dozvíte, jak používat jednotlivé karty.
Tipy pro vytvoření vlastního hlasu neuronové
Vytvoření skvělého vlastního hlasu vyžaduje pečlivé řízení kvality v každém kroku, od návrhu hlasu a přípravy dat až po nasazení hlasového modelu do vašeho systému. Níže jsou uvedeny některé klíčové kroky, které je potřeba provést při vytváření vlastního neuronové hlasu pro vaši organizaci.
Návrh osoby
Nejprve Navrhněte osoby, které představují vaši značku, pomocí stručného dokumentu, který definuje prvky, jako jsou funkce hlasu, a znaku za hlasem. Pomůže vám to při procesu vytváření vlastního hlasového modelu včetně definování skriptů, výběru hlasových talentů, školení a ladění hlasu.
Výběr skriptu
Pečlivě vyberte skript pro nahrávání, který bude představovat scénáře uživatele pro váš hlas. V případě, že vytváříte robota služby pro zákazníky, můžete například použít fráze z konverzace robota jako svůj skript záznamu. Do skriptů zahrňte různé typy vět, včetně příkazů, otázek, vykřičníků atd.
Příprava školicích dat
Pro dosažení vysokého poměru signálu k hluku doporučujeme, aby byly zvukové nahrávky zachyceny v studiu profesionálního záznamu kvality. Kvalita hlasového modelu je silně závislá na vašich školicích datech. Vyžaduje se konzistentní objem, rychlost řeči, rozteč a konzistence v mannerisms řeči.
Až budou nahrávky připravené, připravte si data školení ve správném formátu pomocí přípravy školicích dat .
Školení
Po přípravě školicích dat přejdete do sady Speech Studio a vytvoříte vlastní neuronové hlas. Abyste mohli vytvořit vlastní hlas neuronové, musíte vybrat aspoň 300 projevy. Po nahrání se automaticky provedou série kontrol kvality dat. Pro vytváření vysoce kvalitních hlasových modelů byste tyto chyby měli opravit a znovu odeslat.
Testování
Připravte testovací skripty pro svůj hlasový model, který pokrývá různé případy použití pro vaše aplikace. Doporučuje se používat skripty v rámci a mimo datovou sadu školení, abyste mohli lépe testovat kvalitu pro různé obsahy.
Ladění a úpravy
Styl a vlastnosti školicího hlasového modelu závisí na stylu a kvalitě nahrávek z hlasového talentůu, které se používají pro školení. Můžete ale použít několik úprav pomocí SSML (Speech syntézy Markup Language) , když nakonfigurujete volání rozhraní API do vašeho hlasového modelu za účelem generování syntetického hlasu. SSML je jazyk značek, který se používá ke komunikaci se službou TTS pro převod textu na zvuk. Úpravy zahrnují změnu sklonu, poměru, výbuchu a opravy výslovnosti. Pokud je hlasový model sestaven s více styly, lze použít také SSML k přepínání stylů.
Migrace na vlastní neuronové hlas
Úroveň školení Standard/non-neuronové (Statistická funkce, concacenative) vlastního hlasu je zastaralá. Oznámení bylo odesláno do všech stávajících předplatných řeči před 2/28/2021. Během období vyřazení (3/1/2021-2/29/2024) mohou stávající uživatelé úrovně Standard nadále používat své neuronové vytvořené modely. Všichni noví uživatelé/nové prostředky pro rozpoznávání řeči by se měly přesunout do neuronové úrovně nebo vlastního hlasu neuronové. Po 2/29/2024 se už nepodporují všechny vlastní hlasy Standard/neuronové.
Pokud používáte vlastní hlas, který není neuronové nebo standardní, migrujte na vlastní neuronové hlas hned podle následujících kroků. Přechod na vlastní neuronové hlas vám pomůže vyvíjet realističtější hlasy ještě více přirozených konverzací a umožnit zákazníkům a koncovým uživatelům těžit z nejnovější technologie pro převod textu na řeč, a to podle zodpovědného způsobu.
- Přečtěte si další informace o našich zásadách pro omezení přístupu a použijte je tady. Všimněte si, že přístup k vlastní hlasové službě neuronové se může vztahovat jenom na naše kritérium týkající se nároků Microsoftu. Zákazníci mohou získat přístup k technologii až po kontrole jejich aplikace a potvrdili, že ji budou používat v souladu se svými odpovědnými principy AI a kodexem chování.
- Jakmile je vaše aplikace schválená, budete mít přístup k funkci školení "neuronové". Ujistěte se, že jste se přihlásili ke službě Speech Studio pomocí stejného předplatného Azure, které zadáte ve své aplikaci.
Důležité
Abychom chránili hlasové talentůy a zabránili školením v hlasových modelech s neoprávněným záznamem nebo bez potvrzení ze služby Voice talentů, potřebujeme, aby zákazník nahrál zaznamenané prohlášení o hlasovém talentůu, které poskytuje svůj souhlas. Při přípravě skriptu nahrávání nezapomeňte zahrnout tuto větu. "I [stav vašeho jména a příjmení] si uvědomte, že nahrávky mého hlasu budou použity uživatelem [State název společnosti] k vytvoření a použití syntetické verze mého hlasu." Tato věta se musí nahrát na kartu Nastavení hlasu talentů jako ústní soubor souhlasu. Použije se k ověření, jestli nahrávky v datových sadách pro školení provádí stejná osoba, která tento souhlas provádí.
- Po vytvoření vlastního neuronové hlasového modelu nasaďte hlasový model do nového koncového bodu. Pokud chcete vytvořit nový vlastní hlasový koncový bod pomocí neuronové hlasového modelu, přečtěte si text na řeč > Custom voice > nasadit model. Vyberte nasadit modely a zadejte název a Popis vlastního koncového bodu. Pak vyberte vlastní hlasový model neuronové, který chcete přidružit k tomuto koncovému bodu, a potvrďte nasazení.
- Pokud jste vytvořili nový koncový bod s novým modelem, aktualizujte si kód v aplikacích.