Co je Custom Speech?
Custom Speech umožňuje vyhodnotit a vylepšit přesnost řeči na text pro vaše aplikace a produkty od Microsoftu. Podle odkazů v tomto článku můžete začít vytvářet vlastní prostředí pro práci s mluveným textem.
Co je v Custom Speech?
Abyste mohli provádět cokoli s Custom Speech, budete potřebovat účet Azure a předplatné služby Speech. Po použití účtu můžete data využít, naučit a testovat vaše modely, kontrolovat kvalitu rozpoznávání, hodnotit přesnost a nakonec nasazovat a používat vlastní model řeči na text.
Tento diagram zvýrazňuje části, které tvoří Custom Speech oblasti sady Speech Studio. Pomocí odkazů níže můžete získat další informace o jednotlivých krocích.

Přihlaste se k odběru a vytvořte projekt. Vytvořte účet Azure a přihlaste se k odběru služby Speech. Toto jednotné předplatné vám umožní přístup k převodu řeči na text, převod textu na řeč, rozpoznávání řeči a rozpoznávánířeči. Pak pomocí svého předplatného služby Speech vytvořte svůj první Custom Speech projekt.
Upload testovací data. Upload testovací data (zvukové soubory) k vyhodnocení nabídky Microsoft speech to-text pro vaše aplikace, nástroje a produkty.
Kontrola kvality rozpoznávání. Pomocí sady Speech Studio můžete nahrajte nahraný zvuk a zkontrolovat kvalitu rozpoznávání řeči vašich testovacích dat. Kvantitativní měření najdete v tématu Kontrola dat.
Vyhodnotit a zlepšit přesnost. Vyhodnotit a vylepšit přesnost modelu řeči na text. Rozpoznávání řeči v studiu vám nabídne Četnost chyb slov, kterou můžete použít k určení, jestli je potřeba další školení. Pokud jste spokojeni s přesností, můžete použít rozhraní API služby Speech přímo. Pokud chcete zlepšit přesnost relativních průměrů 5 až 20%, použijte na portálu kartu školení k nahrání dalších školicích dat, jako jsou přepisy popisků a související text.
Výuka a nasazení modelu Vylepšete přesnost vašeho modelu řeči na text tím, že zadáte psané přepisy (10 až 1 000 hodin) a související text (<200 MB) spolu s daty testovacího testu. Tato data pomáhají naučit model řeči na text. Po školení proveďte test. Pokud jste s výsledkem spokojeni, můžete model nasadit do vlastního koncového bodu.
Nastavení účtu Azure
Musíte mít účet Azure a předplatné služby Speech ještě předtím, než budete moct pomocí nástroje Speech Studio vytvořit vlastní model. Pokud účet a předplatné nemáte, Vyzkoušejte službu Speech Service zdarma.
Pokud máte v úmyslu vytvořit vlastní model se zvukovými daty, vyberte jednu z následujících oblastí, která má vyhrazený hardware k dispozici pro školení. Tím se zkrátí doba potřebná k výuce modelu a umožní vám využít více zvuků pro školení. V těchto oblastech bude služba řeči používat až 20 hodin zvukového školení. v ostatních oblastech bude používat jenom až 8 hodin.
- Austrálie – východ
- Střední Kanada
- Indie – střed
- East US
- USA – východ 2
- USA – středosever
- Severní Evropa
- Středojižní USA
- Southeast Asia
- Spojené království – jih
- USA (Gov) – Arizona
- USA (Gov) – Virginia
- West Europe
- Západní USA 2
Po vytvoření účtu Azure a předplatného služby Speech se budete muset přihlásit ke službě Speech Studio a připojit své předplatné.
- Přihlaste se ke službě Speech Studio.
- Vyberte předplatné, ve kterém potřebujete pracovat, a vytvořte projekt řeči.
- Pokud chcete upravit své předplatné, vyberte v horní nabídce tlačítko ozubeného kola.
Jak vytvořit projekt
Obsah, který je podobný datům, modelům, testům a koncovým bodům, je uspořádán do projektů v aplikaci Speech Studio. Každý projekt je specifický pro doménu a zemi/jazyk. Můžete například vytvořit projekt pro volání Center, která používají angličtinu v USA.
Pokud chcete vytvořit svůj první projekt, vyberte Převod řeči na text/vlastní řeč a pak vyberte Nový Project. Postupujte podle pokynů průvodce a vytvořte projekt. Po vytvoření projektu byste měli vidět čtyři karty: data, testování, školení a nasazení. Pomocí odkazů uvedených v následujících krocích se dozvíte, jak používat jednotlivé karty.
Životní cyklus modelu a koncového bodu
Starší modely obvykle jsou méně užitečné v průběhu času, protože nejnovější model obvykle má vyšší přesnost. Proto platí, že základní modely i vlastní modely a koncové body vytvořené prostřednictvím portálu podléhají vypršení platnosti po 1 roce pro úpravu a 2 roky pro dekódování. Podrobný popis najdete v článku o životním cyklu modelu a koncového bodu .