Trénování a nasazení modelu Custom Speech

V tomto článku se dozvíte, jak trénovat a nasazovat vlastní modely řeči. Trénování modelu převodu řeči na text může zlepšit přesnost rozpoznávání základního modelu Microsoftu. K trénování modelu použijete přepisy označené lidmi a související text. Tyto datové sady se používají společně s dříve nahranými zvukovými daty k upřesnění a trénování modelu převodu řeči na text.

Poznámka

Platíte za používání modelů Custom Speech, ale za trénování modelu se vám neúčtují poplatky.

Řešení problémů s přesností pomocí trénování

Pokud narazíte na problémy s rozpoznáváním základního modelu, můžete pomocí přepisů označených člověkem a souvisejících dat vytrénovat vlastní model a zlepšit přesnost. Informace o tom, kterou datovou sadu použít k řešení vašich problémů, najdete v následující tabulce:

Případ použití Datový typ
Zlepšete přesnost rozpoznávání slovníku a gramatiky specifické pro odvětví, jako je lékařská terminologie nebo žargon IT. Prostý text nebo strukturovaná textová data
Definujte fonetický a zobrazený tvar slova nebo termínu, který má nestandardní výslovnost, například názvy produktů nebo zkratky. Data výslovnosti nebo fonetické výslovnosti ve strukturovaném textu
Zvyšte přesnost rozpoznávání stylů, zvýraznění nebo konkrétních šumů na pozadí. Přepisy s popisky zvuku a člověka

Trénování a vyhodnocení modelu

Prvním krokem při trénování modelu je nahrání trénovacích dat. Podrobné pokyny k přípravě přepisů označených člověkem a souvisejícího textu (promluv a výslovnosti) najdete v tématu Příprava a otestování dat. Po nahrání trénovacích dat začněte trénovat model podle těchto pokynů:

  1. Přihlaste se k portálu služby Custom Speech. Pokud plánujete vytrénovat model pomocí zvukových datových sad s přepisem označenými lidmi, vyberte předplatné služby Speech v oblasti s vyhrazeným hardwarem pro trénování.

  2. Přejděte na Speech-to-textCustom>Speech>[název projektu]>Školení.

  3. Vyberte Trénování modelu.

  4. Zadejte název a popis trénování.

  5. V seznamu scénářů a standardních modelů vyberte scénář, který nejlépe vyhovuje vaší doméně. Pokud si nejste jistí, který scénář chcete zvolit, vyberte Obecné. Základní model je výchozím bodem pro trénování. Nejnovější model je obvykle nejlepší volbou.

  6. Na stránce Vybrat trénovací data zvolte jednu nebo více souvisejících textových datových sad nebo zvukových datových sad s popiskem pro člověka, které chcete použít pro trénování.

    Poznámka

    Při trénování nového modelu začněte souvisejícím textem. Trénování se zvukem a přepisem označeným člověkem může trvat mnohem déle (až několik dní).

    Poznámka

    Ne všechny základní modely podporují trénování zvukem. Pokud ho základní model nepodporuje, služba Speech použije jenom text z přepisů a zvuk ignoruje. Seznam základních modelů, které podporují trénování pomocí zvukových dat, najdete v tématu Podpora jazyků.

    Poznámka

    V případech, kdy změníte základní model použitý pro trénování a máte zvuk v trénovací datové sadě, vždy zkontrolujte, jestli nový vybraný základní model podporuje trénování se zvukovými daty. Pokud dříve použitý základní model nepodporuje trénování s zvukovými daty a trénovací datová sada obsahuje zvuk, trénovací doba s novým základním modelem se výrazně zvýší a může snadno trvat několik hodin až několik dní a více. To platí zejména v případě, že vaše předplatné služby Speech není v oblasti s vyhrazeným hardwarem pro trénování.

    Pokud se setkáte s problémem popsaným v předchozím odstavci, můžete rychle zkrátit dobu trénování tím, že zmenšíte množství zvuku v datové sadě nebo ho úplně odeberete a necháte jenom text. Druhou možnost doporučujeme, pokud vaše předplatné služby Speech není v oblasti s vyhrazeným hardwarem pro trénování.

  7. Po dokončení trénování můžete provádět testování přesnosti na nově natrénovaného modelu. Tento krok je volitelný.

  8. Vyberte Vytvořit a sestavte vlastní model.

V tabulce Trénování se zobrazí nová položka, která odpovídá novému modelu. Tabulka také zobrazuje stav : Zpracování, Úspěšné nebo Neúspěšné.

Další informace najdete v článku s návody k vyhodnocení a vylepšení přesnosti modelu custom speech. Pokud se rozhodnete otestovat přesnost, je důležité vybrat akustickou datovou sadu, která se liší od datové sady, kterou jste použili s modelem. Tento přístup může poskytnout realističtější představu o výkonu modelu.

Poznámka

Základní modely i vlastní modely je možné použít až do určitého data (viz Životní cyklus modelu a koncového bodu). Speech Studio zobrazí toto datum ve sloupci Vypršení platnosti pro každý model a koncový bod. Po tomto datu může žádost o koncový bod nebo dávkové přepisy selhat nebo se vrátit k základnímu modelu.

Přetrénujte model pomocí nejnovějšího základního modelu, abyste získali výhody z vylepšení přesnosti a vyhnuli se vypršení platnosti modelu.

Nasazení vlastního modelu

Po nahrání a kontrole dat, zhodnocení přesnosti a natrénování vlastního modelu můžete nasadit vlastní koncový bod, který budou používat vaše aplikace, nástroje a produkty.

  1. Pokud chcete vytvořit vlastní koncový bod, přihlaste se k portálu Custom Speech.

  2. V nabídce Custom Speech v horní části stránky vyberte Nasazení.

    Pokud se jedná o vaše první spuštění, všimněte si, že v tabulce nejsou uvedené žádné koncové body. Po vytvoření koncového bodu na této stránce můžete sledovat jednotlivé nasazené koncové body.

  3. Vyberte Přidat koncový bod a zadejte název a popis vlastního koncového bodu.

  4. Vyberte vlastní model, který chcete ke koncovému bodu přidružit.

    Na této stránce můžete také povolit protokolování. Protokolování vám umožní monitorovat provoz koncového bodu. Pokud je protokolování zakázané, provoz se nebude ukládat.

    Screenshot showing the selected Log content from this endpoint checkbox on the New endpoint page.

    Poznámka

    Nezapomeňte přijmout podmínky použití a podrobnosti o cenách.

  5. Vyberte Vytvořit.

    Tato akce vás vrátí na stránku Nasazení . Tabulka teď obsahuje položku, která odpovídá vašemu vlastnímu koncovému bodu. Stav koncového bodu zobrazuje jeho aktuální stav. Vytvoření instance nového koncového bodu, který používá vaše vlastní modely, může trvat až 30 minut. Jakmile se stav nasazení změní na Dokončeno, koncový bod je připravený k použití.

    Po nasazení koncového bodu se jeho název změní na odkaz.

  6. Výběrem odkazu na koncový bod zobrazíte informace specifické pro něj, například klíč koncového bodu, adresu URL koncového bodu a ukázkový kód.

    Poznamenejte si datum vypršení platnosti a aktualizujte model koncového bodu před tímto datem, abyste zajistili nepřerušenou službu.

Zobrazení dat protokolování

Protokolování dat je k dispozici pro export ze stránky koncového bodu v části Nasazení.

Poznámka

Protokolování dat je k dispozici v úložišti vlastněné Microsoftem po dobu 30 dnů, po které se odeberou. Pokud je účet úložiště vlastněný zákazníkem propojený s předplatným služeb Cognitive Services, data protokolování se automaticky neodstraní.

Další materiály