Co je překlad řeči?

V tomto přehledu se dozvíte o výhodách a možnostech služby překladu řeči, která umožňuje překlad řeči na řeč v reálném čase a převod řeči na text u zvukových streamů. Sada Speech SDK poskytuje vašim aplikacím, nástrojům a zařízením přístup ke zdrojovým přepisům a výstupům překladů poskytnutého zvuku. V průběhu detekce řeči se vrací průběžné výsledky přepisů a překladů, konečné výsledky se pak dají převést na syntetickou řeč.

Tato dokumentace obsahuje následující typy článku:

  • Rychlé starty jsou úvodní pokyny, které vás provede prováděním požadavků na službu.
  • Návody obsahují pokyny pro použití služby konkrétnějšími nebo přizpůsobenějšími způsoby.
  • Koncepty poskytují podrobné vysvětlení funkcí a funkcí služby.
  • Kurzy jsou delší příručky, které vám ukážou, jak tuto službu používat jako součást v širších obchodních řešeních.

Základní funkce

  • Překlad řeči na text s výsledky rozpoznávání
  • Překlad řeči na řeč.
  • Podpora překladu do více cílových jazyků
  • Přechodné výsledky rozpoznávání a překladu.

Začínáme

Pokud chcete začít s překladem řeči, podívejte se na rychlý start. Služba překladu řeči je dostupná prostřednictvím sady Speech SDK a rozhraní příkazového řádku služby Speech.

Ukázka kódu

Ukázkový kód pro sadu Speech SDK je k dispozici na GitHub. Tyto ukázky popisují běžné scénáře, jako je čtení zvuku ze souboru nebo streamu, průběžné rozpoznávání/překlad na začátku a práce s vlastními modely.

Průvodci migrací

Pokud vaše aplikace, nástroje nebo produkty používají rozhraní TRANSLATOR Speech API,vytvořili jsme příručky, které vám pomůžou s migrací do služby Speech.

Referenční dokumenty

Další kroky