Co jsou zařízení Speech?

Článek
01/23/2024

Služba Speech funguje s širokou škálou zařízení a zdrojů zvuku. Můžete použít výchozí zpracování zvuku dostupné na zařízení. V opačném případě má sada Speech SDK možnost používat naše pokročilé algoritmy pro zpracování zvuku, které jsou navržené tak, aby dobře fungovaly se službou Speech. Poskytuje přesné rozpoznávání řeči s dalekosáhlým polem prostřednictvím potlačení šumu, zrušení ozvěny, tvarování paprsku a dereverberace.

Zpracování zvuku

Zpracování zvuku je vylepšení použitá u datového proudu zvuku, aby se zlepšila kvalita zvuku. Mezi běžné vylepšení patří automatické řízení získání (AGC), potlačení šumu a zrušení akustické ozvěny (AEC). Sada Speech SDK integruje Microsoft Audio Stack (MAS) a umožňuje jakékoli aplikaci nebo produktu používat své možnosti zpracování zvuku na vstupu zvuku.

Doporučení pro mikrofonní pole

Sada Speech SDK funguje nejlépe s polem mikrofonu navrženým podle našich doporučených pokynů. Podrobnosti najdete v tématu Doporučení pro pole mikrofonu.

Sady pro vývoj zařízení

Sada Speech SDK je navržená tak, aby fungovala s účelovými vývojovými sadami a různými konfiguracemi pole mikrofonu. Můžete například použít některou z těchto vývojových sad Azure.

Azure Percept DK obsahuje předkonfigurovaný zvukový procesor a lineární pole se čtyřmi mikrofony. Pomocí služeb Azure AI můžete používat hlasové příkazy, rozpoznávání klíčových slov a řeč daleko v terénu.
Azure Kinect DK je sada pro vývojáře prostorového computingu s pokročilými senzory AI, které poskytují sofistikované modely azure AI Vision a řeči. Jako zařízení typu all-in-one s několika režimy obsahuje hloubkový senzor, prostorové mikrofonní pole s videokamerou a senzor orientace.

Další kroky

Koncepty zpracování zvuku

Co jsou zařízení Speech?

Zpracování zvuku

Doporučení pro mikrofonní pole

Sady pro vývoj zařízení

Další kroky

Další materiály