Mikrofonsorra vonatkozó javaslatok
Ebből a cikkből megtudhatja, hogyan tervezhet testre szabott mikrofontömböt a Speech SDK-val való használatra. Ez leginkább akkor lényeges, ha a beszédmegoldások hardverét választja, adja meg vagy készíti el.
A Speech SDK az irányelveknek megfelelően tervezett mikrofontömbökkel működik a legjobban, beleértve a mikrofongeometriát, az összetevők kiválasztását és az architektúrát.
Mikrofongeometria
A Microsoft Audio Stackhez az alábbi tömbgeometriák használata ajánlott. A hangforrások helye és a környezeti zaj elutasítása nagyobb számú mikrofonnal javul, amelyek függenek az adott alkalmazásoktól, a felhasználói forgatókönyvektől és az eszköz formai tényezőjétől.
Tömb | Mikrofonok | Geometria |
---|---|---|
Körkörös - 7 mikrofon | 6 Külső, 1 középen, Radius = 42,5 mm, Egyenletesen elosztott | |
Körkörös – 4 mikrofon | 3 Külső, 1 közép, sugár = 42,5 mm, egyenletesen elosztott | |
Lineáris – 4 mikrofon | Hossz = 120 mm, térköz = 40 mm | |
Lineáris – 2 mikrofon | Térköz = 40 mm |
A mikrofoncsatornát 0-tól növekvő sorrendbe kell rendezni az egyes tömbökhöz korábban ismertetett számozás szerint. A Microsoft Audio Stack egy másik hanglejátszási referenciastreamet igényel az echo-megszakítás végrehajtásához.
Összetevő kiválasztása
A mikrofon összetevőit úgy kell kiválasztani, hogy pontosan reprodukálják a zajtól és torzítástól mentes jelet.
A mikrofonok kiválasztásakor ajánlott tulajdonságok a következők:
Paraméter | Ajánlott |
---|---|
SNR | >= 65 dB (1 kHz jel 94 dBSPL, A-súlyozott zaj) |
Amplitúdó egyeztetése | ± 1 dB @ 1 kHz |
Fázisegyezés | ± 2° @ 1 kHz |
Akusztikai túlterhelési pont (AOP) | >= 120 dBSPL (THD = 10%) |
Bitsebesség | Minimum 24 bites |
Mintavételezési frekvencia | Minimum 16 kHz* |
Gyakorisági válasz | ± 3 dB, 200-8000 Hz lebegő maszk* |
Megbízhatóság | Tárolási hőmérséklet -40°C és 70°C között Működési hőmérséklet -20°C és 55°C között |
*Magasabb mintavételi sebességre vagy "szélesebb" frekvenciatartományokra lehet szükség a kiváló minőségű kommunikációs (VoIP) alkalmazásokhoz
A jó alkatrész-kiválasztást jó elektroakusztikus integrációval kell párosítani, hogy elkerülhető legyen a felhasznált összetevők teljesítményének romlása. Az egyedi használati esetek további követelményeket (például működési hőmérsékleti tartományokat) is szükségessé válhatnak.
Mikrofontömb integrációja
A mikrofontömb teljesítménye az eszközbe való integráláskor eltér az összetevő specifikációjától. Fontos, hogy a mikrofonok megfelelően illeszkedjenek az integráció után. Ezért a rögzített nyereség vagy EQ után mért eszközteljesítménynek meg kell felelnie az alábbi javaslatoknak:
Paraméter | Ajánlott |
---|---|
SNR | >= 64 dB (1 kHz jel 94 dBSPL, A-súlyozott zaj) |
Kimeneti érzékenység | -26 dBFS/Pa @ 1 kHz (ajánlott) |
Amplitúdó egyeztetése | ± 2 dB, 200-8000 Hz |
THD%* | ≤ 1%, 200-8000 Hz, 94 dBSPL |
Gyakorisági válasz | ± 6 dB, 200-12000 Hz lebegő maszk** |
**A THD méréséhez alacsony torzítású hangszóró szükséges (például Neumann KH120)
**"Szélesebb" frekvenciatartományokra lehet szükség a kiváló minőségű kommunikációs (VoIP) alkalmazásokhoz
Előadói integrációs javaslatok
Mivel a beszélőket tartalmazó beszédfelismerési eszközök esetében szükség van az echo-lemondásra, további javaslatok érhetők el a beszélő kiválasztásához és integrációjához.
Paraméter | Ajánlott |
---|---|
Linearitási szempontok | Nincs nemlineáris feldolgozás a beszélőhivatkozás után, ellenkező esetben hardveralapú visszacsatolási referenciastreamre van szükség |
Hangszóró visszacsatolása | WASAPI,privát API-k, egyéni ALSA beépülő modul (Linux) vagy belső vezérlőprogram-csatornán keresztül |
THD% | Harmadik octave sávok minimális ötödik sorrend, 70 dBA lejátszás @ 0,8 m ≤ 6,3%, 315-500 Hz ≤ 5%, 630-5000 Hz |
Echo-csatlakozó mikrofonokhoz | > -10 dB TCLw ITU-T G.122 B.4. melléklet szerinti módszerrel, mikrofonszintre normalizálva TCLw = TCLwmeasured + (Mért szint – Célkimeneti érzékenység) TCLw = TCLwmeasured + (Mért szint – (-26)) |
Integrációs tervezési architektúra
A mikrofonok eszközökbe való integrálása esetén az architektúra alábbi irányelvei szükségesek:
Paraméter | Ajánlás |
---|---|
Mikrofonportok hasonlósága | A tömbben minden mikrofonport azonos hosszúságú |
Mikrofonport méretei | Portméret Ø0,8-1,0 mm. Port hossza / port átmérője < 2 |
Mikrofonzárolás | A tömítő tömítések egységesen implementálva a halmozódásban. 70%-os tömörítési arányt javasol > a hab tömítésekhez |
Mikrofon megbízhatósága | A mesht a por és a bemenő forgalom megelőzésére kell használni (a PCB között az alsó portos mikrofonok és a tömítő tömítés/felső fedél között) |
Mikrofonelkülönítés | Gumi tömítések és rezgések leválasztása a szerkezeten keresztül, különösen az integrált hangszórók miatt a rezgési útvonalak elkülönítéséhez |
Mintavételezési óra | Az eszköz hangjának mentesnek kell lennie az alacsony eltolódású jitter- és lemorzsolódási hibáktól |
Rekordképesség | Az eszköznek képesnek kell lennie az egyes csatornák nyers streamjeinek egyidejű rögzítésére |
USB | Minden USB-hangbemeneti eszköznek be kell állítania a leírókat az USB audioeszközök Rev3 Specifikációja szerint |
Mikrofongeometria | Az illesztőprogramoknak megfelelően kell implementálniuk a mikrofontömb geometriai leíróit |
Felfedező | Az eszközöknek nem szabad felderíthetetlen vagy ellenőrizhetetlen hardverrel, belső vezérlőprogrammal vagy külső szoftveralapú, nemlineáris hangfeldolgozási algoritmusokkal rendelkezniük az eszközről vagy az eszközről |
Rögzítési formátum | A rögzítési formátumoknak legalább 16 kHz mintavételezési sebességet kell használniuk, és ajánlott 24 bites mélységet |
Az elektromos architektúra szempontjai
Adott esetben tömbök csatlakoztathatók USB-gazdagéphez (például a Microsoft Audio Stacket (MAS)futtató SoC-hoz), valamint a Speech-szolgáltatásokhoz vagy más alkalmazásokhoz.
Az olyan hardverösszetevőknek, mint a PDM-to-TDM átalakítás, biztosítaniuk kell, hogy a mikrofonok dinamikus tartománya és SNR-je megmaradjon az újramintavevőkben.
A nagy sebességű USB Audio Class 2.0-t minden hang-MCU-n belül támogatni kell annak érdekében, hogy a szükséges sávszélességet akár hét csatornához is biztosítsa magasabb mintasebesség és bitmélység mellett.