Share via


Mikrofonsorra vonatkozó javaslatok

Ebből a cikkből megtudhatja, hogyan tervezhet testre szabott mikrofontömböt a Speech SDK-val való használatra. Ez leginkább akkor lényeges, ha a beszédmegoldások hardverét választja, adja meg vagy készíti el.

A Speech SDK az irányelveknek megfelelően tervezett mikrofontömbökkel működik a legjobban, beleértve a mikrofongeometriát, az összetevők kiválasztását és az architektúrát.

Mikrofongeometria

A Microsoft Audio Stackhez az alábbi tömbgeometriák használata ajánlott. A hangforrások helye és a környezeti zaj elutasítása nagyobb számú mikrofonnal javul, amelyek függenek az adott alkalmazásoktól, a felhasználói forgatókönyvektől és az eszköz formai tényezőjétől.

Tömb Mikrofonok Geometria
Körkörös - 7 mikrofon 7 mic circular array 6 Külső, 1 középen, Radius = 42,5 mm, Egyenletesen elosztott
Körkörös – 4 mikrofon 4 mic circular array 3 Külső, 1 közép, sugár = 42,5 mm, egyenletesen elosztott
Lineáris – 4 mikrofon 4 mic linear array Hossz = 120 mm, térköz = 40 mm
Lineáris – 2 mikrofon 2 mic linear array Térköz = 40 mm

A mikrofoncsatornát 0-tól növekvő sorrendbe kell rendezni az egyes tömbökhöz korábban ismertetett számozás szerint. A Microsoft Audio Stack egy másik hanglejátszási referenciastreamet igényel az echo-megszakítás végrehajtásához.

Összetevő kiválasztása

A mikrofon összetevőit úgy kell kiválasztani, hogy pontosan reprodukálják a zajtól és torzítástól mentes jelet.

A mikrofonok kiválasztásakor ajánlott tulajdonságok a következők:

Paraméter Ajánlott
SNR >= 65 dB (1 kHz jel 94 dBSPL, A-súlyozott zaj)
Amplitúdó egyeztetése ± 1 dB @ 1 kHz
Fázisegyezés ± 2° @ 1 kHz
Akusztikai túlterhelési pont (AOP) >= 120 dBSPL (THD = 10%)
Bitsebesség Minimum 24 bites
Mintavételezési frekvencia Minimum 16 kHz*
Gyakorisági válasz ± 3 dB, 200-8000 Hz lebegő maszk*
Megbízhatóság Tárolási hőmérséklet -40°C és 70°C között
Működési hőmérséklet -20°C és 55°C között

*Magasabb mintavételi sebességre vagy "szélesebb" frekvenciatartományokra lehet szükség a kiváló minőségű kommunikációs (VoIP) alkalmazásokhoz

A jó alkatrész-kiválasztást jó elektroakusztikus integrációval kell párosítani, hogy elkerülhető legyen a felhasznált összetevők teljesítményének romlása. Az egyedi használati esetek további követelményeket (például működési hőmérsékleti tartományokat) is szükségessé válhatnak.

Mikrofontömb integrációja

A mikrofontömb teljesítménye az eszközbe való integráláskor eltér az összetevő specifikációjától. Fontos, hogy a mikrofonok megfelelően illeszkedjenek az integráció után. Ezért a rögzített nyereség vagy EQ után mért eszközteljesítménynek meg kell felelnie az alábbi javaslatoknak:

Paraméter Ajánlott
SNR >= 64 dB (1 kHz jel 94 dBSPL, A-súlyozott zaj)
Kimeneti érzékenység -26 dBFS/Pa @ 1 kHz (ajánlott)
Amplitúdó egyeztetése ± 2 dB, 200-8000 Hz
THD%* ≤ 1%, 200-8000 Hz, 94 dBSPL
Gyakorisági válasz ± 6 dB, 200-12000 Hz lebegő maszk**

**A THD méréséhez alacsony torzítású hangszóró szükséges (például Neumann KH120)

**"Szélesebb" frekvenciatartományokra lehet szükség a kiváló minőségű kommunikációs (VoIP) alkalmazásokhoz

Előadói integrációs javaslatok

Mivel a beszélőket tartalmazó beszédfelismerési eszközök esetében szükség van az echo-lemondásra, további javaslatok érhetők el a beszélő kiválasztásához és integrációjához.

Paraméter Ajánlott
Linearitási szempontok Nincs nemlineáris feldolgozás a beszélőhivatkozás után, ellenkező esetben hardveralapú visszacsatolási referenciastreamre van szükség
Hangszóró visszacsatolása WASAPI,privát API-k, egyéni ALSA beépülő modul (Linux) vagy belső vezérlőprogram-csatornán keresztül
THD% Harmadik octave sávok minimális ötödik sorrend, 70 dBA lejátszás @ 0,8 m ≤ 6,3%, 315-500 Hz ≤ 5%, 630-5000 Hz
Echo-csatlakozó mikrofonokhoz > -10 dB TCLw ITU-T G.122 B.4. melléklet szerinti módszerrel, mikrofonszintre normalizálva
TCLw = TCLwmeasured + (Mért szint – Célkimeneti érzékenység)
TCLw = TCLwmeasured + (Mért szint – (-26))

Integrációs tervezési architektúra

A mikrofonok eszközökbe való integrálása esetén az architektúra alábbi irányelvei szükségesek:

Paraméter Ajánlás
Mikrofonportok hasonlósága A tömbben minden mikrofonport azonos hosszúságú
Mikrofonport méretei Portméret Ø0,8-1,0 mm. Port hossza / port átmérője < 2
Mikrofonzárolás A tömítő tömítések egységesen implementálva a halmozódásban. 70%-os tömörítési arányt javasol > a hab tömítésekhez
Mikrofon megbízhatósága A mesht a por és a bemenő forgalom megelőzésére kell használni (a PCB között az alsó portos mikrofonok és a tömítő tömítés/felső fedél között)
Mikrofonelkülönítés Gumi tömítések és rezgések leválasztása a szerkezeten keresztül, különösen az integrált hangszórók miatt a rezgési útvonalak elkülönítéséhez
Mintavételezési óra Az eszköz hangjának mentesnek kell lennie az alacsony eltolódású jitter- és lemorzsolódási hibáktól
Rekordképesség Az eszköznek képesnek kell lennie az egyes csatornák nyers streamjeinek egyidejű rögzítésére
USB Minden USB-hangbemeneti eszköznek be kell állítania a leírókat az USB audioeszközök Rev3 Specifikációja szerint
Mikrofongeometria Az illesztőprogramoknak megfelelően kell implementálniuk a mikrofontömb geometriai leíróit
Felfedező Az eszközöknek nem szabad felderíthetetlen vagy ellenőrizhetetlen hardverrel, belső vezérlőprogrammal vagy külső szoftveralapú, nemlineáris hangfeldolgozási algoritmusokkal rendelkezniük az eszközről vagy az eszközről
Rögzítési formátum A rögzítési formátumoknak legalább 16 kHz mintavételezési sebességet kell használniuk, és ajánlott 24 bites mélységet

Az elektromos architektúra szempontjai

Adott esetben tömbök csatlakoztathatók USB-gazdagéphez (például a Microsoft Audio Stacket (MAS)futtató SoC-hoz), valamint a Speech-szolgáltatásokhoz vagy más alkalmazásokhoz.

Az olyan hardverösszetevőknek, mint a PDM-to-TDM átalakítás, biztosítaniuk kell, hogy a mikrofonok dinamikus tartománya és SNR-je megmaradjon az újramintavevőkben.

A nagy sebességű USB Audio Class 2.0-t minden hang-MCU-n belül támogatni kell annak érdekében, hogy a szükséges sávszélességet akár hét csatornához is biztosítsa magasabb mintasebesség és bitmélység mellett.

Következő lépések