Adatátalakítás – Szűrő

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a cikk azt ismerteti, hogyan alakíthatja át a digitális adatokat a Machine Learning Studio (klasszikus) szűrőmoduljaival. A Machine Learning Studio (klasszikus) ezen eszközcsoportjának moduljai a digitális jelfeldolgozási technológiához fejlesztett szűrőkön alapulnak.

Megjegyzés

Csak a következőre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzási modulok érhetők el Azure Machine Learning tervezőben.

A szűrőket általában az adatfeldolgozási vagy az előfeldolgozási szakaszban lévő adatokra alkalmazza a rendszer. A szűrők javítják a gépi tanuláshoz használt jel egyértelműségét. Például a Machine Learning Studio (klasszikus) szűrőmoduljait használhatja az alábbi feldolgozási feladatokhoz:

  • A beszédfelismeréshez használt hullámformák eltávolítása.
  • Trendek észlelése vagy szezonális hatások eltávolítása zajos értékesítésekben vagy gazdasági adatokban.
  • Minták vagy összetevők elemzése telemetriai jelekben.

Ezek a modulok a szűrők egyszerű konfigurálását biztosítják jól kutatott algoritmusok használatával a hullámformaadatok matematikai átalakításához. Egyéni szűrőt is létrehozhat, ha már meghatározta az adatokra alkalmazandó megfelelő együtthatókat.

Ha olyan feladatokat kell elvégeznie, mint például az adatok soronkénti kizárása egy adathalmazból, hiányzó értékek eltávolítása vagy egy adathalmaz méretének csökkentése, használja inkább az alábbi modulokat:

  • Hiányzó adatok törlése: Távolítsa el a hiányzó értékeket, vagy cserélje le a hiányzó értékeket helyőrzőkre.
  • Particionálás és minta: Ossza el vagy szűrje az adathalmazt olyan feltételekkel, mint a dátumtartomány, egy adott érték vagy reguláris kifejezés.
  • Értékek kivágása: Állítson be értéktartományt, és csak az adott tartományon belüli értékeket tartsa meg.

Szűrők a digitális jelfeldolgozásban

Ahogyan egy szűrőt csatolhat egy kamerához a világítás kompenzálásához vagy speciális effektusok létrehozásához, alkalmazhat szűrőt a gépi tanuláshoz használt adatokra. A szűrők segíthetnek a jel érthetőségének javításában, az érdekes jellemzők rögzítésében vagy a zaj csökkentésében.

Az ideális szűrő kiküszöböli az összes zajt, és egyenletesen érzékeny a kívánt jelre. Egy elég jó szűrő megtervezése azonban számos iterációt vagy technikakombinációt igénybe vehet. Ha sikeresen megtervezett egy hatékony szűrőt, érdemes lehet menteni a szűrőt, hogy újra felhasználhassa az új adatok átalakításakor.

A szűrés általában a hullámforma-elemzés alapelvein alapul. Szűrő tervezésekor a jelek egyes részeinek elnyomására vagy felerősítésére, a mögöttes trendek felfedésére, a zaj és az interferencia csökkentésére, illetve az egyébként nem érzékelhető adatértékek azonosítására kell keresni.

Különböző technikákat alkalmaznak a tényleges adatértékeket létrehozó egyedi trendek vagy hullámforma-összetevők felbontására. Az értékek sorozata trigonometriai függvényekkel elemezhető az egyes hullámformák azonosításához és elkülönítéséhez. (Ez igaz, akár ökonometriai sorozatról, akár hangjelek összetett frekvenciáiról van szó.) A szűrők ezután alkalmazhatók ezekre a hullámformákra a zajok kiküszöbölése, egyes hullámok felerősítése vagy a megcélzott összetevők eltávolítása érdekében.

Ha a szűrés zajos sorozatra van alkalmazva a különböző összetevők elkülönítése érdekében, megadhatja, hogy mely frekvenciákat távolítsa el vagy erősítse meg a használni kívánt frekvenciasáv megadásával.

Digitális szűrők a Machine Learning Studióban (klasszikus)

A Machine Learning Studio (klasszikus) a következő szűrőket támogatja:

  • A hullámforma felbontásán alapuló szűrők. Ilyenek például a véges impulzusválasz (FIR) és a végtelen impulzus válasz (IIR) szűrők. Ezek a szűrők úgy működnek, hogy bizonyos összetevőket eltávolítanak egy teljes sorozatból. Ezután megtekintheti és megvizsgálhatja az egyszerűsített hullámformát.
  • Mozgóátlagokon vagy mediánértékeken alapuló szűrők. Ezek a szűrők az időablakok átlagolásával kisimítják az adatsorok variációit. Az ablakok rögzíthetők vagy csúsztathatók, és különböző alakzatokkal rendelkezhetnek. Egy háromszög alakú ablak például az aktuális adatpontnál csúcsosodik (az aktuális értéket erősebben súlyja), és az adatpont előtt és után leszökik (az értékeket kevésbé megelőző és követő súlyok).
  • Felhasználó által definiált vagy egyéni szűrők. Ha már ismeri az adatsorokra alkalmazni kívánt átalakításokat, létrehozhat egy felhasználó által definiált szűrőt. Megadhatja az adatsor átalakításához alkalmazott numerikus együtthatókat. Az egyéni szűrők emulálhatnak egy FIR- vagy IIR-szűrőt. Egyéni szűrő esetén azonban jobban szabályozhatja az adatsor minden egyes pontján alkalmazandó értékeket.

Terminológia szűrése

Az alábbi lista a szűrők paramétereiben és tulajdonságaiban használt kifejezések egyszerű definícióit tartalmazza:

  • Passband: Az a frekvenciatartomány, amely csillapítás vagy gyengülés nélkül képes áthaladni a szűrőn.
  • Stopband: A megadott korlátok közötti frekvenciatartomány, amelyen keresztül a jelek nem haladnak át. A leállítási frekvenciák beállításával határozhatja meg a leállítási sávot.
  • Magas átengedés: Csak a magas frekvenciákon haladjon át.
  • Alacsony átengedés: Csak a megadott kivágási érték alatti gyakoriságokat fogadja el.
  • Sarok: Meghatározza a stopband és a passband frekvenciák közötti határt. Általában lehetősége van eldönteni, hogy a sarok szerepel-e a sávban, vagy ki van-e zárva a sávból. Az elsőrendű szűrő fokozatos csillapítást okoz a sarokfrekvenciáig. Ezután a szűrő exponenciális csillapítást okoz. A magasabb rendű szűrők (például Butterworth és Chebyshev szűrők) meredekebbek a sarokfrekvenciák után. A magasabb rendű szűrők sokkal gyorsabban és teljesebben csillapítják a stopband értékeit.
  • Sávszűrő (más néven sávelvetési szűrő vagy notch szűrő): Csak egy stoppánttal rendelkezik. A leállítási sávot két frekvenciával határozhatja meg: a magas levágási gyakorisággal és az alacsony levágási gyakorisággal. A bandpass szűrő általában két stopbandot tartalmaz: egyet a kívánt összetevő mindkét oldalán.
  • Hullámos: Egy kis, nemkívánatos változat, amely rendszeresen előfordul. A Machine Learning megadhatja az IIR-szűrőterv paramétereinek részeként tolerálandó hullámokat.

Tipp

További információra van szüksége? Ha még nem ismerkedik a digitális jelfeldolgozássel, olvassa el a Bevezetés a digitális jelfeldolgozásba című témakört. A webhely definíciókat és hasznos vizuális segédleteket biztosít, amelyek az alapvető terminológiát és fogalmakat ismertetik.

Modulok listája

Az Adatátalakítás – Szűrő kategória a következő modulokat tartalmazza:

Lásd még