Transformace dat – filtr

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Tento článek popisuje, jak můžete pomocí modulů filtru v nástroji Machine Learning Studio (classic) transformovat digitální data. Moduly v této skupině nástrojů pro Machine Learning Studio (classic) jsou založené na filtrech vyvinutých pro technologii digitálního zpracování signálu.

Poznámka

Platí jenom pro: Machine Learning Studio (jenom Classic)

Podobné moduly pro přetažení jsou k dispozici v návrháři Azure Machine Learning.

Filtry se obvykle použijí na data ve fázi zpracování dat nebo ve fázi předběžného zpracování. Filtry zlepšují přehlednost signálu, který se používá pro strojové učení. Moduly filtru můžete například použít v nástroji Machine Learning Studio (classic) pro tyto úlohy zpracování:

  • Vyčistěte vlnové tvary, které se používají k rozpoznávání řeči.
  • Detekujte trendy nebo odstraňte sezónní účinky v hlučných prodejních nebo ekonomických datech.
  • Analýza vzorů nebo artefaktů v signálech telemetrie

Tyto moduly poskytují snadnou konfiguraci filtrů pomocí dobře prozkoumáných algoritmů pro matematickou transformaci dat vlnových vzorců. Vlastní filtr můžete vytvořit také v případě, že jste již určili správné koeficienty, které se mají na vaše data použít.

Pokud potřebujete provádět úlohy, jako je vyloučení dat z datové sady na řádku po řádku, odebrání chybějících hodnot nebo zmenšení velikosti datové sady, použijte místo toho tyto moduly:

  • Vyčištění chybějících dat: Odeberte chybějící hodnoty nebo nahraďte chybějící hodnoty zástupnými symboly.
  • Oddíl a ukázka: Rozdělte nebo vyfiltrujte datovou sadu pomocí kritérií, jako je rozsah kalendářních dat, konkrétní hodnota nebo regulární výrazy.
  • Hodnoty klipů: Nastavte rozsah hodnot a ponechejte pouze hodnoty v daném rozsahu.

Filtry při zpracování digitálních signálů

Stejně jako můžete k fotoaparátu připojit filtr, který kompenzuje osvětlení nebo vytváří speciální efekty, můžete použít filtr na data, která používáte pro strojové učení. Filtry můžou pomoct zlepšit přehlednost signálu, zachytit zajímavé charakteristiky nebo snížit šum.

Ideální filtr by eliminoval veškerý šum a měl jednotnou citlivost pro požadovaný signál. Návrh dokonce i docela dobrého filtru může vyžadovat mnoho iterací nebo kombinací technik. Pokud se vám podaří navrhnout efektivní filtr, zvažte uložení filtru, abyste ho mohli znovu použít při transformaci nových dat.

Obecně platí, že filtrování je založené na principech analýzy vlnové závislosti. Při návrhu filtru hledáte způsoby, jak potlačit nebo rozšířit části signálu, zpřístupnit podkladové trendy, snížit šum a interferenci nebo identifikovat datové hodnoty, které by jinak nemusely být vnímané.

Různé techniky se použijí k dekompose jednotlivých trendů nebo součástí vlnové řady, které vytvářejí skutečné hodnoty dat. Řadu hodnot lze analyzovat pomocí trigonometrických funkcí k identifikaci a izolaci jednotlivých vlnových vzorců. (To platí bez ohledu na to, jestli se jedná o ekometrické řady nebo složené frekvence zvukových signálů.) Filtry se pak dají na tyto vlnové tvary použít k odstranění šumu, zesílení některých vln nebo odebrání cílových komponent.

Při filtrování se použije na hlučnou řadu k izolaci různých komponent, můžete určit, které frekvence se mají odebrat nebo posílit zadáním pásma frekvencí, se kterými se mají pracovat.

Digitální filtry v Machine Learning Studiu (classic)

V Machine Learning Studiu (classic) jsou podporované následující typy filtrů:

  • Filtry založené na rozkladu vlnových tvarů. Mezi příklady patří konečný impulsní odpověď (FIR) a nekonečná impulsní odpověď (IIR). Tyto filtry fungují odebráním konkrétních komponent z celkové řady. Potom můžete zobrazit a prozkoumat zjednodušený tvar vlny.
  • Filtry založené na klouzavých průměrech nebo mediánových hodnotách Tyto filtry vyhladí variace v datové řadě průměrováním v průběhu času. Okna mohou být pevná nebo posuvná a mohou mít různé obrazce. Například trojúhelníkové okno vrcholí v aktuálním datovém bodě (váhy aktuální hodnoty silnější) a za datovým bodem a za datovým bodem (váhy předcházející a následující hodnoty jsou méně silné).
  • Uživatelem definované nebo vlastní filtry Pokud už znáte transformace, které se mají použít u datové řady, můžete vytvořit filtr definovaný uživatelem. Zadáte číselné koeficienty, které se použijí k transformaci datové řady. Vlastní filtr může emulovat filtr FIR nebo IIR. U vlastního filtru ale máte větší kontrolu nad hodnotami, které se mají použít v každém bodě řady.

Terminologie filtru

Následující seznam obsahuje jednoduché definice termínů, které se používají v parametrech a vlastnostech filtrů:

  • Passband: Rozsah frekvencí, které mohou procházet filtrem, aniž by byly ztlumené nebo oslabené.
  • Zarážka: Rozsah frekvencí mezi zadanými limity, kterými nejsou signály předány. Zarážku definujete nastavením odříznutých frekvencí.
  • Vysoká průchozí: Nechte pouze vysokou frekvenci.
  • Nízký průchod: Přijměte pouze frekvence pod zadanou hodnotou odříznutí.
  • Roh: Definuje hranici mezi frekvencemi stopbandu a passbandu. Obvykle máte možnost rozhodnout se, jestli je roh součástí nebo vyloučený z kapely. Filtr prvního pořadí způsobí postupné ztlumení až do frekvence rohu. Potom filtr způsobí exponenciální útlum. Filtry vyšších objednávek (například Filtry Butterworth a Chebyshev) mají strmější sklony po frekvenci rohu. Filtry vyšších objednávek ztlumí hodnoty v zarážce mnohem rychleji a plněji.
  • Filtr pásem ( označovaný také jako filtr pro odmítnutí pásma nebo zářez ): Má pouze jednu zarážku. Zarážku definujete tak, že zadáte dvě frekvence: vysokou odříznutou frekvenci a nízkou frekvenci odříznutí. Filtr bandpassu má obvykle dvě zarážky: jednu na obou stranách požadované komponenty.
  • Ripple: Malá nežádoucí variace, která se pravidelně vyskytuje. V Machine Learning můžete určit množství ripple, které se má tolerovat jako součást parametrů v návrhu filtru IIR.

Tip

Potřebujete víc informací? Pokud s digitálním zpracováním signálu začínáte, přečtěte si téma Úvod k digitálnímu zpracování signálu. Web poskytuje definice a užitečné vizuální pomůcky, které vysvětlují základní terminologii a koncepty.

Seznam modulů

Do kategorie Transformace dat – filtr jsou zahrnuty následující moduly:

Viz také