Använd filter

Tillämpar ett filter på angivna kolumner i en datauppsättning

Kategori: Datatransformering/filter

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Modulöversikt

Den här artikeln beskriver hur du använder modulen Tillämpa filter i Azure Machine Learning Studio (klassisk) för att transformera en kolumn med värden genom att använda ett tidigare definierat filter. Filter används vid digital signalbearbetning för att minska bruset eller markera ett mönster. Därför är de värden som du transformerar alltid numeriska och representerar vanligtvis någon typ av ljud- eller visuell signal.

Tips

Letar du efter en annan typ av filter? Studio (klassisk) tillhandahåller dessa moduler för samplingsdata, hämtar en delmängd data, tar bort dåliga värden eller skapar test- och träningsuppsättningar: Dela data,Rensa saknade data,Partition och Exempel, Tillämpa SQL-transformering, Clip-värden. Om du behöver filtrera data när du läser dem från en källa kan du läsa Importera data. Alternativen beror på källtypen.

När du har avgör vilken typ av filter som passar bäst för din datakälla anger du parametrarna och använder Tillämpa filter för att transformera datauppsättningen. Eftersom filterdesignen är separat från processen för att tillämpa ett filter kan filter återanvändas. Om du till exempel ofta arbetar med data som används för prognostiserade data kan du utforma flera typer av glidande medelvärdesfilter för att träna och jämföra flera modeller. Du kan också spara filtret för att tillämpa på andra experiment eller på olika datauppsättningar.

Så här konfigurerar du Tillämpa filter

  1. Lägg till modulen Tillämpa filter i experimentet. Du hittar IIR-filtermodulen under Datatransformering i kategorin Filter.

  2. Till höger indata ansluter du en datauppsättning som innehåller numeriska värden till en indata.

  3. Anslut ett befintligt filter till vänster indata. Du kan använda ett sparat filter igen eller konfigurera ett filter med någon av följande filtermoduler: Tröskelvärdesfilter,Glidande medelvärdesfilter, Medianfilter, IIR-filter, FIR-filter, Användardefinierat filter.

  4. I fönstret Egenskaper i Använd filter klickar du på Starta kolumnväljaren och väljer de kolumner som filtret ska tillämpas på.

  5. Kör experimentet eller högerklicka på Använd filter och klickaKör valt.

Resultat

Utdata innehåller endast data i de valda kolumnerna, transformerade genom att tillämpa den angivna fördefinierade matematiska transformeringen.

Om du vill se andra kolumner i datauppsättningen kan du använda modulen Lägg till kolumner för att slå samman de ursprungliga och filtrerade datauppsättningarna.

Anteckning

Värdena i den ursprungliga kolumnen har inte tagits bort eller skrivits över och är fortfarande tillgängliga i experimentet som referens. Utdata från filtret är dock vanligtvis mer användbara för modellering.

Exempel

Exempel på hur filter används i maskininlärning finns i Azure AI Gallery:

  • Filter:Visar alla filtertyper med hjälp av en utformad vågformsdatamängd.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

  • Modulen Tillämpa filter binder den angivna typen av filter till de valda kolumnerna. Om du behöver tillämpa olika typer av filter på olika kolumner bör du använda Välj kolumner i datauppsättning för att isolera kolumnerna och tillämpa olika filtertyper i separata arbetsflöden. Mer information finns i Välj kolumner i datauppsättningen.

  • Filtren passerar inte datakolumner som inte påverkas av filtret. Det innebär att utdata från Tillämpa filter endast innehåller de transformerade numeriska värdena. Du kan dock använda modulen Lägg till kolumner för att koppla transformerade värden till källdatauppsättningen.

Filterperioder

Filterperioden bestäms delvis av filtertypen enligt följande:

  • Filterperioden är begränsad för FIR (finite styrd respons), enkelt glidande medelvärde och triangular glidande medelvärdesfilter.

  • För IIR (Infinite Infinite Response), exponentiellt glidande medelvärde och kumulativa glidande medelvärdesfilter är filterperioden oändlig.

  • För tröskelvärdesfilter är filterperioden alltid 1.

  • För medianfilter skapar inte NaN-värden och saknade värden i indatasignalen nya NaN i utdata, oavsett filterperiod.

Saknade värden

I det här avsnittet beskrivs beteendet när saknade värden påträffas, efter filtertyp. När ett filter stöter på ett NaN eller ett värde som saknas i indatauppsättningen blir utdatauppsättningen i allmänhet bortskämd med NaN för några nästa antal exempel, beroende på filterperioden. Detta får följande konsekvenser:

  • FILTER för FIR, enkelt glidande medelvärde eller triangular glidande medelvärde har en begränsad period. Därför följs alla saknade värden av ett antal NaN som är lika med filterordningen minus ett.

  • Filtren IIR, exponentiellt glidande medelvärde eller kumulativt glidande medelvärde har en oändlig period. När det första saknade värdet har påträffats fortsätter därför NaN att spridas på obestämd tid.

  • I ett tröskelvärdesfilter är perioden för ett tröskelvärdesfilter 1. Det innebär att saknade värden och NaN inte sprids.

  • För medianfilter NaN och saknade värden som påträffas i indatauppsättningen producerar inte nya NaN i utdata, oavsett filterperiod.

Förväntade indata

Namn Typ Description
Filtrera IFilter-gränssnitt Filterimplementering
Datamängd Datatabell Indatauppsättning

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Modulparametrar

Name Intervall Typ Standardvärde Description
Kolumnuppsättning Valfri ColumnSelection NumericAll Välj de kolumner som ska filtreras

Utdata

Namn Typ Description
Resultatdatauppsättning Datatabell Utdatauppsättning

Se även

Filter
A-Z-modullista