套用篩選

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

將篩選器套用至資料集的指定資料行

類別: 資料轉換/篩選

注意

適用于僅限機器學習 Studio (傳統)

Azure Machine Learning 設計工具中提供類似的拖放模組。

模組概觀

本文 descries 如何使用機器學習 Studio (傳統) 中的「套用篩選」模組,藉由套用先前定義的篩選來轉換值的資料行。 篩選準則用於數位信號處理,以減少雜訊或反白顯示模式。 因此,您轉換的值一律是數值,而且通常代表某種類型的音訊或視覺信號。

提示

您是否正在尋找不同類型的篩選? Studio (傳統) 提供這些模組來取樣資料、取得資料子集、移除不正確的值,或建立測試和定型集:分割資料清除遺漏的資料、資料分割和樣本、套用SQL 轉換剪輯值。 如果您需要在從來源讀取資料時篩選資料,請參閱匯 入資料。 選項取決於來源類型。

在判斷哪一種篩選準則最適合您的資料來源之後,您可以指定參數,並使用 [套用 篩選 ] 來轉換資料集。 因為篩選的設計與套用篩選的程序是分開的,所以篩選可重複使用。 例如,如果您經常處理用於預測的資料,您可以設計數種移動平均篩選來定型和比較多個模型。 您也可以儲存篩選,以套用到其他實驗或不同的資料集。

如何設定套用篩選

  1. 將 [套用 篩選 ] 模組新增至您的實驗。 您可以在 [篩選] 分類中的 [資料轉換] 下找到 IIR 篩選模組。

  2. 針對右邊的輸入,將包含數值的資料集連接到一個輸入。

  3. 若為左側輸入,請連接現有的篩選。 您可以重複使用儲存的篩選器,也可以使用下列其中一個篩選模組來設定篩選: 臨界值篩選移動平均篩選、中 位數篩選IIR 篩選杉樹篩選使用者定義篩選

  4. 在 [套用篩選] 的 [屬性] 窗格中,按一下 [啟動資料行選取器],然後選擇應該套用篩選的資料行。

  5. 執行實驗,或以滑鼠右鍵按一下 [套用 篩選 ],然後按一下 [ 執行選取]。

結果

輸出只會包含所選資料行中的資料,並藉由套用指定的預先定義數學轉換進行轉換。

如果您想要查看資料集中的其他資料行,您可以使用 [ 加入資料行 ] 模組來合併原始和已篩選的資料集。

注意

原始資料行中的值尚未刪除或覆寫,而且在實驗中仍可供參考。 不過,篩選準則的輸出通常更適合用於模型化。

範例

如需如何在機器學習中使用篩選器的範例,請參閱 Azure AI 資源庫

  • 篩選:使用工程波形資料集,示範所有篩選類型。

技術說明

本節包含實作詳細資料、提示和常見問題集的解答。

  • [套用 篩選 ] 模組會將指定的篩選類型系結至選取的資料行。 如果您需要將不同類型的篩選套用至不同的資料行,您應該使用 資料集中的選取資料行 來隔離資料行,並在個別的工作流程中套用不同的篩選類型。 如需詳細資訊,請參閱 選取資料集中的資料行

  • 篩選不會通過未受篩選影響的資料行。 也就是說,「套用篩選」的輸出只包含已轉換的數值。 不過,您可以使用 [加入資料 ] 模組,將已轉換的值與源資料集聯結。

篩選期間

篩選期間取決於篩選類型,如下所示:

  • 針對有限脈衝響應 (FIR)、簡單移動平均和三角形移動平均篩選,篩選期間為有限

  • 針對無限脈衝響應 (IIR)、指數移動平均和累計移動平均篩選,篩選期間為無限

  • 針對臨界值篩選,篩選期間一律為 1

  • 針對中位數篩選,不論篩選期間為何,輸入訊號中的 NaN 和遺漏值不會在輸出中產生新的 NaN。

遺漏值

本章節描述當遇到遺漏值時,依篩選類型的行為。 一般情況下,當篩選在輸入資料集中遇到 NaN 或遺漏值時,輸出資料集會根據篩選期間,以 Nan 作為下一個樣本數的期盼。 這會有下列結果:

  • 杉樹、簡單的移動平均或三角形移動平均篩選準則有一段有限的時間。 如此一來,任何遺漏值後面都會加上等於篩選順序減一的 Nan 數目。

  • IIR、指數移動平均或累計移動平均篩選準則有無限期。 如此一來,在遇到第一個遺漏值之後,Nan 將會無限期地持續傳播。

  • 在閾值篩選準則中,閾值篩選準則的期間為1。 如此一來,就不會傳播遺漏值和 Nan。

  • 在中位數篩選中,不論篩選期間,輸入資料集中發現的 NaN 和遺漏值不會在輸出中產生新的 NaN。

預期的輸入

名稱 類型 描述
Filter IFilter 介面 濾波器實作
資料集 資料表 輸入資料集

如需 Studio (傳統) 模組特定的錯誤清單,請參閱機器學習錯誤碼

如需 API 例外狀況的清單,請參閱機器學習 REST API 錯誤碼

模組參數

名稱 範圍 類型 預設 描述
資料行集 任意 ColumnSelection NumericAll 選取要篩選的資料行

輸出

名稱 類型 說明
結果資料集 資料表 輸出資料集

另請參閱

Filter
A-Z 模組清單