資料轉換

本文列出 Azure Machine Learning Studio (傳統) 的資料轉換所提供的模組。 針對機器學習, 資料轉換 需要一些非常一般的工作,例如聯結資料集或變更資料行名稱。 但是,它也包含機器學習專用的許多工作,例如正規化、分類收納和群組,以及遺漏值的推斷。

注意

適用于 : Machine Learning Studio (傳統)

此內容僅適用于 Studio (傳統) 。 Azure Machine Learning 設計工具中已新增類似的拖放模組。 若要深入瞭解 這兩個版本,請參閱這篇文章

重要

您在 Machine Learning Studio (傳統) 中使用的資料,在您將其匯入 Machine Learning Studio (傳統) 之前,通常預期會是「整齊」。 例如,資料準備可能包括確保資料使用正確的編碼,並檢查資料是否有一致的架構。

您可以使用 Azure Machine Learning Workbench 來轉換及準備所有種類的資料。 如需範例,請參閱 Machine Learning 工作臺中的「依範例的資料轉換」。

資料轉換的模組會分組為下列以工作為基礎的類別:

  • 建立數位信號處理的篩選:數位信號篩選器可以套用至數值資料,以支援諸如影像辨識、語音辨識及波形分析等機器學習工作。
  • 產生和使用以計數為基礎的功能:以計數為基礎的特徵化模組可協助您開發精簡功能,以在機器學習中使用。
  • 一般資料操作和準備:合併資料集、清除遺漏值、群組和摘要資料、變更資料行名稱和資料類型,或指出哪個資料行是標籤或特徵。
  • 取樣和分割資料集:將您的資料分成定型集和測試集、依百分比或依篩選準則分割資料集,或執行取樣。
  • 調整和減少資料:藉由套用正規化或調整來準備要分析的數值資料。 將資料分類為群組、移除或取代極端值,或 (PCA) 執行主體元件分析。

模組清單

下列模組類別包含在 資料轉換 類別中:

另請參閱