機器學習模組說明

本主題概述 Azure Machine Learning Studio (傳統) 中所包含的所有 模組 ,這是一個互動式的視覺化工作區,可讓您輕鬆地建立及測試預測模型。

注意

適用于 : Machine Learning Studio (傳統)

此內容僅適用于 Studio (傳統) 。 Azure Machine Learning 設計工具中已新增類似的拖放模組。 若要深入瞭解 這兩個版本,請參閱這篇文章

什麼是模組?

在 Machine Learning Studio (傳統) 中,模組是用來建立實驗的建立區塊。 每個模組都會封裝特定的機器學習演算法、函式或程式碼程式庫,以處理您工作區中的資料。 這些模組是設計來接受來自其他模組的連接,以共用和修改資料。

在每個模組中執行的程式碼來自許多來源。 這些包括開放原始碼程式庫和語言、Microsoft Research 所開發的演算法,以及使用 Azure 和其他雲端服務的工具。

提示

正在尋找機器學習演算法嗎? 請參閱 機器學習 類別目錄,其中包含決策樹、叢集、類神經網路及其他專案的模組。 定型評估分類包含可協助定型和測試模型的模組。

藉由連接和設定模組,您可以建立工作流程,從外部來源讀取資料、準備資料以進行分析、套用機器學習演算法,以及產生結果。

當您在 Machine Learning Studio 中開啟 實驗 (傳統) 時,您可以在左側導覽窗格中看到目前模組的完整清單。 您可以將這些建築物區塊拖曳到您的實驗中,然後連接它們來建立完整的機器學習工作流程,稱為實驗。

有時模組會更新以新增功能,或移除較舊的程式碼。 發生這種情況時,您所建立且使用此模組的任何實驗都會繼續執行。 但是,當您下次開啟實驗時,系統會提示您升級模組,或使用不同的模組。

範例

如需如何建立完整機器學習實驗的範例,請參閱下列教學課程:

模組類別

為了讓您更容易找到相關的模組,Machine Learning Studio 中的機器學習工具 (傳統) 會依這些分類進行分組。

資料格式轉換

這些模組可讓您將資料轉換成其他機器學習工具或格式所使用的其中一種格式。

  • 資料輸入和輸出

    使用這些模組從雲端資料來源(包括 Hadoop 叢集、Azure 資料表儲存體和 web Url)讀取資料和模型。 您也可以使用這些模組,將結果寫入至儲存體或資料庫。

  • 資料轉換

    這些模組可讓您準備資料以便進行分析。 您可以變更資料類型、將資料行標示為特徵或標籤、產生功能,以及調整或正規化資料。

  • Filter

    轉換衍生自數位信號處理的數值資料。

  • 使用計數學習

    使用聯合機率分佈來建立簡潔地描述大型資料集的功能。

  • 操作

    此群組提供各種不同的資料科學工具。 例如,您可以移除或取代遺漏值、選擇資料行的子集、加入資料行,或串連兩個資料集。

  • 取樣和分割

    依準則或大小來分割資料集、建立定型集和測試集,或隔離特定資料列。

  • 擴充和縮減

    轉換數值資料。

特徵選取

這些模組可讓您使用廣泛用於研究之統計方法識別資料中的最佳特徵。

Machine Learning

此群組包含機器學習服務所支援的大部分機器學習演算法。

它也包含可透過定型模型、產生分數和評估模型效能來支援演算法的模組。

  • 評估

    定型模型之後,請使用這些工具來測量模型的精確度。

  • 初始化

    這些模組提供機器學習演算法,您可以藉由設定參數自訂此演算法。 此區段中的演算法會依類型分組:

  • 分數

    使用這些模組透過演算法傳遞新的資料,並產生一組評估結果。 您也可以使用評分的結果做為預測性服務的一部分。

  • 訓練

    這些模組會針對您所提供的資料,將已初始化的機器學習模型定型。

OpenCV 程式庫模組

這些模組可讓您輕鬆存取常用的影像處理和影像分類開放原始碼程式庫。

R 語言模組

這些模組可讓您將自訂 R 程式碼加入實驗中,或實作以 R 封裝為基礎的機器學習模型。

Python 語言模組

這些模組可讓您將自訂 Python 程式碼加入的實驗中。

統計函數

這些模組可讓您計算機率分配、建立自訂計算,以及執行多種與數值變數相關的其他工作。

文字分析

使用這些模組來執行特徵雜湊和命名實體辨識,或使用自然語言處理工具來前置處理文字。

時間序列

使用這些模組來評估趨勢中的異常狀況,方法是使用特別針對時間序列資料設計的演算法。

Machine Learning Studio (傳統) 模組不會嘗試複製其他工具所支援的資料整合工具,例如 Azure Data Factory。 相反地,模組會提供機器學習服務的特定功能:

  • 標準化、群組和調整資料
  • 計算資料的統計分佈
  • 轉換成其他機器學習格式
  • 匯入用於機器學習實驗和匯出結果的資料
  • 文字分析、特徵選取和維度縮減

如果您需要更精密的資料操作和儲存設備,請參閱下列各項:

另請參閱