合併計數轉換

建立以計數資料表為基礎的一組特徵

類別: 學習計數

注意

適用于 : Machine Learning Studio (傳統)

此內容僅適用于 Studio (傳統) 。 Azure Machine Learning 設計工具中已新增類似的拖放模組。 若要深入瞭解 這兩個版本,請參閱這篇文章

模組概觀

本文說明如何使用 Azure Machine Learning Studio (傳統) 中的「 合併計數轉換 」模組,來結合兩組以計數為基礎的特徵。 藉由合併兩組相關的計數和功能,您可能會改善功能的涵蓋範圍和散發。

從計數學習在具有高基數特徵的大型資料集上特別有用。 將多個資料集合併成以計數為基礎的特徵集,而不需要重新處理資料集,可讓您更輕鬆地收集非常大型資料集的統計資料,並將其套用至新的資料集。 例如,您可以使用計數資料表來收集超過數 tb 資料的資訊。 您可以重複使用這些統計資料,以改善小型資料集的預測性模型精確度。

若要合併兩組以計數為基礎的功能,您必須使用具有相同架構的資料表建立這些功能:也就是說,這兩個集合都必須使用相同的資料行,而且具有相同的名稱和資料類型。

如何設定合併計數轉換

  1. 若要使用 合併計數轉換,您必須建立至少一個以計數為基礎的轉換,而且該轉換必須存在於您的工作區中。 如果您是從不同的實驗儲存以計數為基礎的轉換,請查看 [ 轉換 ] 群組。 如果您在目前的實驗中建立轉換,請連接下列模組的輸出:

    • 建立計數轉換。 根據來源資料建立新的計數型轉換。

    • 修改計數資料表參數。 接受現有的計數轉換做為輸入,並輸出更新的轉換。

    • 入計數資料表。 這個模組支援使用以計數為基礎的學習,與舊版實驗的回溯相容性。 如果您使用匯 入計數資料表 來分析資料集中值的分佈,然後使用已被取代的計數 Featurizer 模組將值轉換成特徵,請使用匯 入計數資料表 將結果轉換為轉換。

  2. 將「 合併計數轉換 」模組新增至實驗,並將轉換連接到每個輸入。

    提示

    第二個轉換是選擇性的輸入,您可以連接相同的轉換兩次,或在第二個輸入埠上連接任何內容。

  3. 如果您不想讓第二個資料集使用第一個資料集來平均加權,請指定 [ 衰減因數] 的值。 您輸入的值會指出如何加權第二個轉換的一組功能。

    例如,1個加權的預設值會有同樣的功能集。 值 .5 表示第二個集合中的功能在第一個集合中有一半的加權。

  4. (選擇性)加入套用 轉換 模組的實例,並將轉換套用至資料集。

範例

如需如何使用此模組的範例,請參閱 AZURE AI 資源庫

預期的輸入

名稱 類型 Description
先前的計數轉換 ITransform 介面 要編輯的計數轉換
新的計數轉換 ITransform 介面 要新增 (選擇性) 的計數轉換

模組參數

名稱 類型 範圍 選用 描述 預設
衰減因數 Float 必要 1.0f 要乘以右邊輸入埠之計數轉換的衰減因數

輸出

名稱 類型 Description
合併的計數轉換 ITransform 介面 合併的轉換

例外狀況

例外狀況 描述
錯誤 0003 如果一或多個輸入為 Null 或空白,就會發生例外狀況。
錯誤 0086 計數轉換無效時所發生的例外狀況。

另請參閱

以計數學習