共用方式為


了解受管理的功能存放區中最上層實體

本文件說明受管理的功能存放區中最上層實體。

Diagram depicting the main components of managed feature store.

如需受管理的功能存放區詳細資訊,請參閱什麼是受管理的功能存放區?

功能存放區

您可以透過功能存放區建立及管理功能集。 功能集是功能的集合。 您可以選擇將具體化存放區 (離線存放區連線) 與功能存放區建立關聯,以定期預先計算並保存功能。 如此一來,就能在定型或推斷期間讓功能擷取更快且更可靠。

如需設定的詳細資訊,請參閱 CLI (v2) 功能存放區 YAML 結構描述

實體

實體會封裝企業中邏輯實體的索引資料行。 實體的範例包括帳戶實體、客戶實體等。作為最佳做法,實體有助於在使用相同邏輯實體的功能集中,強制使用相同的索引資料行定義。

實體通常會建立一次,然後在不同功能集中重複使用。 實體已建立版本。

如需設定的詳細資訊,請參閱 CLI (v2) 功能實體 YAML 結構描述

功能集規格和資產

功能集是針對來源系統資料套用轉換所產生的功能集合。 功能集會封裝來源、轉換函數和具體化設定。 我們目前支援 PySpark 功能轉換程式碼。

首先建立功能集規格。 功能集規格是功能集的獨立定義,您可以在本機開發和測試。

功能集規格通常包含下列參數:

  • source:此功能對應至哪些來源
  • transformation (選擇性):套用至來源資料的轉換邏輯,用於建立功能。 在我們的案例中,則使用 Spark 作為支援的計算。
  • 代表 index_columnstimestamp_column 的資料行名稱:當使用者嘗試將功能資料與觀測資料聯結時,就需要這些名稱 (稍後會詳細介紹)
  • materialization_settings(選擇性):必要項目,可快取具體化存放區中的功能值,以便提高擷取效率。

在本機/開發環境中開發和測試功能集規格之後,您可以使用功能存放區將規格註冊為功能集資產。 功能集資產提供受控功能,例如版本設定和具體化。

如需功能集 YAML 規格的詳細資訊,請參閱 CLI (v2) 功能集規格 YAML 結構描述

功能擷取規格

功能擷取規格是與模型相關聯的功能清單可攜式定義。 該規格有助於簡化機器學習模型的開發和操作。 功能擷取規格通常是定型管線的輸入。 其有助於產生定型資料, 也可以與模型一併封裝。 此外,推斷步驟會將其用於尋找功能。 其整合了機器學習生命週期的所有階段。 當您進行實驗和部署時,可以最大限度地減少定型和推斷管線的變更。

您可自行選擇是否使用功能擷取規格和內建功能擷取元件。 如有需要,您可以直接使用 get_offline_features() API。

如需功能擷取 YAML 規格的詳細資訊,請參閱 CLI (v2) 功能擷取規格 YAML 結構描述

下一步