TokenizingByCharactersEstimator 類別

定義

public sealed class TokenizingByCharactersEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.Text.TokenizingByCharactersTransformer>
type TokenizingByCharactersEstimator = class
    inherit TrivialEstimator<TokenizingByCharactersTransformer>
Public NotInheritable Class TokenizingByCharactersEstimator
Inherits TrivialEstimator(Of TokenizingByCharactersTransformer)
繼承
TokenizingByCharactersEstimator

備註

估算器特性

此估算器是否需要查看資料來定型其參數?
輸入資料行資料類型 純量或文字向量
輸出資料行資料類型 索引鍵類型的可變大小向量。
可匯出至 ONNX

估算器會使用滑動視窗,將文字分割成字元序列,以標記字元。 在定型期間,估算器會建置索引鍵/值組字典,其中包含遇到的字元序列。

調整估算器所產生的 會 TokenizingByCharactersTransformer 建立名為 的新資料行,如輸出資料行名稱參數中所指定,其中包含輸入中遇到的字元序列索引鍵。

如需使用範例的連結,請參閱另請參閱一節。

方法

Fit(IDataView)

IEstimator<TTransformer>TokenizingByCharactersTransformer

(繼承來源 TrivialEstimator<TTransformer>)
GetOutputSchema(SchemaShape)

SchemaShape 回由轉換器產生之架構的 。 用於管線中的架構傳播和驗證。

擴充方法

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

將「快取檢查點」附加至估算器鏈結。 這可確保下游估算器會針對快取的資料定型。 在接受多個資料通過的定型器之前,擁有快取檢查點會很有説明。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

假設有估算器,則會傳回包裝物件,一旦 Fit(IDataView) 呼叫委派即可。 估算器通常必須傳回符合專案的相關資訊,這就是方法 Fit(IDataView) 傳回特定型別物件的原因,而不是只傳回一般 ITransformer 。 不過,同時 IEstimator<TTransformer> ,通常會形成具有許多物件的管線,因此我們可能需要透過 EstimatorChain<TLastTransformer> 建置估算器的鏈結,而我們想要取得轉換器的估算器會在此鏈結的某處被隱藏。 在該案例中,我們可以透過此方法附加呼叫一次將會呼叫的委派。

適用於

另請參閱