在 Microsoft Syntex 中建立擷取器時,利用字詞庫分類法

適用于: ✓ 非結構化檔處理



當您使用 Microsoft Syntex 在非結構化檔處理模型中建立擷取器時,您可以利用字詞庫中的全域字片語,來顯示所擷取資料的慣用字詞。

舉例來說,您的模型識別並分類上傳至文件庫的所有 [合約] 文件。 此外,模型也會從每個合約擷取 [合約服務] 值,並將它顯示在文件庫檢視的欄中。 在合於中的各種合約服務值中,貴公司已不再使用並重新命名了數個舊值。 例如,所有提及「設計」「圖形」「地形」 契约服務的條款現在都應該稱為「創造性」。 每當您的模型從合約檔中擷取其中一個過期的字詞時,您會希望它在文件庫檢視中顯示目前的詞彙 Creative。 在下列範例中,在定型模型時,我們看到其中一個範例檔包含過時的「 設計」詞彙。

字詞庫。

在擷取器中使用受控中繼資料資料行

字片語是在 SharePoint系統管理中心的 [受控中繼資料服務] (MMS) 字詞庫中設定。 在下列範例中, 合約服務字片語 已設定為包含數個字詞,包括 Creative。 它的詳細資料表明這個字詞有三個同義字(「設計」「圖形」「地形」),這些同義詞應該被翻譯成「創造性」

字片語。

您可能會想要在字詞組中使用同義字的原因有很多。 例如,可能存在過期字詞、重新命名的字詞或組織部門之間在命名方面的差异。

若要使受管理的中繼資料欄位可供您在模型中建立擷取器時使用,您需要將其添加為受管理的中繼資料網站欄。 新增網站欄後,您可以在建立模型擷取器時進行選取。

合約服務。

將模型套用至文件庫後,當文件上載到庫時,當擷取器找到任何同義字值(「設計」「圖形」「地形」)時,創意服務欄將顯示首選字詞(「創造性」)。

合約服務資料行。

注意事項

如果字片語已開啟,則任何不符合慣用字詞或同義字值的擷取值,都會新增為字片語根目錄的新字詞。 這些新字詞可以在字片語所在的字詞庫中移動、合併或成為同義字。

請參閱

受管理的中繼資料簡介

建立擷取器

建立受管理的中繼資料欄