FREETEXT (Transact-SQL)

在 WHERE 子句中使用的一个谓词,用于搜索含有基于字符的数据类型的列,以查找含义与搜索条件中的单词相同但不完全匹配的值。如果使用 FREETEXT,则全文查询引擎将在内部对 freetext_string 执行以下操作,并为每个字词分配权重,再查找匹配项。

  • 基于单词边界(单词界限)将字符串分隔成单独的单词。

  • 生成单词的词形变化形式(词干处理)。

  • 基于同义词库中的匹配项标识字词的扩展或替换的列表。

主题链接图标Transact-SQL 语法约定

语法

FREETEXT ( { column_name | (column_list) | * } 
          , 'freetext_string' [ , LANGUAGE language_term ] )

参数

  • column_name
    FROM 子句中指定表的一个或多个全文索引列的名称。这些列可为 char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary 或 varbinary(max) 类型。

  • column_list
    指示可以指定多个列(以逗号分隔)。column_list 必须用括号括起来。除非指定 language_term,否则 column_list 中所有列的语言必须相同。

  • *
    指定所有注册全文搜索的列均应用于搜索给定的 freetext_string。如果 FROM 子句中有多个表,那么 * 必须由表名限定。除非指定 language_term,否则表的所有列的语言都必须相同。

  • freetext_string
    要在 column_name 中搜索的文本。可以输入任何文本,包括单词、短语或句子。只要在全文索引中找到任何术语或术语格式,就会生成匹配项。

    与 AND 作为关键字的 CONTAINS 和 CONTAINSTABLE 搜索条件不同,当在 freetext_string 中使用单词“and”时,会将它视为干扰词或非索引字,因此会丢弃它。

    不允许使用 WEIGHT、FORMSOF、通配符、NEAR 和其他语法。系统将通过同义词库对 freetext_string 字符串进行断字处理、词干分析,然后执行同义词库查询。如果使用双引号将 freetext_string 引起来,将执行短语匹配;而不执行词干分析和同义词库查询处理。

    freetext_string 的数据类型为 nvarchar。将另一个字符数据类型用作输入时,将发生隐式转换。在下面的示例中,@SearchWord 变量(被定义为 varchar(30))导致 FREETEXT 谓词中发生隐式转换。

    USE AdventureWorks;
    GO
    DECLARE @SearchWord varchar(30)
    SET @SearchWord ='performance'
    SELECT Description 
    FROM Production.ProductDescription 
    WHERE FREETEXT(Description, @SearchWord);
    

    由于“参数截取”跨转换无效,因此请使用 nvarchar 以获得更好性能。在该示例中,请将 @SearchWord 声明为 nvarchar(30)。

    USE AdventureWorks;
    GO
    DECLARE @SearchWord nvarchar(30)
    SET @SearchWord = N'performance'
    SELECT Description 
    FROM Production.ProductDescription 
    WHERE FREETEXT(Description, @SearchWord);
    

    对于生成非最佳计划的情况,还可以使用 OPTIMIZE FOR 查询提示。

  • LANGUAGE language_term
    特定的语言,查询时,其资源将用于断字、词干分析、同义词库查询以及非索引字删除。此参数是可选的,可以将其指定为与语言区域设置标识符 (LCID) 对应的字符串、整数或十六进制值。如果指定了 language_term,则它表示的语言将应用于搜索条件的所有元素。如果未指定值,则使用该列的全文语言。

    如果将不同语言的文档一起作为二进制大型对象 (BLOB) 存储在单个列中,则指定文档的区域设置标识符 (LCID) 将决定对其内容编制索引时使用哪种语言。查询这种列时,指定 LANGUAGElanguage_term 可增大找到有效匹配项的可能性。

    如果指定为字符串,language_term 将对应于 sys.syslanguages (Transact-SQL) 兼容性视图中的 alias 列值。字符串必须用单引号引起来,如 'language_term'。如果指定为整数,则 language_term 就是标识该语言的实际 LCID。如果指定为十六进制值,则 language_term 将以 0x 开头,后面跟有 LCID 的十六进制值。十六进制值不能超过八位(包括前导零在内)。

    如果该值是双字节字符集 (DBCS) 格式,则 MicrosoftSQL Server 会将其转换为 Unicode 格式。

    如果指定的语言无效,或者没有安装对应于该语言的资源,MicrosoftSQL Server 将返回错误。若要使用非特定语言资源,请将 language_term 指定为 0x0。

注释

全文谓词和函数作用于 FROM 谓词所示的单个表。若要对多个表进行搜索,请在 FROM 子句中使用联接表,以搜索由两个或更多个表的乘积构成的结果集。

使用 FREETEXT 的全文查询没有使用 CONTAINS 的全文查询精度高。SQL Server 全文搜索引擎识别重要的字词和短语。保留关键字或通配符字符都不具有特殊含义,而它们指定在 CONTAINS 谓词的 <contains_search_condition> 参数中时则通常具有含义。

如果兼容级别小于 70,则不会将 FREETEXT 视为关键字。有关详细信息,请参阅 sp_dbcmptlevel (Transact-SQL)

当数据库兼容级别设置为 100 时,不允许在 OUTPUT 子句中使用全文谓词。

示例

A. 使用 FREETEXT 搜索包含指定字符值的单词

以下示例搜索包含与 vital、safety、components 相关的单词的所有文档。

USE AdventureWorks;
GO
SELECT Title
FROM Production.Document
WHERE FREETEXT (Document, 'vital safety components' );
GO

B. 通过变量使用 FREETEXT

以下示例使用了变量来取代具体的搜索项。

USE AdventureWorks;
GO
DECLARE @SearchWord nvarchar(30);
SET @SearchWord = N'high-performance';
SELECT Description 
FROM Production.ProductDescription 
WHERE FREETEXT(Description, @SearchWord);
GO