ai_classify 函数

适用于:check marked yes Databricks SQL

重要

此功能目前以公共预览版提供。

在预览版中,

  • 基础语言模型可以处理多种语言,但这些函数是针对英语进行了优化。
  • 基础模型 API 存在速率限制,请参阅基础模型 API 限制了解有关这些限制的最新信息。

ai_classify() 函数允许你调用最先进的生成式 AI 模型,以便根据你使用 SQL 提供的标签对输入文本进行分类。 此函数使用通过 Databricks 基础模型 API 提供的聊天模型服务终结点。

要求

重要

目前可使用的基础模型已获得 Apache 2.0 许可证或 Llama 2 社区许可证的许可。 Databricks 建议查看这些许可证,以确保遵守任何适用的条款。 如果未来出现的模型按 Databricks 的内部基准而言性能更佳,Databricks 可能会更改模型(以及本页提供的适用许可证列表)。

目前,Mixtral-8x7B Instruct 是支持这些 AI 函数的基础模型。

语法

ai_classify(content, labels)

参数

  • content:一个 STRING 表达式,即要分类的文本。
  • labels:一个 ARRAY<STRING> 文本,即预期的输出分类标签。 必须至少包含 2 个元素,且不得包含 20 个以上的元素。

返回

一个 STRING。 该值与 labels 参数中提供的字符串之一匹配。 如果无法对 content 进行分类,则返回 null

示例

> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
  urgent

> SELECT
    description,
    ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
  FROM
    products