次の方法で共有


ai_summarize 関数

適用対象:check marked yes Databricks SQL

重要

この機能はパブリック プレビュー段階にあります。

プレビューでは、

  • 基になる言語モデルでは複数の言語を処理できますが、これらの関数は英語用にチューニングされています。
  • 基になる Foundation Model API にレート制限があります。これらの制限を更新する方法については、「Foundation Model API の制限」を参照してください。

ai_summarize() 関数を使うと、最先端の生成 AI モデルを呼び出し、SQL を使って特定のテキストの概要を生成できます。 この関数では、Databricks Foundation Model API によって利用できるチャット モデル提供エンドポイントを使います。

要件

重要

現時点で使用できる基になるモデルは、Apache 2.0 ライセンスまたは Llama 2 Community License に基づいてライセンス付与されます。 Databricks では、該当する使用条件に準拠するために、これらのライセンスを確認することをお勧めしています。 将来、Databricks の内部ベンチマークに従ってパフォーマンスが向上するモデルが開発された場合、Databricks によってモデルが変更される可能性があります (変更に伴い、このページで提供されている該当するライセンスの一覧も変更されます)。

現在、Mixtral-8x7B 指示は、これらの AI 関数を実行する基になるモデルとなっています。

構文

ai_summarize(content[, max_words])

引数

  • content: STRING 式、要約するテキスト。
  • max_words: 返される要約テキスト内のベスト エフォート目標の単語数を表す、省略可能な負ではない整数式。 既定値は 50 です。 0 に設定すると、単語数の制限はありません。

返品

STRING です。

contentNULL の場合、結果は NULL です。

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  )
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."