Funktionen ai_summarize

Gäller för:check marked yes Databricks SQL

Viktigt!

Den här funktionen finns som allmänt tillgänglig förhandsversion.

I förhandsversionen

  • Den underliggande språkmodellen kan hantera flera språk, men dessa funktioner är anpassade för engelska.
  • Det finns hastighetsbegränsning för de underliggande Foundation Model-API:erna, se Foundation Model API:er för att uppdatera dessa gränser.

Med ai_summarize() funktionen kan du anropa en toppmodern generativ AI-modell för att generera en sammanfattning av en viss text med hjälp av SQL. Den här funktionen använder en chattmodell som betjänar slutpunkten som görs tillgänglig av Databricks Foundation-modell-API:er.

Behov

Viktigt!

De underliggande modeller som kan användas just nu är licensierade under Apache 2.0-licensen eller Llama 2 Community-licensen. Databricks rekommenderar att du granskar dessa licenser för att säkerställa efterlevnad av tillämpliga villkor. Om modeller dyker upp i framtiden som presterar bättre enligt Databricks interna riktmärken kan Databricks ändra modellen (och listan över tillämpliga licenser som tillhandahålls på den här sidan).

För närvarande är Mixtral-8x7B Instruct den underliggande modellen som driver dessa AI-funktioner.

  • Den här funktionen är endast tillgänglig på arbetsytor i FOUNDATION Model API:er som betalar per token som stöds.
  • Den här funktionen är inte tillgänglig i Azure Databricks SQL Classic.
  • Kontrollera prissättningssidan för Databricks SQL.

Syntax

ai_summarize(content[, max_words])

Argument

  • content: Ett STRING uttryck, texten som ska sammanfattas.
  • max_words: Ett valfritt icke-negativt, numeriskt uttryck som representerar det bästa målantalet ord i den returnerade sammanfattningstexten. Standardvärdet är 50. Om värdet är 0 finns det ingen ordgräns.

Returer

En STRING.

Om content är NULLär NULLresultatet .

Exempel

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  )
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."