ai_summarize
Función
Se aplica a: Databricks SQL
Importante
Esta característica está en versión preliminar pública.
En la versión preliminar,
- El modelo de lenguaje subyacente puede manejar varios idiomas; sin embargo, estas funciones están ajustadas para el inglés.
- Existen límites de velocidad para las API subyacentes de modelo fundacional. Consulte Límites de las APIs de modelo fundacional para actualizar estos límites.
La función ai_summarize()
permite invocar un modelo de IA generativa de última generación para generar un resumen de un texto determinado mediante SQL. Esta función usa un modelo de chat que sirve al punto de conexión que la API de modelo fundacional de Databricks pone a disposición.
Requisitos
Importante
Los modelos subyacentes que se pueden usar en este momento tienen licencia bajo la licencia de Apache 2.0 o la licencia de comunidad de Llama 2. Databricks recomienda revisar estas licencias para garantizar el cumplimiento de los términos aplicables. Si en el futuro surgen modelos que funcionan mejor según las pruebas comparativas internas de Databricks, Databricks puede cambiar el modelo (y la lista de licencias aplicables proporcionadas en esta página).
Actualmente, Mixtral-8x7B Instruct es el modelo subyacente que impulsa estas funciones de IA.
- Esta función solo está disponible en áreas de trabajo en regiones admitidas de pago por token de las API de modelo fundacional.
- Esta función no está disponible en Azure Databricks SQL Classic.
- Consulte la página de precios de Databricks SQL.
Sintaxis
ai_summarize(content[, max_words])
Argumentos
content
: expresiónSTRING
, el texto que se va a resumir.max_words
: expresión numérica integral no negativa opcional que representa el número de destino de mejor esfuerzo de palabras en el texto de resumen devuelto. El valor predeterminado es 50. Si se establece en 0, no hay ningún límite de palabras.
Devoluciones
STRING
.
Si content
es NULL
, el resultado es NULL
.
Ejemplos
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
)
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."