ai_extractFunción

Se aplica a:check marked yes Databricks SQL

Importante

Esta característica está en versión preliminar pública.

En la vista previa,

  • El modelo lingüístico subyacente puede manejar varios idiomas, sin embargo estas funciones están ajustadas para el inglés.
  • Existen límites de velocidad para las APIs subyacentes de Foundation Model, consulte Límites de las APIs de Foundation Model para actualizar estos límites.

La función ai_extract() permite invocar un modelo de IA generativo de última generación para extraer entidades especificadas por etiquetas de un texto determinado mediante SQL. Esta función usa un modelo de chat que sirve el punto de conexión que ofrece databricks Foundation Model API.

Requisitos

Importante

Los modelos subyacentes que se pueden usar en este momento tienen licencia bajo la licencia de Apache 2.0 o la licencia de comunidad de Llama 2. Databricks recomienda revisar estas licencias para garantizar el cumplimiento de los términos aplicables. Si los modelos surgen en el futuro que funcionan mejor según las pruebas comparativas internas de Databricks, Databricks puede cambiar el modelo (y la lista de licencias aplicables proporcionadas en esta página).

Actualmente, Mixtral-8x7B Instruct es el modelo subyacente que impulsa estas funciones de IA.

Sintaxis

ai_extract(content, labels)

Argumentos

  • content: expresión STRING.
  • labels: Un ARRAY<STRING> literal. Cada elemento es un tipo de entidad que se va a extraer.

Devoluciones

Un STRUCT donde cada campo corresponde a un tipo de entidad especificado en labels. Cada campo contiene una cadena que representa la entidad extraída. Si se encuentra más de un candidato para cualquier tipo de entidad, solo se devuelve uno.

Si content es NULL, el resultado es NULL.

Ejemplos

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}