Fonction ai_similarity
S’applique à : Databricks SQL
Important
Cette fonctionnalité est disponible en préversion publique.
Dans la préversion,
- Le modèle de langage sous-jacent peut gérer plusieurs langues. Toutefois, ces fonctions sont optimisées pour l’anglais.
- Il existe une limitation de débit pour les API Foundation Model sous-jacentes ; consultez Limites des API Foundation Model pour mettre à jour ces limites.
La fonction ai_similarity()
appelle un modèle d’IA dégénérative de Databricks Foundation Model pour comparer deux chaînes et calcule le score de similarité sémantique à l’aide de SQL.
Spécifications
Important
Les modèles sous-jacents qui peuvent être utilisés pour l’instant sont concédés sous la licence ou la licence MIT de la communauté Llama 2. Databricks recommande d’examiner ces licences pour vérifier la conformité avec les conditions applicables. Si des modèles fonctionnant mieux d’après les points de référence internes de Databricks venaient à émerger, Databricks peut changer de modèle (et la liste des licences applicables fournies sur cette page).
Actuellement, bge-large-en-v1.5 est le modèle sous-jacent qui alimente cette fonction IA.
- Cette fonction est disponible seulement sur les espaces de travail des régions prises en charge avec paiement par jeton dans les API Foundation Model.
- Cette fonction n’est pas disponible sur Azure Databricks SQL classique.
- Consultez la page de tarification de Databricks SQL.
Syntaxe
ai_similarity(expr1, expr2)
Arguments
expr1
: expressionSTRING
.expr2
: expressionSTRING
.
Retours
Valeur FLOAT
représentant la similarité sémantique entre les deux chaînes d’entrée. Le score de sortie est relatif et ne doit être utilisé que pour le classement. Le score de 1 signifie que les deux textes sont égaux.
Exemples
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.