ai_similarity
함수
적용 대상: Databricks SQL
Important
이 기능은 공개 미리 보기 상태입니다.
미리 보기에서 다음을 실행합니다.
- 기본 언어 모델은 여러 언어를 처리할 수 있지만 이러한 함수는 영어로 조정됩니다.
- 기본 Foundation Model API에 대한 속도 제한이 있습니다. 이러한 제한을 업데이트하려면 파운데이션 모델 API 제한을 참조하세요.
이 함수는 ai_similarity()
Databricks Foundation 모델 API에서 최신 생성 AI 모델을 호출하여 두 문자열을 비교하고 SQL을 사용하여 의미 체계 유사성 점수를 계산합니다.
요구 사항
Important
현재 사용할 수 있는 기본 모델은 MIT 라이선스 또는 Llama 2 커뮤니티 라이선스에 따라 라이선스가 부여됩니다. Databricks는 해당 조건을 준수하도록 이러한 라이선스를 검토할 것을 권장합니다. Databricks의 내부 벤치마크에 따라 더 나은 성능을 제공하는 모델이 향후에 나타날 경우 Databricks는 모델(및 이 페이지에 제공된 해당 라이선스 목록)을 변경할 수 있습니다.
현재 bge-large-en-v1.5 는 이 AI 기능을 구동하는 기본 모델입니다.
- 이 함수는 파운데이션 모델 API 토큰당 종량제 지원 지역의 작업 영역에서만 사용할 수 있습니다.
- 이 함수는 Azure Databricks SQL 클래식에서 사용할 수 없습니다.
- Databricks SQL 가격 책정 페이지를 확인합니다.
구문
ai_similarity(expr1, expr2)
인수
expr1
:STRING
식입니다.expr2
:STRING
식입니다.
반품
FLOAT
두 입력 문자열 간의 의미 체계 유사성을 나타내는 값입니다. 출력 점수는 상대적이며 순위에만 사용해야 합니다. 점수가 1이면 두 텍스트가 같습니다.
예
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.