ai_mask 함수

적용 대상:check marked yes Databricks SQL

Important

이 기능은 공개 미리 보기 상태입니다.

미리 보기에서 다음을 실행합니다.

  • 기본 언어 모델은 여러 언어를 처리할 수 있지만 이러한 함수는 영어로 조정됩니다.
  • 기본 Foundation Model API에 대한 속도 제한이 있습니다. 이러한 제한을 업데이트하려면 파운데이션 모델 API 제한을 참조하세요.

ai_mask() 함수를 사용하면 SQL을 사용하여 지정된 텍스트의 지정된 엔터티를 마스킹하기 위해 최신 생성 AI 모델을 호출할 수 있습니다. 이 함수는 Databricks Foundation 모델 API에서 사용할 수 있는 엔드포인트를 제공하는 채팅 모델을 사용합니다.

요구 사항

Important

현재 사용할 수 있는 기본 모델은 Apache 2.0 라이선스 또는 Llama 2 커뮤니티 라이선스에 따라 라이선스가 부여됩니다. Databricks는 해당 조건을 준수하도록 이러한 라이선스를 검토할 것을 권장합니다. Databricks의 내부 벤치마크에 따라 더 나은 성능을 제공하는 모델이 향후에 나타날 경우 Databricks는 모델(및 이 페이지에 제공된 해당 라이선스 목록)을 변경할 수 있습니다.

현재 Mixtral-8x7B 지시 는 이러한 AI 기능을 지원하는 기본 모델입니다.

구문

ai_mask(content, labels)

인수

  • content: STRING 식입니다.
  • labels: 리터럴입니다 ARRAY<STRING> . 각 요소는 마스킹할 정보의 형식을 나타냅니다.

반품

STRING 지정된 정보가 마스킹되는 위치입니다.

contentNULL이면 결과는 NULL입니다.

예제

> SELECT ai_mask(
    'John Doe lives in New York. His email is john.doe@example.com.',
    array('person', 'email')
  );
 "[MASKED] lives in New York. His email is [MASKED]."

> SELECT ai_mask(
    'Contact me at 555-1234 or visit us at 123 Main St.',
    array('phone', 'address')
  );
 "Contact me at [MASKED] or visit us at [MASKED]"