대화형 언어 이해에 사용되는 용어 및 정의

아티클
12/19/2023

이 문서를 사용하여 대화형 언어 이해를 사용할 때 접할 수 있는 몇 가지 정의와 용어에 대해 알아봅니다.

Entity

엔터티는 의도를 충족하거나 식별하는 데 사용되는 정보를 설명하는 발화의 단어입니다. 엔터티가 복잡하고 모델이 특정 부분을 식별하게 하려는 경우 모델을 하위 엔터티로 나눌 수 있습니다. 예를 들어 주소를 예측하는 모델을 만들고, 도로 주소, 구/군/시, 시/도 및 우편 번호 등의 하위 엔터티도 확인할 수 있습니다.

F1 점수

F1 점수는 정밀도와 재현율의 함수입니다. 정밀도와 재현율 사이의 균형을 추구할 때 필요합니다.

Intent

의도는 사용자가 수행하려는 작업을 나타냅니다. 항공편 예약 또는 결제와 같이 사용자 입력으로 표현된 목적이나 목표입니다.

목록 엔터티

목록 엔터티는 동의어와 함께 일련의 고정된 폐쇄형 관련 단어를 나타냅니다. 목록 엔터티는 기계 학습 엔터티와 달리 정확히 일치합니다.

목록 엔터티의 단어가 목록에 포함되면 엔터티가 예측됩니다. 예를 들어 "크기"라는 목록 엔터티가 있고 목록에 "소, 중, 대"라는 단어가 있는 경우, 컨텍스트에 관계없이 "소", "중" 또는 "대" 단어가 사용되는 모든 발화에 대해 크기 엔터티가 예측됩니다.

모델

모델은 특정 작업을 수행하도록 학습된 개체(이 경우 대화 이해 작업)입니다. 모델은 나중에 발화 이해에 사용할 수 있도록 학습할 레이블이 지정된 데이터를 제공하여 학습됩니다.

모델 평가는 모델의 성능을 파악하기 위해 학습 직후에 수행되는 프로세스입니다.
배포는 예측 API를 통해 사용할 수 있도록 모델을 배포에 할당하는 프로세스입니다.

과잉 맞춤

과잉 맞춤은 모델이 특정 예에 고정되어 있어 일반화할 수 없을 때 발생합니다.

정밀도

모델이 얼마나 정확하고 정확한지를 측정합니다. 올바르게 식별된 긍정(진양성)과 식별된 모든 긍정 간의 비율입니다. 정밀도 메트릭은 예측된 클래스 중 얼마나 많은 레이블이 올바르게 지정되었는지 보여 줍니다.

Project

프로젝트는 데이터를 기반으로 하는 사용자 지정 ML 모델을 빌드하기 위한 작업 영역입니다. 사용자 및 사용 중인 Azure 리소스에 대해 액세스 권한이 있는 다른 사용자만 프로젝트에 액세스할 수 있습니다.

재현율

실제 양성 클래스를 예측하는 모델의 능력을 측정합니다. 예측된 진양성과 실제로 태그된 것 간의 비율입니다. 재현율 메트릭은 예측된 클래스 중 얼마나 많은 것이 올바른지 보여 줍니다.

정규식

정규식 엔터티는 정규식을 나타냅니다. 정규식 엔터티는 정확한 일치입니다.

스키마

스키마는 프로젝트 내의 의도 및 엔터티 조합으로 정의됩니다. 스키마 디자인은 프로젝트 성공의 중요한 부분입니다. 스키마를 만드는 경우 프로젝트에 포함해야 하는 의도와 엔터티를 고려해야 합니다.

학습 데이터

학습 데이터는 모델을 학습하는 데 필요한 정보 집합입니다.

발화

발화는 대화의 문장에 대한 짧은 텍스트인 사용자 입력입니다. “다음 주 화요일 시애틀행 티켓 2매 예약”과 같은 자연어 구문입니다. 예제 발화를 추가하여 모델을 학습시키고 모델은 런타임에 새 발화에 대해 예측합니다.