일반적인 어휘 및 개념의 언어 이해 용어집

아티클
04/25/2024

Important

LUIS는 2025년 10월 1일에 사용 중지되며 2023년 4월 1일부터 새 LUIS 리소스를 만들 수 없습니다. 지속적인 제품 지원 및 다국어 기능을 활용하려면 LUIS 애플리케이션을 대화 언어 이해로 마이그레이션하는 것이 좋습니다.

LUIS(Language Understanding) 용어집은 LUIS 서비스를 사용할 때 발생할 수 있는 용어를 설명합니다.

활성 버전

활성 버전은 LUIS 포털을 사용하여 모델을 변경할 때 업데이트되는 앱의 버전 입니다. LUIS 포털에서 활성 버전이 아닌 버전을 변경하려면 먼저 해당 버전을 활성으로 설정해야 합니다.

활성 학습

활성 학습은 기계 학습 모델을 사용하여 레이블을 지정할 유익한 새 예제를 식별하는 기계 학습 기술입니다. LUIS에서 활성 학습은 모델을 개선하기 위해 현재 예측이 불분명한 엔드포인트 트래픽에서 발화를 추가하는 것을 말합니다. "엔드포인트 발화 검토"를 선택하여 발화를 확인하고 레이블을 지정합니다.

참고 항목:

애플리케이션(앱)

LUIS에서 애플리케이션 또는 앱은 특정 시나리오에 대한 의도 및 엔터티를 예측하기 위해 함께 작동하는 동일한 데이터 집합을 기반으로 구축된 기계 학습 모델의 컬렉션입니다. 각 애플리케이션에는 별도의 예측 엔드포인트가 있습니다.

HR 봇을 빌드하는 경우 "휴가 일정 예약", "혜택에 대한 문의" 및 "개인 정보 업데이트" 및 단일 애플리케이션으로 그룹화한 각 의도에 대한 엔터티와 같은 의도 집합이 있을 수 있습니다.

작성

작성은 LUIS 포털 또는 작성 API를 사용하여 LUIS 앱을 만들고, 관리하고, 배포하는 기능입니다.

작성 키

작성 키는 앱을 작성하는 데 사용됩니다. 프로덕션 수준 엔드포인트 쿼리에는 사용되지 않습니다. 자세한 내용은 리소스 제한을 참조하세요.

작성 리소스

LUIS 작성 리소스 는 Azure를 통해 사용할 수 있는 관리 가능한 항목입니다. 리소스는 Azure 서비스의 관련 작성, 학습 및 게시 능력에 대한 액세스 권한입니다. 리소스에는 연결된 Azure 서비스에 액세스하는 데 필요한 인증, 권한 부여 및 보안 정보가 포함됩니다.

제작 리소스에는 Azure의 "종류"가 있습니다 LUIS-Authoring.

테스트 일괄 처리

일괄 테스트는 사용자 발화의 일관되고 알려진 테스트 집합을 사용하여 현재 LUIS 앱 모델의 유효성을 검사하는 기능입니다. 일괄 테스트는 JSON 형식의 파일로 정의됩니다.

참고 항목:

개념
일괄 테스트 실행 방법
자습서 - 일괄 테스트 만들기 및 실행

F 측정값

일괄 테스트에서 테스트 정확도의 측정값입니다.

가음성(FN)

일괄 테스트의 데이터 요소는 앱이 대상 의도/엔터티의 부재를 잘못 예측한 발화를 나타냅니다.

가양성(FP)

일괄 테스트에서 데이터 요소는 앱이 대상 의도/엔터티의 존재를 잘못 예측한 발화를 나타냅니다.

정밀도

일괄 테스트에서 정밀도(긍정적 예측 값이라고도 함)는 검색된 발화 중에 관련된 발화의 일부입니다.

동물 배치 테스트의 예는 총 동물 수(양과 비양 모두)로 나눈 것으로 예측된 양 수입니다.

재현율

일괄 테스트에서 회수(민감도라고도 함)는 LUIS가 일반화할 수 있는 기능입니다.

동물 배치 테스트의 예는 사용 가능한 총 양 수로 나눈 것으로 예측된 양 수입니다.

진음성(TN)

진정한 부정은 앱이 일치하는 항목을 올바르게 예측하지 않는 경우입니다. 일괄 테스트의 경우 앱이 의도 또는 엔터티로 레이블이 지정되지 않은 예제에 대한 의도 또는 엔터티를 예측할 때 참 부정이 발생합니다.

진양성(TP)

참 긍정(TP) 진정한 긍정은 앱이 일치 항목을 올바르게 예측하는 경우입니다. 일괄 테스트의 경우 앱이 의도 또는 엔터티로 레이블이 지정된 예제의 의도 또는 엔터티를 예측할 때 진정한 긍정이 발생합니다.

분류자

분류자는 입력이 적합한 범주 또는 클래스를 예측하는 기계 학습 모델입니다.

의도는 분류자의 예입니다.

협력자

협력자는 개념적으로 기여자 동일합니다. 소유자가 Azure RBAC(Azure 역할 기반 액세스 제어)로 제어되지 않는 앱에 공동 작업자의 이메일 주소를 추가할 때 공동 작업자에게 액세스 권한이 부여됩니다. 여전히 협력자를 사용하는 경우 LUIS 계정을 마이그레이션하고 LUIS 작성 리소스를 사용하여 Azure RBAC를 사용하여 기여자 관리해야 합니다.

기여자

기여자 앱의 소유자가 아니지만 의도, 엔터티, 발화를 추가, 편집 및 삭제할 수 있는 권한이 동일합니다. 기여자는 LUIS 앱에 대한 Azure 역할 기반 액세스 제어(Azure RBAC)를 제공합니다.

참고 항목:

기여자를 추가하는 방법

설명자

설명자는 이전에 기계 학습 기능에 사용된 용어입니다.

도메인

LUIS 컨텍스트에서 도메인은 정보 영역입니다. 도메인은 시나리오에 해당합니다. 다른 do기본 do기본 컨텍스트에서 의미가 있는 특정 언어와 용어를 사용합니다. 예를 들어 음악을 재생하는 애플리케이션을 빌드하는 경우 애플리케이션에는 "노래, 트랙, 앨범, 가사, b면, 아티스트"와 같이 음악과 관련된 용어 및 언어가 있습니다. do기본s의 예는 미리 빌드된 do기본s를 참조하세요.

엔드포인트

엔드포인트 작성

LUIS 작성 엔드포인트 URL은 앱을 작성, 학습 및 게시하는 위치입니다. 엔드포인트 URL에는 앱 ID와 게시된 앱의 지역 또는 사용자 지정 하위 도메인이 포함됩니다.

개발자 참조에서 프로그래밍 방식으로 앱을 작성하는 방법에 대해 자세히 알아보세요.

예측 엔드포인트

LUIS 예측 엔드포인트 URL은 LUIS 앱을 작성하고 게시한 후 LUIS 쿼리를 제출하는 위치입니다. 엔드포인트 URL에는 앱 ID와 게시된 앱의 지역 또는 사용자 지정 하위 도메인이 포함됩니다. 앱의 Azure 리소스 페이지에 있는 엔드포인트를 찾거나 앱 정보 가져오기 API에서 엔드포인트 URL을 가져올 수 있습니다.

예측 엔드포인트에 대한 액세스 권한은 LUIS 예측 키로 인증됩니다.

Entity

엔터티는 의도를 수행하거나 식별하는 데 사용되는 정보를 설명하는 발화의 단어입니다. 엔터티가 복잡하고 모델이 특정 부분을 식별하게 하려는 경우 모델을 하위 엔터티로 나눌 수 있습니다. 예를 들어 주소를 예측하는 모델을 만들고, 도로 주소, 구/군/시, 시/도 및 우편 번호 등의 하위 엔터티도 확인할 수 있습니다. 엔터티는 모델의 기능으로도 사용할 수 있습니다. LUIS 앱의 응답에는 예측된 의도와 모든 엔터티가 모두 포함됩니다.

엔터티 추출기

추출기로만 알려진 엔터티 추출기는 LUIS가 엔터티를 예측하는 데 사용하는 기계 학습 모델의 유형입니다.

엔터티 스키마

엔터티 스키마는 하위 엔터티가 있는 기계 학습된 엔터티에 대해 정의하는 구조입니다. 예측 엔드포인트는 스키마에 정의된 추출된 모든 엔터티와 하위 엔터티를 반환합니다.

엔터티의 하위 엔터티

하위 엔터티는 기계 학습 엔터티의 자식 엔터티입니다.

비 기계 학습 엔터티

텍스트 일치를 사용하여 데이터를 추출하는 엔터티:

목록 엔터티
정규식 엔터티

목록 엔터티

목록 엔터티는 해당 동의어와 함께 고정된 닫힌 관련 단어 집합을 나타냅니다. 목록 엔터티는 기계 학습 엔터티와 달리 정확히 일치합니다.

목록 엔터티의 단어가 목록에 포함되면 엔터티가 예측됩니다. 예를 들어 "size"라는 목록 엔터티가 있고 목록에 "small, medium, large"라는 단어가 있는 경우 컨텍스트에 관계없이 "small" "medium" 또는 "large"라는 단어가 사용되는 모든 발화에 대해 크기 엔터티가 예측됩니다.

정규식

정규식 엔터티는 정규식을 나타냅니다. 정규식 엔터티는 기계 학습 엔터티와 달리 정확히 일치합니다.

미리 빌드된 엔터티

미리 빌드된 엔터티에 대한 미리 빌드된 모델의 항목을 참조하세요.

기능

기계 학습에서 기능은 모델이 특정 개념을 인식하는 데 도움이 되는 특징입니다. LUIS에서 사용할 수 있지만 하드 규칙은 사용할 수 없다는 힌트입니다.

이 용어를 기계 학습 기능이라고도 합니다.

이러한 힌트는 레이블과 함께 사용하여 새 데이터를 예측하는 방법을 알아봅니다. LUIS는 구문 목록과 다른 모델을 기능으로 사용하는 것을 모두 지원합니다.

필수 기능

필수 기능은 LUIS 모델의 출력을 제한하는 방법입니다. 엔터티에 대한 기능이 필수로 표시되면 기계 학습 모델이 예측하는 내용에 관계없이 엔터티를 예측하려면 이 기능이 예제에 있어야 합니다.

메뉴 순서 봇의 수량 엔터티에 필요한 것으로 표시한 미리 빌드된 숫자 기능이 있는 예제를 생각해 보세요. 봇에서 볼 I want a bajillion large pizzas?때 bajillion은 표시되는 컨텍스트에 관계없이 수량으로 예측되지 않습니다. Bajillion은 유효한 숫자가 아니며 미리 빌드된 숫자 엔터티로 예측되지 않습니다.

Intent

의도는 사용자가 수행하려는 작업 또는 작업을 나타냅니다. 항공편 예약 또는 결제와 같이 사용자 입력으로 표현된 목적이나 목표입니다. LUIS에서 전체 발화는 의도로 분류되지만 발화의 일부는 엔터티로 추출됩니다.

레이블 지정 예제

레이블 지정 또는 표시는 양수 또는 부정 예제를 모델과 연결시키는 프로세스입니다.

의도에 대한 레이블 지정

LUIS에서 앱 내의 의도는 상호 배타적입니다. 즉, 의도에 발화를 추가할 때 해당 의도에 대한 긍정적인 예이며 다른 모든 의도에 대한 부정적인 예제로 간주됩니다. 부정적인 예제는 앱 범위를 벗어난 발화를 나타내는 "None" 의도와 혼동해서는 안 됩니다.

엔터티에 대한 레이블 지정

LUIS에서 엔터티를 사용하여 의도의 예제 발화에서 단어 또는 구에 레이블을 지정합니다. 레이블 지정은 해당 발화에 대해 예측해야 하는 의도를 보여줍니다. 레이블이 지정된 발화는 의도를 학습하는 데 사용됩니다.

LUIS 앱

애플리케이션(앱)에 대한 정의를 참조하세요.

모델

(기계 학습) 모델은 입력 데이터에 대한 예측을 수행하는 함수입니다. LUIS에서 의도 분류자 및 엔터티 추출기를 일반적으로 "모델"이라고 지칭하며, 함께 학습, 게시 및 쿼리되는 모델 컬렉션을 "앱"으로 지칭합니다.

정규화된 값

목록 엔터티에 값을 추가합니다. 이러한 각 값에는 하나 이상의 동의어 목록이 있을 수 있습니다. 정규화된 값만 응답에 반환됩니다.

과잉 맞춤

과잉 맞춤은 모델이 특정 예제에 고정되어 있고 잘 일반화할 수 없는 경우에 발생합니다.

담당자

각 앱에는 앱을 만든 사람인 한 명의 소유자가 있습니다. 소유자는 Azure Portal에서 애플리케이션에 대한 권한을 관리합니다.

구문 목록

구문 목록에는 동일한 클래스에 속하고 비슷하게 처리되어야 하는 값(단어 또는 구문) 그룹이 포함된 기계 학습 기능의 특정 유형입니다(예: 도시 또는 제품의 이름).

미리 빌드된 모델

미리 빌드된 모델은 레이블이 지정된 예제와 함께 둘 다의 의도, 엔터티 또는 컬렉션입니다. 앱에 필요한 모델 개발 작업을 줄이기 위해 이러한 공통의 미리 빌드된 모델을 앱에 추가할 수 있습니다.

미리 빌드된 도메인

미리 빌드된 do기본는 홈 자동화(HomeAutomation) 또는 레스토랑 예약(RestaurantReservation)과 같은 특정 작업을 위해 구성된 LUIS 앱입니다기본. 의도, 발화 및 엔터티가 이 도메인에 구성됩니다.

미리 빌드된 엔터티

미리 빌드된 엔터티는 LUIS가 숫자, URL 및 전자 메일과 같은 일반적인 유형의 정보를 제공하는 엔터티입니다. 이러한 엔터티는 공용 데이터를 기반으로 생성됩니다. 미리 빌드된 엔터티를 독립 실행형 엔터티 또는 기능으로 엔터티에 추가하도록 선택할 수 있습니다.

미리 빌드된 의도

미리 빌드된 의도는 LUIS가 일반적인 유형의 정보를 제공하고 레이블이 지정된 고유한 예제 발화와 함께 제공되는 의도입니다.

예측

예측은 새 데이터(사용자 발화)를 사용하고 학습된 애플리케이션과 게시된 애플리케이션을 해당 데이터에 적용하여 발견된 의도 및 엔터티를 결정하는 Azure LUIS 예측 서비스에 대한 REST 요청입니다.

예측 키

예측 키는 Azure에서 만든 LUIS 서비스와 연결된 키이며 예측 엔드포인트 사용에 대한 권한을 부여합니다.

이 키는 작성 키가 아닙니다. 예측 엔드포인트 키가 있는 경우 작성 키 대신 엔드포인트 요청에 사용해야 합니다. LUIS 웹 사이트의 Azure 리소스 페이지 아래쪽에 있는 엔드포인트 URL 내에서 현재 예측 키를 볼 수 있습니다. 구독 키 이름/값 쌍의 값입니다.

예측 리소스

LUIS 예측 리소스는 Azure를 통해 사용할 수 있는 관리 가능한 항목입니다. 리소스는 Azure 서비스의 연결된 예측에 대한 액세스 권한입니다. 리소스에는 예측이 포함됩니다.

예측 리소스에는 Azure "종류"가 있습니다 LUIS.

예측 점수

점수는 0과 1의 숫자로, 특정 입력 발화가 특정 의도와 일치한다는 시스템이 얼마나 확신할 수 있는지를 측정합니다. 점수가 1에 가까울수록 시스템이 출력에 대해 매우 확신하고 점수가 0에 가까울수록 시스템은 입력이 특정 출력과 일치하지 않는다고 확신할 수 있습니다. 중간에 점수는 시스템이 결정을 내리는 방법을 매우 확신하지 못한다는 것을 의미합니다.

예를 들어 일부 고객 텍스트에 음식 주문이 포함되어 있는지 식별하는 데 사용되는 모델을 사용합니다. 그것은 "나는 하나의 커피를 주문하고 싶습니다"에 대한 1의 점수를 제공 할 수 있습니다 (시스템은 주문이라고 매우 확신) 및 점수 0에 대한 "우리 팀은 어젯밤 게임을 이겼다"(시스템은이 주문이 아니라고 매우 확신). 그리고 "차를 마시자"(이것이 주문인지 확실하지 않음)에 대해 0.5의 점수를 가질 수 있습니다.

프로그래밍 방식 키

작성 키로 이름이 바뀌었습니다.

게시

게시 는 스테이징 또는 프로덕션 엔드포인트에서 LUIS 활성 버전을 사용할 수 있도록 하는 것을 의미합니다.

할당량

LUIS 할당량은 Azure 구독 계층의 제한 사항입니다. LUIS 할당량은 초당 요청 수(HTTP 상태 429) 및 월별 총 요청 수(HTTP 상태 403)를 통해 제한할 수 있습니다.

스키마

스키마는 하위 엔터티와 함께 사용자의 의도 및 엔터티를 포함합니다. 스키마는 처음에 계획된 다음 시간이 지남에 따라 반복됩니다. 스키마에는 앱 설정, 기능 또는 발화 예제가 포함되지 않습니다.

감정 분석

감정 분석은 언어 서비스에서 제공되는 발화의 긍정적 또는 부정적 값을 제공합니다.

음성 초기화

음성 프라이밍은 음성 서비스를 사용하여 시나리오에서 일반적으로 사용되는 음성 및 구의 인식을 향상시킵니다. 음성 초기화 지원 애플리케이션의 경우 모든 LUIS 레이블이 지정된 예제는 이 특정 애플리케이션에 대한 사용자 지정된 음성 모델을 만들어 음성 인식 정확도를 향상시키는 데 사용됩니다. 예를 들어 체스 게임에서 사용자가 "기사 이동"이라고 말하면 "이동 야간"으로 해석되지 않는지 확인하려고 합니다. LUIS 앱에는 "knight"가 엔터티로 레이블이 지정된 예제가 포함되어야 합니다.

시작 키

LUIS를 처음 사용할 때 사용할 무료 키입니다.

동의어

LUIS 목록 엔터티에서 각각 동의어 목록을 포함할 수 있는 정규화된 값을 만들 수 있습니다. 예를 들어, 정규화된 값인 소, 중, 대 및 특대가 있는 크기 엔터티를 만든다고 가정합니다. 다음과 같이 각 값에 대한 동의어를 만들 수 있습니다.

비정규화된 값	동의어
소형	작은 하나, 8 온스
중간	일반, 12 온스
Large	big, 16 온스
Xtra large	가장 큰 것, 24 온스

이 모델은 입력에 동의어가 표시되면 엔터티의 정규화된 값을 반환합니다.

테스트

LUIS 앱 테스트는 모델 예측을 보는 것을 의미합니다.

표준 시간대 오프셋

엔드포인트에는 timezoneOffset이 포함됩니다. 이는 datetimeV2 미리 빌드된 엔터티에서 추가하거나 제거하려는 시간(분)입니다. 예를 들어, 발화가 “몇 시인가요?”인 경우 반환된 datetimeV2는 클라이언트 요청의 현재 시간입니다. 클라이언트 요청이 봇의 사용자와 동일하지 않은 봇 또는 다른 애플리케이션에서 들어오는 경우 봇과 사용자 간의 오프셋을 전달해야 합니다.

미리 빌드된 datetimeV2 엔터티의 변경 표준 시간대를 참조 하세요.

토큰

토큰은 LUIS에서 인식할 수 있는 가장 작은 텍스트 단위입니다. 이는 언어마다 약간 다릅니다.

영어의 경우 토큰은 문자와 숫자의 연속 범위(공백 또는 문장 부호 없음)입니다. 공백은 토큰이 아닙니다.

문구	토큰 수	설명
`Dog`	1	문장 부호나 공백이 없는 단일 단어입니다.
`RMT33W`	1	레코드 로케이터 번호입니다. 숫자와 문자가 있을 수 있지만 문장 부호는 없습니다.
`425-555-5555`	5	전화 번호입니다. 각 문장 부호도 하나의 토큰이므로 `425-555-5555`는 다음과 같이 5개의 토큰입니다. `425` `-` `555` `-` `5555`
`https://luis.ai`	7	`https` `:` `/` `/` `luis` `.` `ai`

트레인

학습 은 마지막 학습 이후의 활성 버전 변경 내용에 대해 LUIS에 교육하는 프로세스입니다.

학습 데이터

학습 데이터는 모델을 학습하는 데 필요한 정보 집합입니다. 여기에는 스키마, 레이블이 지정된 발화, 기능 및 애플리케이션 설정이 포함됩니다.

학습 오류

학습 오류는 해당 레이블과 일치하지 않는 학습 데이터에 대한 예측입니다.

발화

발화는 대화의 문장에 대한 짧은 텍스트인 사용자 입력입니다. "다음 화요일에 시애틀행 티켓 2장 예약"과 같은 자연어 구입니다. 예제 발화는 모델을 학습하기 위해 추가되고 모델은 런타임에 새 발화를 예측합니다.

버전

LUIS 버전은 LUIS 앱 ID 및 게시된 엔드포인트와 연결된 LUIS 애플리케이션의 특정 인스턴스입니다. 모든 LUIS 앱에는 하나 이상의 버전이 있습니다.

일반적인 어휘 및 개념의 언어 이해 용어집

활성 버전

활성 학습

애플리케이션(앱)

작성

작성 키

작성 리소스

테스트 일괄 처리

F 측정값

가음성(FN)

가양성(FP)

정밀도

재현율

진음성(TN)

진양성(TP)

분류자

협력자

기여자

설명자

도메인

엔드포인트

엔드포인트 작성

예측 엔드포인트

Entity

엔터티 추출기

엔터티 스키마

엔터티의 하위 엔터티

비 기계 학습 엔터티

목록 엔터티

정규식

미리 빌드된 엔터티

기능

필수 기능

Intent

레이블 지정 예제

의도에 대한 레이블 지정

엔터티에 대한 레이블 지정

LUIS 앱

모델

정규화된 값

과잉 맞춤

담당자

구문 목록

미리 빌드된 모델

미리 빌드된 도메인

미리 빌드된 엔터티

미리 빌드된 의도

예측

예측 키

예측 리소스

예측 점수

프로그래밍 방식 키

게시

할당량

스키마

감정 분석

음성 초기화

시작 키

동의어

테스트

표준 시간대 오프셋

토큰

트레인

학습 데이터

학습 오류

발화

버전

추가 리소스