Share via


Azure AI Video Indexer로 언어 모델 사용자 지정

Important

Azure Media Services 사용 중지 발표인해 Azure AI Video Indexer는 Azure AI Video Indexer 기능 조정을 발표합니다. AZURE AI Video Indexer 계정에 대한 의미를 이해하려면 AMS(Azure Media Service) 사용 중지와 관련된 변경 내용을 참조하세요. AMS 사용 중지 준비: VI 업데이트 및 마이그레이션 가이드를 참조하세요.

Azure AI Video Indexer는 Microsoft Custom Speech Service와 통합을 통해 자동 음성 인식을 지원합니다. 적응 텍스트를 업로드하여 언어 모델을 사용자 지정할 수 있습니다. 이 텍스트는 엔진이 적응하는 데 사용할 어휘를 사용하는 do기본에서 가져온 것입니다. 모델을 학습하면 기본 발음을 가정하여 적응 텍스트에 나타나는 새 단어가 인식되고 언어 모델은 새로운 가능한 단어 시퀀스를 학습합니다. 지원되는 언어의 Azure AI Video Indexer 언어에서 지원되는 목록을 참조하세요.

예를 들어 Azure Kubernetes 서비스의 컨텍스트에서 "Kubernetes" 는 매우 구체적인 단어입니다. 해당 단어는 Azure AI Video Indexer에 처음 사용되므로 "커뮤니티"로 인식됩니다. 모델을 "Kubernetes"로 인식하려면 모델을 학습시켜야 합니다. 다른 경우에는 단어가 존재하지만 언어 모델에서는 해당 단어가 특정 컨텍스트에 나타날 것으로 예상하지 않습니다. 예를 들어, "컨테이너 서비스"는 특수화되지 않은 언어 모델이 특정 단어 세트로 인식하는 2단어 시퀀스가 아닙니다.

언어 모델을 사용자 지정하는 방법에는 다음 두 가지가 있습니다.

  • 옵션 1: Azure AI Video Indexer에서 생성된 대본을 편집합니다. 대본을 편집하고 수정함으로써 향후 향상된 결과를 제공할 수 있도록 언어 모델을 학습시키는 것입니다.
  • 옵션 2: 텍스트 파일을 업로드하여 언어 모델을 학습시킵니다. 업로드 파일에는 Video Indexer 대본에 표시하려는 단어 목록이나 문장과 단락에 자연스럽게 포함된 관련 단어가 포함될 수 있습니다. 후자의 접근 방식을 사용하면 더 나은 결과를 얻을 수 있으므로 업로드 파일에 콘텐츠와 관련된 전체 문장이나 단락을 포함하는 것이 좋습니다.

Important

현재 잘못 표기된 단어나 문장(예: "커뮤니티")을 업로드 파일에 포함하지 마세요. 이렇게 하면 의도한 효과가 무효화됩니다. 표시하려는 단어만 포함하세요(예: "Kubernetes").

사용자 지정 언어 모델에 대한 모범 사례

Azure AI Video Indexer는 단어 조합의 가능성을 기반으로 학습하므로 가장 잘 학습합니다.

  • 문장을 말할 때 충분히 실제적인 문장의 예제를 제공하세요.
  • 한 줄에 한 문장만 넣으세요. 그렇지 않으면 시스템이 문장 전체에서 가능성을 학습합니다.
  • 한 단어를 문장으로 넣어 다른 단어보다 강조할 수 있지만, 시스템은 전체 문장에서 가장 잘 학습합니다.
  • 새 단어나 약어를 도입할 때 가능하면 전체 문장에서 많은 사용 예제를 제공하여 가능한 한 많은 컨텍스트를 시스템에 제공하세요.
  • 여러 가지 적응 옵션을 넣고 이러한 옵션의 작동 방식을 확인해 보세요.
  • 정확히 동일한 문장을 여러 번 반복하지 마세요. 나머지 입력에 대한 바이어스가 생길 수 있습니다.
  • 일반적이지 않은 기호(~, # @ % &)를 포함하지 마세요카드. 해당 기호가 나타나는 문장도 삭제됩니다.
  • 수십만 개의 문장과 같이 너무 많은 입력을 넣지 마세요. 이렇게 하면 강조 효과가 약화됩니다.