Share via


언어 식별 모델을 사용하여 음성 언어 자동 식별

Important

Azure Media Services 사용 중지 발표인해 Azure AI Video Indexer는 Azure AI Video Indexer 기능 조정을 발표합니다. AZURE AI Video Indexer 계정에 대한 의미를 이해하려면 AMS(Azure Media Service) 사용 중지와 관련된 변경 내용을 참조하세요. AMS 사용 중지 준비: VI 업데이트 및 마이그레이션 가이드를 참조하세요.

Azure AI Video Indexer는 오디오 콘텐츠에서 음성 언어를 자동으로 식별하는 프로세스인 자동 LID(언어 식별)를 지원합니다. 미디어 파일은 기본 식별 언어로 전사됩니다.

지원되는 언어의 Azure AI Video Indexer 언어에서 지원되는 목록을 참조하세요.

지침 및 제한 사항 섹션을 검토해야 합니다.

인덱싱할 때 자동 언어 식별 선택

API를 사용하여 비디오를 인덱싱하거나 다시 인덱싱할 때 sourceLanguage 매개 변수에서auto detect 옵션을 선택합니다.

포털을 사용하는 경우 Azure AI Video Indexer 홈페이지의 계정 비디오로 이동하여 다시 인덱싱하려는 비디오의 이름을 마우스로 가리킵니다. 오른쪽 아래 모서리에서 다시 인덱싱 단추를 선택합니다. 비디오 다시 인덱싱 대화 상자의 비디오 원본 언어 드롭다운 상자에서 자동 검색을 선택합니다.

자동 검색을 선택할 위치를 보여 주는 스크린샷

모델 출력

Azure AI Video Indexer는 해당 언어에 대한 신뢰도가 > 0.6인 경우 가장 가능성이 높은 언어에 따라 비디오를 전사합니다. 언어를 확실하게 식별할 수 없는 경우 Video Indexer는 음성 언어를 영어로 가정합니다.

모델 주요 언어는 인사이트 JSON에서 sourceLanguage 특성(루트/비디오/인사이트 아래)으로 사용할 수 있습니다. 해당 신뢰도 점수는 sourceLanguageConfidence 특성에서 사용할 수도 있습니다.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

지침 및 제한 사항

LID(자동 언어 식별)는 다음 언어를 지원합니다.

지원되는 언어의 Azure AI Video Indexer 언어에서 지원되는 목록을 참조하세요.

  • 오디오에 지원되는 목록 이외의 언어가 포함된 경우 예기치 못한 결과가 발생합니다.
  • Azure AI Video Indexer가 충분히 높은 신뢰도(0.6보다 큼)로 언어를 식별할 수 없는 경우 대체 언어는 영어입니다.
  • 현재 혼합 언어 오디오를 사용하는 파일에 대한 지원은 없습니다. 오디오에 혼합된 언어가 포함되어 있으면 예기치 않은 결과가 발생합니다.
  • 저품질 오디오는 모델 결과에 영향을 미칠 수 있습니다.
  • 모델에는 오디오에서 1분 이상의 음성이 필요합니다.
  • 이 모델은 자연스러운 대화 음성(음성 명령, 노래 등이 아님)을 인식하도록 설계되었습니다.