Dil tanımlama modeliyle konuşulan dili otomatik olarak belirleme

Medya için Azure video Çözümleyicisi (eski adıyla Video Indexer) otomatik dil tanımlama 'yı (kapak) destekler, bu, okunan dil içeriğini sesten otomatik olarak tanımlama ve baskın tanımlanmış dilde kullanılacak medya dosyasını gönderme işlemidir.

Şu anda KAPAĞı şunları destekler: Ingilizce, Ispanyolca, Fransızca, Almanca, Italyanca, Mandarin Çince, Japonca, Rusça ve Portekizce (Brezilya).

Aşağıdaki kılavuz ve sınırlamalar bölümünü gözden geçirdiğinizden emin olun.

Dizin oluşturma sırasında otomatik dil tanımlamayı seçme

API 'yi kullanarak bir videoyu dizinleme veya yeniden dizinlerken , auto detect parametresindeki seçeneği belirleyin sourceLanguage .

Portalı kullanırken medya Için video Çözümleyicisi giriş sayfasında Hesap videolarınıza gidin ve yeniden dizinlemek istediğiniz videonun adının üzerine gelin. Sağ alt köşede yeniden dizin düğmesine tıklayın. Yeniden dizin videosu iletişim kutusunda, video kaynak dili açılır listesinden Otomatik Algıla ' yı seçin.

Otomatik Algıla

Model çıkışı

Medya için video Çözümleyicisi bu dilin güvenilirliği ise en olası dile göre videoyu bir daha sunun > 0.6 . Dil güvenle tanımlanamıyorsa, konuşulan dilin Ingilizce olduğunu varsayar.

Model baskın dil, Öngörüler JSON 'da öznitelik olarak kullanılabilir sourceLanguage (kök/videolar/Öngörüler altında). Karşılık gelen bir güven puanı özniteliği altında da kullanılabilir sourceLanguageConfidence .

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      },

Yönergeler ve sınırlamalar

  • Otomatik dil tanımlama (kapak) aşağıdaki dilleri destekler:

    İngilizce, Ispanyolca, Fransızca, Almanca, Italyanca, Mandarin, Japonca, Rusça ve Portekizce (Brezilya).

  • Medya için video Çözümleyicisi Arapça (modern standart ve Levantine), Hintçe ve Korece 'yi desteklese de, bu diller KAPAPLANDA desteklenmez.

  • Ses yukarıda desteklenen listeden farklı diller içeriyorsa sonuç beklenmedik olur.

  • Medya için video Çözümleyicisi yeterince yüksek güvenirlik () ile dili tanımlayamıyor >0.6 , geri dönüş dili İngilizce olur.

  • Karma diller ses içeren dosya için geçerli destek yoktur. Ses karışık diller içeriyorsa, sonuç beklenmedik olur.

  • Düşük kaliteli ses, model sonuçlarını etkileyebilir.

  • Model, sese en az bir dakikalık konuşma gerektirir.

  • Model, Spontaneous bir konuşmayı tanımak için tasarlanmıştır (ses komutları, Malama, vb.).

Sonraki adımlar