Utilisation du codec audio vocal Windows Media

Le codec Windows Media Audio Voice fournit une compression à faible débit binaire optimisée pour l’audio contenant la voix. La capacité du codec à produire de si petits échantillons est due à la plage de fréquences limitée des sons de la voix humaine. Cette optimisation signifie qu’un encodeur vocal dédié crée une sortie de mauvaise qualité pour le contenu qui contient des sons plus complexes, comme de la musique. Toutefois, le codec Windows Media Audio Voice compense ce problème de qualité potentiel en fournissant des modes distincts pour la voix, la musique et le contenu mixte. Le codec analyse le contenu mixte pour déterminer le mode à utiliser pour chaque partie du fichier.

Le codec Windows Media Audio Voice est implémenté dans l’objet d’encodeur identifié par l’identificateur de classe CLSID_CWMSPEncMediaObject2 et dans l’objet décodeur identifié par l’identificateur de classe CLSID_CWMSPDecMediaObject. La balise de format des types de médias utilisant ce codec est 0x00A.

Configuration de l’encodeur

L’encodeur vocal prend en charge trois modes : voix, musique et mixte. Chaque mode est optimisé pour obtenir les meilleurs résultats pour ce type de contenu. Vous pouvez configurer le mode de l’encodeur vocal à l’aide des méthodes de IPropertyStore pour définir la propriété MFPKEY_WMAVOICE_ENC_MusicSpeechClassMode .

Lorsqu’il est configuré pour le contenu mixte, le codec Windows Media Audio Voice détecte automatiquement les passages de musique dans le contenu. Si vous n’êtes pas satisfait des résultats, vous pouvez spécifier l’emplacement de la musique dans le contenu à l’aide d’une liste de décision d’édition (EDL). Pour plus d’informations, consultez Utilisation d’une liste de décisions d’édition pour l’encodage de la voix.

Contrairement aux autres encodeurs audio, vous pouvez définir la valeur de la fenêtre de mémoire tampon pour le contenu vocal à l’aide de la propriété MFPKEY_WMAVOICE_ENC_BufferWindow . Toutefois, les valeurs par défaut doivent fonctionner correctement dans la plupart des cas.

Notes

   Lors de la configuration de l’encodeur vocal, il est très important de définir le type de sortie avant de définir le type d’entrée. Il s’agit de l’ordre d’opérations recommandé pour tous les codecs audio, mais l’encodeur vocal peut signaler des types de sortie erronés si une entrée est définie lorsque vous appelez IMediaObject::GetOutputType ou IMFTransform::GetOutputType.

 

Décodage

Il n’existe aucune exigence particulière pour décoder l’audio vocal. Pour plus d’informations, consultez Configuration du décodage audio.

Utilisation de l’audio