Windows Media Audio Voice Codec の使用

Windows Media Audio Voice コーデックは、音声を含むオーディオ用に最適化された低ビットレートの圧縮を提供します。 このような小さなサンプルを生成するコーデックの能力は、人間の声の音の限られた周波数範囲によるものです。 この最適化は、専用の音声エンコーダーが、音楽などのより複雑なサウンドを含むコンテンツに対して低品質の出力を作成することを意味します。 ただし、Windows Media Audio Voice コーデックは、音声、音楽、混合コンテンツに個別のモードを提供することで、この潜在的な品質の問題を補います。 コーデックは、混合コンテンツを分析して、ファイルの各部分に使用するモードを決定します。

Windows Media Audio Voice コーデックは、クラス識別子CLSID_CWMSPEncMediaObject2で識別されるエンコーダー オブジェクトと、クラス識別子によって識別されるデコーダー オブジェクトCLSID_CWMSPDecMediaObjectに実装されます。 このコーデックを使用するメディアタイプのフォーマットタグは0x00A。

エンコーダーの構成

音声エンコーダーでは、音声、音楽、混合の 3 つのモードがサポートされています。 各モードは、その種類のコンテンツに最適な結果を得るために最適化されています。 IPropertyStore のメソッドを使用して、MFPKEY_WMAVOICE_ENC_MusicSpeechClassMode プロパティを設定することで、音声エンコーダーのモードを構成できます。

混合コンテンツ用に構成されている場合、Windows Media Audio Voice コーデックはコンテンツ内の音楽の通過を自動的に検出します。 結果に満足できない場合は、編集決定リスト (EDL) を使用して、コンテンツ内の音楽の場所を指定できます。 詳細については、「 音声のエンコードに編集デシジョン リストを使用する」を参照してください。

他のオーディオ エンコーダーとは異なり、 MFPKEY_WMAVOICE_ENC_BufferWindow プロパティを使用して、音声コンテンツのバッファー ウィンドウの値を設定できます。 ただし、ほとんどの場合、既定値は正常に動作します。

注意

   音声エンコーダーを構成するときは、入力の種類を設定する前に出力の種類を設定することが非常に重要です。 これはすべてのオーディオ コーデックで推奨される操作順序ですが、 IMediaObject::GetOutputType または IMFTransform::GetOutputType を呼び出すときに入力が設定されている場合、音声エンコーダーは誤った出力の種類を報告する可能性があります。

 

デコード

音声オーディオをデコードするための特別な要件はありません。 詳細については、「 オーディオ デコードの構成」を参照してください。

オーディオの操作