バッチ文字起こしとは

[アーティクル]
01/18/2024

重要

新しい価格は、Speech to text REST API v3.2 を使用したバッチ文字起こしに対して有効です。詳細については、価格ガイドを参照してください。

バッチ文字起こしは、ストレージ内の大量のオーディオデータを文字起こしする場合に使用されます。音声テキスト変換 REST API と Speech CLI の両方で、バッチ文字起こしがサポートされています。

要求ごとに複数のファイルを提供するか、文字起こしするオーディオファイルを含む Azure Blob Storage コンテナーをポイントする必要があります。バッチ文字起こしサービスでは、送信された多数の文字起こしを処理できます。サービスによってファイルが同時に文字起こしされ、ターンアラウンド時間が短縮されます。

それはどのように機能するのでしょうか。

バッチ文字起こしでは、オーディオデータを送信し、文字起こしの結果を非同期的に取得します。サービスではオーディオデータを文字起こしし、その結果をストレージコンテナーに格納します。その後、ストレージコンテナーから結果を取得できます。

ヒント

ローまたはノーコードのソリューションの場合は、Power Automate、Power Apps、Logic Apps などの Power Platform アプリケーションでバッチ音声テキスト変換コネクタを使用できます。開始するには、「Power でバッチ文字起こしを自動化する」ガイドを参照してください。

バッチ文字起こし REST API を使用するには:

バッチ文字起こし用のオーディオファイルを検索する - 独自のデータをアップロードするか、パブリック URI または Shared Access Signature (SAS) URI を使用して既存のオーディオファイルを使用できます。
バッチ文字起こしを作成する - オーディオファイル、文字起こし言語、文字起こしモデルなどのパラメーターを使用して文字起こしジョブを送信します。
バッチ文字起こしの結果を取得する - 文字起こしの状態を確認し、文字起こしの結果を非同期で取得します。

重要

バッチ文字起こしジョブは、ベストエフォートの原則でスケジュールされます。ピークの時間帯には、文字起こしジョブの処理が開始されるまでに最大 30 分以上かかることもあります。バッチ文字起こしジョブの現在の状態を確認する方法については、こちらのセクションを参照してください。

バッチ文字起こしとは

それはどのように機能するのでしょうか。

次のステップ

その他のリソース