Custom Speech とはWhat is Custom Speech?

Custom Speech は、ご利用のアプリケーション、ツール、製品に使用する Microsoft の音声テキスト変換の正確性を評価して改善することのできる一連のオンライン ツールです。Custom Speech is a set of online tools that allow you to evaluate and improve Microsoft's speech-to-text accuracy for your applications, tools, and products. 作業を始めるにあたって必要なのは、少数のテスト オーディオ ファイルだけです。All it takes to get started are a handful of test audio files. 以下のリンクに従って、カスタム音声テキスト変換エクスペリエンスの作成を開始しましょう。Follow the links below to start creating a custom speech-to-text experience.

Custom Speech の内容What's in Custom Speech?

Custom Speech で何らかの操作を行うには、Azure アカウントと音声サービスのサブスクリプションが必要です。Before you can do anything with Custom Speech, you'll need an Azure account and a Speech service subscription. アカウントの取得後、データの準備、モデルのトレーニングとテスト、認識品質の調査、正確性の評価を行い、最後にそのカスタム音声テキスト変換モデルをデプロイして使用することができます。Once you've got an account, you can prep your data, train and test your models, inspect recognition quality, evaluate accuracy, and ultimately deploy and use the custom speech-to-text model.

この図は、Custom Speech ポータルを構成する諸要素を示しています。This diagram highlights the pieces that make up the Custom Speech portal. それぞれのステップの詳細については、下のリンクを使用してください。Use the links below to learn more about each step.

Custom Speech ポータルを構成するさまざまな要素を示した図。

  1. サブスクライブしてプロジェクトを作成する - Azure アカウントを作成し、音声サービスをサブスクライブします。Subscribe and create a project - Create an Azure account and subscribe to the Speech service. この統合されたサブスクリプションにより、音声テキスト変換、テキスト読み上げ、音声翻訳、および Custom Speech ポータルにアクセスできるようになります。This unified subscription gives you access to speech-to-text, text-to-speech, speech translation, and the Custom Speech portal. その後、音声サービス サブスクリプションを使用して、初めての Custom Speech プロジェクトを作成します。Then, using your Speech service subscription, create your first Custom Speech project.

  2. テスト データをアップロードする - テスト データ (オーディオ ファイル) をアップロードして、ご利用のアプリケーション、ツール、製品に使用する Microsoft の音声テキスト変換プランを評価します。Upload test data - Upload test data (audio files) to evaluate Microsoft's speech-to-text offering for your applications, tools, and products.

  3. 認識品質を調査する - Custom Speech ポータルを使用して、アップロードした音声を再生し、テスト データの音声認識品質を調査します。Inspect recognition quality - Use the Custom Speech portal to play back uploaded audio and inspect the speech recognition quality of your test data. 定量的な測定については、データの調査に関するページを参照してください。For quantitative measurements, see Inspect data.

  4. 正確性を評価する - 音声テキスト変換モデルの正確性を評価します。Evaluate accuracy - Evaluate the accuracy of the speech-to-text model. さらにトレーニングが必要であるかどうかは、Custom Speech ポータルで得られる "ワード エラー率" を使用して判断できます。The Custom Speech portal will provide a Word Error Rate, which can be used to determine if additional training is required. 正確性に問題がなければ、音声サービスの API を直接使用できます。If you're satisfied with the accuracy, you can use the Speech service APIs directly. 相対平均で 5% から 20% 正確性を高めたい場合、ポータルの [トレーニング] タブを使用して、追加のトレーニング データ (人間がラベル付けしたトランスクリプトと関連テキストなど) をアップロードします。If you'd like to improve accuracy by a relative average of 5% - 20%, use the Training tab in the portal to upload additional training data, such as human-labeled transcripts and related text.

  5. モデルをトレーニングする - ご自分の音声テスト データと一緒に、文書化されたトランスクリプト (10 から 1,000 時間) と関連テキスト (200 MB 未満) を入力することにより、音声テキスト変換モデルの正確性を高めます。Train the model - Improve the accuracy of your speech-to-text model by providing written transcripts (10-1,000 hours) and related text (<200 MB) along with your audio test data. このデータが音声テキスト変換モデルのトレーニングに役立てられます。This data helps to train the speech-to-text model. トレーニング後、再テストを行い、その結果に問題がなければ、モデルをデプロイすることができます。After training, retest, and if you're satisfied with the result, you can deploy your model.

  6. モデルをデプロイする - 音声テキスト変換モデルのカスタム エンドポイントを作成し、それを自分のアプリケーション、ツール、製品で使用します。Deploy the model - Create a custom endpoint for your speech-to-text model and use it in your applications, tools, or products.

Azure アカウントの設定Set up your Azure account

Custom Speech ポータルを使用してカスタム モデルを作成するには、音声サービス サブスクリプションが必要です。A Speech service subscription is required before you can use the Custom Speech portal to create a custom model. 次の手順に従って、標準的な音声サービス サブスクリプションを作成してください:Speech サブスクリプションの作成Follow these instructions to create a standard Speech service subscription: Create a Speech Subscription.

注意

必ず Standard (S0) サブスクリプションを作成してください。無料試用版 (F0) サブスクリプションはサポートされません。Please be sure to create standard (S0) subscriptions, free trial (F0) subscriptions are not supported.

Azure アカウントと音声サービス サブスクリプションを作成したら、Custom Speech ポータルにサインインして、ご利用のサブスクリプションを接続する必要があります。Once you've created an Azure account and a Speech service subscription, you'll need to sign in to Custom Speech portal and connect your subscription.

  1. Azure portal から音声サービス サブスクリプション キーを取得します。Get your Speech service subscription key from the Azure portal.
  2. Custom Speech ポータルにサインインします。Sign-in to the Custom Speech portal.
  3. 作業に必要なサブスクリプションを選択し、音声プロジェクトを作成します。Select the subscription you need to work on and create a speech project.
  4. ご利用のサブスクリプションに変更を加えたい場合は、上部のナビゲーションにある歯車アイコンを使用します。If you'd like to modify your subscription, use the cog icon located in the top navigation.

プロジェクトを作成する方法How to create a project

データ、モデル、テスト、エンドポイントなどのコンテンツは、Custom Speech ポータル[プロジェクト] にまとめられます。Content like data, models, tests, and endpoints are organized into Projects in the Custom Speech portal. プロジェクトは、ドメインと国および言語ごとに作成されます。Each project is specific to a domain and country/language. たとえば、米国の英語を使用するコール センターのプロジェクトを作成することが考えられます。For example, you may create a project for call centers that use English in the United States.

初めてのプロジェクトを作成するには、 [音声テキスト変換/Custom Speech] を選択し、 [新しいプロジェクト] をクリックします。To create your first project, select the Speech-to-text/Custom speech, then click New Project. ウィザードの手順に従ってプロジェクトを作成します。Follow the instructions provided by the wizard to create your project. プロジェクトの作成後、4 つのタブが表示されます ( [データ][テスト中][トレーニング][デプロイ] )。After you've created a project, you should see four tabs: Data, Testing, Training, and Deployment. それぞれのタブの使い方については、「次の手順」に記載のリンクを使用してください。Use the links provided in Next steps to learn how to use each tab.

重要

Custom Speech ポータルは最近更新されました。The Custom Speech portal was recently updated! CRIS.ai ポータルで、または API を使用して以前のデータ、モデル、テスト、および公開されたエンドポイントを作成した場合は、新しいポータルで新しいプロジェクトを作成して、これらの古いエンティティに接続する必要があります。If you created previous data, models, tests, and published endpoints in the CRIS.ai portal or with APIs, you need to create a new project in the new portal to connect to these old entities.

次のステップNext steps