モデルとエンドポイントのライフサイクルModel and endpoint lifecycle

標準 (カスタマイズされていない) 音声は、基本モデルと呼ばれる AI モデルに基づいて構築されています。Our standard (not customized) speech is built upon AI models that we call base models. ほとんどの場合、サポートされている音声言語ごとに異なる基本モデルをトレーニングしています。In most cases, we train a different base model for each spoken language we support. 音声サービスは、精度と品質を向上させるために、数か月ごとに新しい基本モデルを使用して更新されています。We update the speech service with new base models every few months to improve accuracy and quality.
Custom Speech の場合、カスタム モデルは選択した基本モデルを特定の顧客シナリオからのデータに合わせて適応させることで作成されます。With Custom Speech, custom models are created by adapting a chosen base model with data from your particular customer scenario. カスタム モデルを作成すると、そのモデルが適応された対応する基本モデルが標準の音声サービスで更新された場合でも、そのモデルは更新または変更されることはありません。Once you create a custom model, that model will not be updated or changed, even if the corresponding base model from which it was adapted gets updated in the standard speech service.
このポリシーにより、ユーザーはニーズに合ったカスタム モデルを作成できたら、その特定のカスタム モデルを長期間使用し続けることができます。This policy allows you to keep using a particular custom model for a long time after you have a custom model that meets your needs. ただし、カスタム モデルを定期的に再作成して、最新の基本モデルを適応させ、精度と品質の向上を活用できるようにすることをお勧めします。But we recommend that you periodically recreate your custom model so you can adapt from the latest base model to take advantage of the improved accuracy and quality.

モデルのライフサイクルに関しては、他に次のような用語が重要です。Other key terms related to the model lifecycle include:

  • 適応: 基本モデルを選択し、テキスト データやオーディオ データを使用して、ドメインやシナリオに合わせてカスタマイズすることAdaptation: Taking a base model and customizing it to your domain/scenario by using text data and/or audio data.
  • デコード: モデルを使用して音声認識を実行すること (音声をテキストにデコードする)Decoding: Using a model and performing speech recognition (decoding audio into text).
  • エンドポイント: 特定のユーザー "のみ" がアクセスできる、基本モデルまたはカスタム モデルのユーザー固有のデプロイ。Endpoint: A user-specific deployment of either a base model or a custom model that's accessible only to a given user.

有効期限のタイムラインExpiration timeline

新しいモデルや新機能が利用可能になると、古くて正確さが低下したモデルは廃止されます。モデルとエンドポイントの有効期限については、次のタイムラインを参照してください。As new models and new functionality become available and older, less accurate models are retired, see the following timelines for model and endpoint expiration:

基本モデルBase models

  • 適応: 1 年間使用できます。Adaptation: Available for one year. モデルがインポートされたら、カスタム モデルを作成するために 1 年間使用できます。After the model is imported, it's available for one year to create custom models. 1 年後には、より新しいバージョンの基本モデルから新しいカスタム モデルを作成する必要があります。After one year, new custom models must be created from a newer base model version.
  • デコード: インポートの後で 2 年間使用できます。Decoding: Available for two years after import. したがって、このモデルで 2 年間はエンドポイントを作成し、バッチ トランスクリプトを使用することができます。So you can create an endpoint and use batch transcription for two years with this model.
  • エンドポイント:デコードと同じタイムラインで使用できます。Endpoints: Available on the same timeline as decoding.

カスタム モデルCustom models

  • デコード: モデルが作成されてから 2 年間使用できます。Decoding: Available for two years after the model is created. したがって、カスタム モデルを作成してから 2 年間 (バッチ、リアルタイム、テスト) 使用することができます。So you can use the custom model for two years (batch/realtime/testing) after it's created. 2 年後には、通常、基本モデルが適合に非推奨になっているため、"モデルを再トレーニングする必要があります"。After two years, you should retrain your model because the base model will usually have been deprecated for adaptation.
  • エンドポイント:デコードと同じタイムラインで使用できます。Endpoints: Available on the same timeline as decoding.

基本モデルまたはカスタム モデルいずれかの有効期限が切れると、常に 最新バージョンの基本モデル にフォールバックします。When either a base model or custom model expires, it will always fall back to the newest base model version. このため、実装が中断されることはありませんが、カスタム モデルの有効期限が切れると、"特定のデータ" に対して精度が低下する可能性があります。So your implementation will never break, but it might become less accurate for your specific data if custom models reach expiration. モデルの有効期限は、Speech Studio の Custom Speech エリアの次の場所で確認できます。You can see the expiration for a model in the following places in the Custom Speech area of the Speech Studio:

  • モデルのトレーニングの概要Model training summary
  • モデルのトレーニングの詳細Model training detail
  • デプロイの概要Deployment summary
  • デプロイの詳細Deployment detail

モデルのトレーニングの概要からの例を示します。Here is an example form the model training summary:

モデルのトレーニングの概要 モデルのトレーニングの詳細ページからの例も示します。Model training summary And also from the model training detail page:

モデルのトレーニングの詳細

また、GetModel または GetBaseModel Custom Speech API を使用し、JSON 応答の deprecationDates プロパティで、有効期限を確認することもできます。You can also check the expiration dates via the GetModel and GetBaseModel custom speech APIs under the deprecationDates property in the JSON response.

GetModel API 呼び出しの有効期限データの例を次に示します。Here is an example of the expiration data from the GetModel API call. DEPRECATIONDATES は、モデルの有効期限が切れたときに表示されます。The DEPRECATIONDATES show when the model expires:

{
    "SELF": "HTTPS://WESTUS2.API.COGNITIVE.MICROSOFT.COM/SPEECHTOTEXT/V3.0/MODELS/{id}",
    "BASEMODEL": {
    "SELF": HTTPS://WESTUS2.API.COGNITIVE.MICROSOFT.COM/SPEECHTOTEXT/V3.0/MODELS/BASE/{id}
    },
    "DATASETS": [
    {
        "SELF": https://westus2.api.cognitive.microsoft.com/speechtotext/v3.0/datasets/{id}
    }
    ],
    "LINKS": {
    "MANIFEST": "HTTPS://WESTUS2.API.COGNITIVE.MICROSOFT.COM/SPEECHTOTEXT/V3.0/MODELS/{id}/MANIFEST",
    "COPYTO": https://westus2.api.cognitive.microsoft.com/speechtotext/v3.0/models/{id}/copyto
    },
    "PROJECT": {
        "SELF": https://westus2.api.cognitive.microsoft.com/speechtotext/v3.0/projects/{id}
    },
    "PROPERTIES": {
    "DEPRECATIONDATES": {
        "ADAPTATIONDATETIME": "2022-01-15T00:00:00Z",     // last date the base model can be used for adaptation
        "TRANSCRIPTIONDATETIME": "2023-03-01T21:27:29Z"   // last date this model can be used for decoding
    }
    },
    "LASTACTIONDATETIME": "2021-03-01T21:27:40Z",
    "STATUS": "SUCCEEDED",
    "CREATEDDATETIME": "2021-03-01T21:27:29Z",
    "LOCALE": "EN-US",
    "DISPLAYNAME": "EXAMPLE MODEL",
    "DESCRIPTION": "",
    "CUSTOMPROPERTIES": {
    "PORTALAPIVERSION": "3"
    }
}

Speech Studio のデプロイ セクションで、または Custom Speech API を使用して、エンドポイントで使用されているモデルを変更することにより、ダウンタイムなしで Custom Speech エンドポイントのモデルをアップグレードできます。Note that you can upgrade the model on a custom speech endpoint without downtime by changing the model used by the endpoint in the deployment section of the Speech Studio, or via the custom speech API.

モデルの有効期限が切れたときの動作と更新方法What happens when models expire and how to update them

モデルの有効期限が切れた場合の動作とモデルの更新方法は、その使用方法によって異なります。What happens when a model expires and how to update the model depends on how it is being used.

バッチ文字起こしBatch transcription

バッチ文字起こしで使用されるモデルの有効期限が切れた場合、要求は 4xx エラーで失敗します。If a model expires that is used with batch transcription transcription requests will fail with a 4xx error. これを防ぐには、文字起こしの作成 要求の本文で送信される JSON の model パラメーターを更新して、より新しい基本モデルまたはより新しいカスタム モデルを指すようにします。To prevent this update the model parameter in the JSON sent in the Create Transcription request body to either point to a more recent base model or more recent custom model. JSON から model エントリを削除すると、常に最新の基本モデルを使用することもできます。You can also remove the model entry from the JSON to always use the latest base model.

カスタム音声エンドポイントCustom speech endpoint

カスタム音声エンドポイントで使用されるモデルの有効期限が切れると、サービスは使用している言語の最新の基本モデルを使用するように自動的にフォールバックします。If a model expires that is used by a custom speech endpoint, then the service will automatically fall back to using the latest base model for the language you are using. ページ上部にある [Custom Speech] メニューの [配置] を選択してエンドポイント名をクリックすると、その詳細を表示できます。, you are using you can select Deployment in the Custom Speech menu at the top of the page and then click on the endpoint name to see its details. 詳細ページの上部には、このエンドポイントで使用するモデルをダウンタイムなしでシームレスに更新できる [モデルの更新] ボタンが表示されます。At the top of the details page, you will see an Update Model button that lets you seamlessly update the model used by this endpoint without downtime. この変更は、Update Model Rest API を使用してプログラムで行うこともできます。You can also make this change programmatically by using the Update Model Rest API.

次のステップNext steps

その他のリソースAdditional resources