Жизненный цикл модели Пользовательского распознавания речи

Вы можете использовать модель Пользовательского распознавания речи в течение некоторого времени после развертывания в пользовательской конечной точке. Но когда новые базовые модели становятся доступными, срок действия старых моделей истекает. Вам придется периодически повторно создавать и обучать пользовательскую модель на основе последней версии базовой модели, чтобы пользоваться преимуществами более высокой точности и качества.

Ниже приведены некоторые ключевые термины, связанные с жизненным циклом модели:

  • Обучение: создание базовой модели и ее настройка в домене или сценарии с помощью текстовых данных и (или) аудиоданных. В некоторых контекстах, таких как свойства REST API, обучение также называется адаптацией.
  • Транскрибирование: использование модели для распознавания речи (декодирование звука в текст).
  • Конечная точка: конкретное развертывание базовой или пользовательской модели, доступ к которому есть только у вас.

Период действия

Ниже приведены временные шкалы для адаптации модели и истечения срока действия транскрибирования:

  • Обучение доступно в течение одного года по истечении квартала, когда базовая модель была создана корпорацией Майкрософт.
  • Транскрибирование с базовой моделью доступно в течение двух лет по истечении квартала, когда базовая модель была создана корпорацией Майкрософт.
  • Транскрибирование с пользовательской моделью доступно в течение двух лет по истечении квартала, когда была создана пользовательская модель.

В этом контексте кварталы заканчиваются 15 января, 15 апреля, 15 июля и 15 октября.

Что делать при истечении срока действия модели

После истечения срока действия пользовательской или базовой модели она больше не доступна для транскрибирования. Вы можете изменить модель, которую применяет конечная точка Пользовательского распознавания речи, без какого-либо простоя.

Маршрут транскрибирования Результат модели с истекшим сроком действия Рекомендация
Пользовательская конечная точка Запросы распознавания речи будут направляться к последней базовой модели для того же языкового стандарта. Вы получите результаты, но точность данных вашей предметной области, полученных в результате распознавания, может быть невысокой. Обновите модель конечной точки, как описано в руководстве по Развертыванию модели Пользовательского распознавания речи.
Пакетное транскрибирование Запросы пакетного транскрибирования для моделей с истекшим сроком действия завершаются ошибкой 4xx. В каждом тексте запроса REST API CreateTranscription задайте для свойства model базовую модель или пользовательскую модель, срок действия которой еще не истек. В противном случае не указывайте свойство model, чтобы всегда использовать последнюю базовую модель.

Получение дат окончания срока действия базовой модели

Последняя дата возможного использования базовой модели для обучения отображалась при создании пользовательской модели. Дополнительные сведения см. в разделе Обучение модели Пользовательского распознавания речи.

Чтобы получить дату окончания срока действия транскрибирования для базовой модели, выполните следующие действия:

  1. Войдите в службу Speech Studio.

  2. Выберите Пользовательское распознавание речи> имя вашего проекта >Развертывание моделей.

  3. Дата окончания срока действия модели отображается в столбце Срок действия. Это последняя дата, в которую вы можете использовать модель для транскрибирования.

    Screenshot of the deploy models page that shows the transcription expiration date.

Чтобы получить даты окончания срока действия обучения и транскрибирования для базовой модели, используйте команду spx csr model status. Создайте параметры запроса в соответствии со следующими инструкциями:

  • В качестве значения параметра url укажите URI базовой модели, которую нужно получить. Для получения доступных базовых моделей для всех языковых стандартов можно выполнить команду spx csr list --base.

Ниже приведен пример команды CLI службы "Речь", которая позволяет получить даты окончания срока действия обучения и транскрибирования для базовой модели:

spx csr model status --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

Запишите дату, указанную в свойстве adaptationDateTime полученного ответа. Это последняя дата, когда вы можете использовать базовую модель для обучения. Также запишите дату, указанную в свойстве transcriptionDateTime. Это последняя дата, в которую вы можете использовать базовую модель для транскрибирования.

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Для получения справки по командам CLI службы "Речь" для работы с моделями выполните следующую команду:

spx help csr model

Чтобы получить даты окончания срока действия обучения и транскрибирования для базовой модели, используйте операцию GetBaseModelREST API преобразования речи в текст версии 3.0. Вы можете создать запрос GetBaseModels, чтобы получить доступные базовые модели для всех языковых стандартов.

Выполните HTTP-запрос GET с использованием URI модели, как показано в следующем примере. Замените BaseModelId на идентификатор модели, YourSubscriptionKey на ключ ресурса службы "Речь" и YourServiceRegion на регион ресурса службы "Речь".

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Запишите дату, указанную в свойстве adaptationDateTime полученного ответа. Это последняя дата, когда вы можете использовать базовую модель для обучения. Также запишите дату, указанную в свойстве transcriptionDateTime. Это последняя дата, в которую вы можете использовать базовую модель для транскрибирования.

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Получение дат окончания срока действия пользовательской модели

Чтобы получить дату окончания срока действия транскрибирования для пользовательской модели, выполните следующие действия:

  1. Войдите в службу Speech Studio.

  2. Выберите Пользовательское распознавание речи> Название вашего проекта >Обучение пользовательских моделей.

  3. Дата окончания срока действия пользовательской модели отображается в столбце Срок действия. Это последняя дата, в которую вы можете применить пользовательскую модель для транскрибирования. Базовые модели не отображаются на странице Обучение пользовательских моделей.

    Screenshot of the train custom models page that shows the transcription expiration date.

Вы также можете выполнить следующие действия, чтобы получить дату окончания срока действия транскрибирования для пользовательской модели:

  1. Войдите в службу Speech Studio.

  2. Выберите Пользовательское распознавание речи> имя вашего проекта >Развертывание моделей.

  3. Дата окончания срока действия модели отображается в столбце Срок действия. Это последняя дата, в которую вы можете использовать модель для транскрибирования.

    Screenshot of the deploy models page that shows the transcription expiration date.

Чтобы получить дату окончания срока действия транскрибирования для пользовательской модели, выполните команду spx csr model status. Создайте параметры запроса в соответствии со следующими инструкциями:

  • В качестве значения параметра url укажите URI модели, которую нужно получить. Замените YourModelId на идентификатор модели и YourServiceRegion на регион ресурса службы "Речь".

Ниже приведен пример команды CLI службы "Речь", которая позволяет получить дату окончания срока действия транскрибирования для пользовательской модели:

spx csr model status --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.0/models/YourModelId

Запишите дату, указанную в свойстве transcriptionDateTime полученного ответа. Это последняя дата, в которую вы можете применить пользовательскую модель для транскрибирования. Свойство adaptationDateTime не применяется, так как пользовательские модели не используются для обучения других пользовательских моделей.

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Для получения справки по командам CLI службы "Речь" для работы с моделями выполните следующую команду:

spx help csr model

Чтобы получить дату окончания срока действия транскрибирования для пользовательской модели, используйте операцию GetModelREST API преобразования речи в текст версии 3.0.

Выполните HTTP-запрос GET с использованием URI модели, как показано в следующем примере. Замените YourModelId на идентификатор модели, YourSubscriptionKey на ключ ресурса службы "Речь" и YourServiceRegion на регион ресурса службы "Речь".

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.0/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Запишите дату, указанную в свойстве transcriptionDateTime полученного ответа. Это последняя дата, в которую вы можете применить пользовательскую модель для транскрибирования. Свойство adaptationDateTime не применяется, так как пользовательские модели не используются для обучения других пользовательских моделей.

Вы должны получить ответ в следующем формате:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Дальнейшие действия