Ciclo di vita del modello di riconoscimento vocale personalizzato

Articolo
01/22/2024

È possibile usare un modello di riconoscimento vocale personalizzato per un certo periodo di tempo dopo la distribuzione nell'endpoint personalizzato. Tuttavia, quando vengono resi disponibili nuovi modelli di base, i modelli meno recenti sono scaduti. È necessario ricreare ed eseguire periodicamente il training del modello personalizzato dal modello di base più recente per sfruttare al meglio l'accuratezza e la qualità.

Ecco alcuni termini chiave correlati al ciclo di vita del modello:

Training: acquisizione di un modello di base e personalizzazione nel dominio/scenario usando dati di testo e/o dati audio. In alcuni contesti, ad esempio le proprietà dell'API REST, il training viene definito anche adattamento.
Trascrizione: uso di un modello ed esecuzione del riconoscimento vocale (decodifica dell'audio in testo).
Endpoint: distribuzione specifica di un modello di base o di un modello personalizzato a cui è possibile accedere solo.

Nota

Gli endpoint usati dalle F0 risorse voce vengono eliminati dopo sette giorni.

Sequenza temporale scadenza

Ecco le sequenze temporali per l'adattamento del modello e la scadenza della trascrizione:

Il training è disponibile per un anno dopo il trimestre in cui Microsoft ha creato il modello di base.
La trascrizione con un modello di base è disponibile per due anni dopo il trimestre in cui Microsoft ha creato il modello di base.
La trascrizione con un modello personalizzato è disponibile per due anni dopo il trimestre in cui è stato creato il modello personalizzato.

In questo contesto, i trimestri terminano il 15 gennaio, il 15 aprile, il 15 luglio e il 15 ottobre.

Operazioni da eseguire alla scadenza di un modello

Quando un modello personalizzato o un modello di base scade, non è più disponibile per la trascrizione. È possibile modificare il modello usato dall'endpoint di riconoscimento vocale personalizzato senza tempi di inattività.

Route di trascrizione	Risultato del modello scaduto	Elemento consigliato
Endpoint personalizzato	Le richieste di riconoscimento vocale rientrano nel modello di base più recente per le stesse impostazioni locali. Si ottengono risultati, ma il riconoscimento potrebbe non trascrivere in modo accurato i dati del dominio.	Aggiornare il modello dell'endpoint come descritto nella guida Distribuire un modello di riconoscimento vocale personalizzato.
Trascrizione batch	Le richieste di trascrizione batch per i modelli scaduti hanno esito negativo con un errore 4xx.	In ogni Transcriptions_Create corpo della richiesta dell'API REST impostare la `model` proprietà su un modello di base o un modello personalizzato che non è scaduto. In caso contrario, non includere la `model` proprietà per usare sempre il modello di base più recente.

Ottenere le date di scadenza del modello di base

L'ultima data in cui è possibile usare il modello di base per il training è stata visualizzata al momento della creazione del modello personalizzato. Per altre informazioni, vedere Eseguire il training di un modello di riconoscimento vocale personalizzato.

Seguire queste istruzioni per ottenere la data di scadenza della trascrizione per un modello di base:

Accedere a Speech Studio.
Selezionare Riconoscimento vocale> personalizzato Il nome >del progetto Distribuisci modelli.
La data di scadenza per il modello viene visualizzata nella colonna Scadenza . Questa data è l'ultima data in cui è possibile usare il modello per la trascrizione.

Per ottenere le date di scadenza del training e della trascrizione per un modello di base, usare il spx csr model status comando . Creare i parametri della richiesta in base alle istruzioni seguenti:

Impostare il url parametro sull'URI del modello di base che si vuole ottenere. È possibile eseguire il spx csr list --base comando per ottenere i modelli di base disponibili per tutte le impostazioni locali.

Ecco un esempio di comando dell'interfaccia della riga di comando di Voce per ottenere le date di scadenza del training e della trascrizione per un modello di base:

spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

Nella risposta prendere nota della data nella adaptationDateTime proprietà . Questa proprietà è l'ultima data in cui è possibile usare il modello di base per il training. Prendere nota anche della data nella transcriptionDateTime proprietà . Questa data è l'ultima data in cui è possibile usare il modello di base per la trascrizione.

Dovrebbe essere visualizzato un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Per informazioni sull'interfaccia della riga di comando di Voce con i modelli, eseguire il comando seguente:

spx help csr model

Per ottenere le date di scadenza del training e della trascrizione per un modello di base, usare l'operazione Models_GetBaseModel dell'API REST Riconoscimento vocale in testo. È possibile effettuare una richiesta di Models_ListBaseModels per ottenere modelli di base disponibili per tutte le impostazioni locali.

Effettuare una richiesta HTTP GET usando l'URI del modello, come illustrato nell'esempio seguente. Sostituire BaseModelId con l'ID modello, sostituire YourSubscriptionKey con la chiave della risorsa Voce e sostituire YourServiceRegion con l'area della risorsa Voce.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Nella risposta prendere nota della data nella adaptationDateTime proprietà . Questa data è l'ultima data in cui è possibile usare il modello di base per il training. Prendere nota anche della data nella transcriptionDateTime proprietà . Questa data è l'ultima data in cui è possibile usare il modello di base per la trascrizione.

Dovrebbe essere visualizzato un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Ottenere le date di scadenza del modello personalizzato

Seguire queste istruzioni per ottenere la data di scadenza della trascrizione per un modello personalizzato:

Accedere a Speech Studio.
Selezionare Riconoscimento vocale> personalizzato Nome progetto Eseguire il training >di modelli personalizzati.
La data di scadenza del modello personalizzato viene visualizzata nella colonna Scadenza . Questa data è l'ultima data in cui è possibile usare il modello personalizzato per la trascrizione. I modelli di base non vengono visualizzati nella pagina Esegui training modelli personalizzati.

È anche possibile seguire queste istruzioni per ottenere la data di scadenza della trascrizione per un modello personalizzato:

Accedere a Speech Studio.
Selezionare Riconoscimento vocale> personalizzato Il nome >del progetto Distribuisci modelli.
La data di scadenza per il modello viene visualizzata nella colonna Scadenza . Questa data è l'ultima data in cui è possibile usare il modello per la trascrizione.

Per ottenere la data di scadenza della trascrizione per il modello personalizzato, usare il spx csr model status comando . Creare i parametri della richiesta in base alle istruzioni seguenti:

Impostare il url parametro sull'URI del modello da ottenere. Sostituire YourModelId con l'ID modello e sostituire YourServiceRegion con l'area della risorsa Voce.

Ecco un esempio di comando dell'interfaccia della riga di comando di Voce per ottenere la data di scadenza della trascrizione per il modello personalizzato:

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId

Nella risposta prendere nota della data nella transcriptionDateTime proprietà . Questa data è l'ultima data in cui è possibile usare il modello personalizzato per la trascrizione. La adaptationDateTime proprietà non è applicabile, poiché i modelli personalizzati non vengono usati per eseguire il training di altri modelli personalizzati.

Dovrebbe essere visualizzato un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Per informazioni sull'interfaccia della riga di comando di Voce con i modelli, eseguire il comando seguente:

spx help csr model

Per ottenere la data di scadenza della trascrizione per il modello personalizzato, usare l'operazione Models_GetCustomModel dell'API REST Riconoscimento vocale in testo.

Effettuare una richiesta HTTP GET usando l'URI del modello, come illustrato nell'esempio seguente. Sostituire YourModelId con l'ID modello, sostituire YourSubscriptionKey con la chiave della risorsa Voce e sostituire YourServiceRegion con l'area della risorsa Voce.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Dovrebbe essere visualizzato un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Ciclo di vita del modello di riconoscimento vocale personalizzato

Sequenza temporale scadenza

Operazioni da eseguire alla scadenza di un modello

Ottenere le date di scadenza del modello di base

Ottenere le date di scadenza del modello personalizzato

Passaggi successivi

Risorse aggiuntive