Personalizzare un modello linguistico con l'API Video Indexer di Azure per intelligenza artificiale

Articolo
03/22/2024

Importante

A causa dell'annuncio di ritiro Servizi multimediali di Azure, Azure AI Video Indexer annuncia le modifiche alle funzionalità di Azure AI Video Indexer. Vedere Modifiche correlate al ritiro di Servizi multimediali di Azure (AMS) per comprendere cosa significa per l'account Video Indexer di Azure per intelligenza artificiale. Vedere la guida alla preparazione per il ritiro di AMS: aggiornamento VI e migrazione.

Video Indexer di Azure per intelligenza artificiale consente di creare modelli linguistici personalizzati per personalizzare il riconoscimento vocale caricando testo di adattamento, ovvero testo dal dominio il cui vocabolario si vuole adattare il motore. Dopo avere eseguito il training del modello, le nuove parole presenti nel testo di adattamento verranno riconosciute.

Per una panoramica dettagliata e procedure consigliate per i modelli linguistici personalizzati, vedere Personalizzare un modello linguistico con Video Indexer di Azure per intelligenza artificiale.

È possibile usare le API video indexer di Azure per intelligenza artificiale per creare e modificare modelli linguistici personalizzati nell'account, come descritto in questo articolo. È anche possibile usare il sito Web, come descritto in Personalizzare il modello linguistico usando il sito Web di Azure AI Video Indexer.

Creare un modello linguistico

L'API crea un modello linguistico crea un nuovo modello linguistico personalizzato nell'account specificato. È possibile caricare i file per il modello linguistico in questa chiamata. In alternativa, è possibile creare il modello linguistico qui e caricare i file per il modello in un secondo momento aggiornando il modello linguistico.

Nota

È comunque necessario eseguire il training del modello con i relativi file abilitati per fare in modo che il modello possa apprendere il contenuto dei file. La sezione successiva contiene le indicazioni per eseguire il training di una lingua.

Per caricare i file da aggiungere al modello linguistico, è necessario caricare i file nel corpo usando FormData oltre a fornire valori per i parametri necessari sopra. Esistono due modi per eseguire questa attività:

La chiave è il nome del file e il valore è il file txt.
La chiave è il nome del file e il valore è un URL per il file txt.

Response

La risposta fornisce metadati nel modello linguistico appena creato insieme ai metadati in ognuno dei file del modello seguendo il formato di questo output JSON di esempio:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Eseguire il training di un modello linguistico

L'API del training di un modello linguistico esegue il training di un modello linguistico personalizzato nell'account specificato con il contenuto nei file caricati e abilitati nel modello linguistico.

Nota

È necessario prima creare il modello linguistico e caricare i relativi file. È possibile caricare i file durante la creazione del modello linguistico o aggiornando il modello linguistico.

Response

La risposta fornisce metadati sul modello linguistico appena sottoposto a training insieme ai metadati in ognuno dei file del modello seguendo il formato di questo output JSON di esempio:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

L'oggetto restituito è un ID univoco id usato per distinguere i modelli linguistici, mentre languageModelId viene usato per caricare un video nell'indice e reindicizzare un'API video (nota anche come linguisticModelId nelle API di caricamento/reindicizzazione di Video Indexer di Azure AI).

Eliminare un modello linguistico

L'API elimina un modello linguistico elimina un modello linguistico personalizzato dall'account specificato. Qualsiasi video che usa il modello linguistico eliminato mantiene lo stesso indice fino a quando non si reindicizzare il video. Se si reindicizzare il video, è possibile assegnare un nuovo modello linguistico al video. In caso contrario, Video Indexer di Azure per intelligenza artificiale usa il modello predefinito per reindicizzare il video.

Response

Non viene restituito alcun contenuto quando il modello linguistico viene eliminato correttamente.

Aggiornare un modello linguistico

L'aggiornamento di un'API del modello linguistico aggiorna un modello linguistico personalizzato nell'account specificato.

Nota

È necessario aver già creato il modello linguistico. È possibile usare questa chiamata per abilitare o disabilitare tutti i file nel modello, aggiornare il nome del modello linguistico e caricare i file da aggiungervi.

La chiave è il nome del file e il valore è il file txt.
La chiave è il nome del file e il valore è un URL per il file txt.

Response

La risposta fornisce metadati sul modello linguistico appena sottoposto a training insieme ai metadati in ognuno dei file del modello seguendo il formato di questo output JSON di esempio:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Usare l'oggetto id dei file restituiti nella risposta per scaricare il contenuto del file.

Aggiornare un file da un modello linguistico

L'aggiornamento di un file consente di aggiornare il nome e enable lo stato di un file in un modello linguistico personalizzato nell'account specificato.

Response

La risposta fornisce i metadati sul file che è stato aggiornato seguendo il formato di output JSON di esempio riportato di seguito.

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

Usare l'oggetto id del file restituito nella risposta per scaricare il contenuto del file.

Ottenere un modello linguistico specifico

L'API Get restituisce informazioni sul modello linguistico specificato nell'account specificato, ad esempio la lingua e i file presenti nel modello linguistico.

Response

La risposta fornisce metadati sul modello linguistico specificato insieme ai metadati in ognuno dei file del modello seguendo il formato di questo output JSON di esempio:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Usare l'oggetto id del file restituito nella risposta per scaricare il contenuto del file.

Ottenere tutti i modelli linguistici

L'API get all restituisce tutti i modelli linguistici personalizzati nell'account specificato in un elenco.

Response

La risposta fornisce un elenco di tutti i modelli linguistici nell'account e ognuno dei relativi metadati e file seguendo il formato di questo output JSON di esempio:

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Eliminare un file da un modello linguistico

L'API di eliminazione elimina il file specificato dal modello linguistico specificato nell'account specificato.

Response

Non viene restituito alcun contenuto quando il file viene eliminato correttamente dal modello linguistico.

Ottenere i metadati su un file da un modello linguistico

Il recupero dei metadati di un'API di file restituisce il contenuto di e i metadati nel file specificato dal modello linguistico scelto nell'account.

Response

La risposta fornisce il contenuto e i metadati del file in formato JSON, simile a questo esempio:

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Nota

Il contenuto di questo file di esempio sono le parole "hello" e "world"in due righe distinte.

Scaricare un file da un modello linguistico

L'API di download di un file scarica un file di testo contenente il contenuto del file specificato dal modello linguistico specificato nell'account specificato. Questo file di testo dovrebbe corrispondere al contenuto del file di testo caricato in origine.

Response

La risposta è il download di un file di testo con il contenuto del file nel formato JSON.

Condividi tramite

Personalizzare un modello linguistico con l'API Video Indexer di Azure per intelligenza artificiale

Creare un modello linguistico

Response

Eseguire il training di un modello linguistico

Response

Eliminare un modello linguistico

Response

Aggiornare un modello linguistico

Response

Aggiornare un file da un modello linguistico

Response

Ottenere un modello linguistico specifico

Response

Ottenere tutti i modelli linguistici

Response

Eliminare un file da un modello linguistico

Response

Ottenere i metadati su un file da un modello linguistico

Response

Scaricare un file da un modello linguistico

Response

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive