Personalización de un modelo de lenguaje con Azure AI Video Indexer

Artículo
03/25/2024

Importante

Debido al anuncio de retirada de Azure Media Services, Video Indexer de Azure AI anuncia los ajustes de las características de Video Indexer de Azure AI. Consulte Cambios relacionados con la retirada de Azure Media Service (AMS) para comprender lo que esto significa para la cuenta de Video Indexer de Azure AI. Consulte la guía Preparación para la retirada de AMS: vi actualización y migración.

Video Indexer de Azure AI admite el reconocimiento automático de voz mediante la integración con Microsoft Custom Speech Service. Puede personalizar el modelo de lenguaje cargando texto de adaptación. Este texto procede del dominio cuyo vocabulario desea que use el motor para adaptarse. Una vez entrenado el modelo, se reconocen nuevas palabras que aparecen en el texto de adaptación, suponiendo que la pronunciación predeterminada y el modelo de lenguaje aprende nuevas secuencias probables de palabras. Consulte la lista de idiomas compatibles con Video Indexer de Azure AI en langues compatibles.

Por ejemplo, "Kubernetes" (en el contexto de Azure Kubernetes service), es una palabra muy específica. Dado que la palabra es nueva en Video Indexer de Azure AI, se reconoce como "comunidades". Es necesario entrenar al modelo para que la reconozca como "Kubernetes". En otros casos, existen las palabras, pero el modelo de lenguaje no espera que aparezcan en un contexto determinado. Por ejemplo, "servicio de contenedor" no es una secuencia de 2 palabras que un modelo de lenguaje no especificado reconocería como un conjunto específico de palabras.

Hay dos maneras de personalizar un modelo de lenguaje:

Opción 1: Edite la transcripción generada por Video Indexer de Azure AI. Al editar y corregir la transcripción, va a entrenar un modelo de lenguaje para proporcionar resultados mejorados en el futuro.
Opción 2: Cargar archivos de texto para entrenar el modelo de lenguaje. El archivo de carga puede contener una lista de palabras como desea que aparezcan en la transcripción de Video Indexer o las palabras pertinentes incluidas de forma natural en oraciones y párrafos. A medida que se obtienen mejores resultados con el último enfoque, se recomienda que el archivo de carga contenga oraciones completas o párrafos relacionados con el contenido.

Importante

No incluya en el archivo de carga las palabras o oraciones como se transcriben actualmente incorrectamente (por ejemplo, "comunidades") ya que esto negará el impacto previsto. Incluya solo las palabras como desea que aparezcan (por ejemplo, "Kubernetes").

Procedimientos recomendados para modelos de lenguaje personalizados

Video Indexer de Azure AI aprende en función de las probabilidades de combinaciones de palabras, por lo que aprenderá mejor:

Ofrézcale suficientes ejemplos de oraciones reales del modo en que se pronunciarían.
Coloque solo una oración por línea, no más. De lo contrario, el sistema aprenderá probabilidades con las oraciones.
Está bien poner una palabra como frase para aumentar la palabra contra otros, pero el sistema aprende mejor de las oraciones completas.
Al introducir palabras o acrónimos nuevos, si es posible, proporcione tantos ejemplos de uso como pueda en una oración completa para ofrecer al sistema tanto contexto como sea posible.
Intente colocar varias opciones de adaptación y vea cómo funcionan.
Evite la repetición de la misma oración exacta varias veces. Puede crear un sesgo en el resto de la entrada.
Evite incluir símbolos poco comunes (~, # @ % &) ya que se descartarán. Las oraciones en que las que aparezcan también se descartarán.
Evite colocar entradas demasiado grandes, como cientos de miles de oraciones, porque, al hacerlo, reducirá el efecto de impulso.

Personalización de un modelo de lenguaje con Azure AI Video Indexer

Procedimientos recomendados para modelos de lenguaje personalizados

Comentarios

Comentarios

Recursos adicionales