Personalización de un modelo de lenguaje con el sitio web de Video Analyzer for Media

Azure Video Analyzer for Media (anteriormente, Video Indexer) permite crear modelos de lenguaje personalizados para personalizar el reconocimiento de voz mediante la carga de texto de adaptación, es decir, texto del dominio a cuyo vocabulario desea que se adapte el motor. Una vez que se entrena el modelo, se reconocerán las nuevas palabras que aparecen en el texto de adaptación.

Para obtener información detallada y conocer los procedimientos recomendados para modelos de lenguaje personalizados, consulte Personalización de un modelo de lenguaje con Video Analyzer for Media.

Puede usar el sitio web de Video Analyzer for Media para crear y editar modelos de lenguaje personalizados en su cuenta, como se describe en este tema. También puede usar la API, como se describe en Personalización del modelo de lenguaje mediante las API.

Creación de un modelo de lenguaje

  1. Vaya al sitio web de Video Analyzer for Media e inicie sesión.

  2. Para personalizar un modelo en su cuenta, seleccione el botón Content model customization (Personalización del modelo de contenido) a la izquierda de la página.

    Personalización de un modelo de contenido en Video Analyzer for Media

  3. Seleccione la pestaña Language (Lenguaje).

    Verá una lista de idiomas admitidos.

  4. En el idioma que desee, seleccione Agregar modelo.

  5. Escriba el nombre para el modelo de lenguaje y presione Entrar.

    En este paso se crea el modelo y se ofrece la opción de cargar en él archivos de texto.

  6. Para agregar un archivo de texto, seleccione Agregar archivo. Se abrirá el explorador de archivos.

  7. Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje.

    También puede agregar un archivo de texto; para ello, seleccione el botón ... situado en el lado derecho del modelo de lenguaje y seleccione Agregar archivo.

  8. Cuando termine de cargar los archivos de texto, seleccione la opción verde Entrenar.

Este proceso puede tardar varios minutos. Finalizado el entrenamiento, verá Trained (Entrenado) junto al modelo. Puede obtener una vista previa del archivo del modelo, descargarlo y eliminarlo.

Entrenamiento del modelo

Uso de un modelo de lenguaje en un nuevo vídeo

Para usar el modelo de lenguaje en un nuevo vídeo, realice una de las siguientes acciones:

  • Seleccione el botón Cargar en la parte superior de la página.

    Botón Cargar de Video Analyzer for Media

  • Coloque el archivo de audio o vídeo o busque el archivo.

Se le dará la opción de seleccionar el idioma de origen del vídeo. Seleccione la lista desplegable y elija un modelo de lenguaje que haya creado de la lista. Debería aparecer el lenguaje del modelo de lenguaje y el nombre que le dio entre paréntesis. Por ejemplo:

Elección del idioma de origen del vídeo: reindexación de un vídeo con Video Analyzer for Media

Haga clic en la opción Cargar en la parte inferior de la página y el nuevo vídeo se indexará mediante el modelo de lenguaje.

Uso de un modelo de lenguaje para volver a indexar

Para usar el modelo de lenguaje para reindexar un vídeo en la colección, siga estos pasos:

  1. Inicie sesión en la página principal de Video Analyzer for Media.
  2. Haga clic en el botón ... del vídeo y seleccione Volver a indexar.
  3. Se le da la opción de seleccionar el idioma de origen del vídeo para volver a indexar el vídeo. Seleccione la lista desplegable y elija un modelo de lenguaje que haya creado de la lista. Debería aparecer el lenguaje del modelo de lenguaje y el nombre que le dio entre paréntesis.
  4. Seleccione el botón Volver a indexar y el vídeo se volverá a indexar con su modelo de lenguaje.

Edición de un modelo de lenguaje

Para editar un modelo de lenguaje, puede cambiar su nombre, agregarle archivos y eliminar archivos de él.

Si agrega o elimina archivos en el modelo de lenguaje, deberá volver a entrenar el modelo; para ello, seleccione la opción verde Entrenar.

Cambio de nombre del modelo de lenguaje

Para cambiar el nombre del modelo de lenguaje, seleccione el botón de puntos suspensivos ... en el lado derecho del modelo de lenguaje y seleccione Cambiar nombre.

Escriba el nuevo nombre y presione Entrar.

Incorporación de archivos

Para agregar un archivo de texto, seleccione Agregar archivo. Se abrirá el explorador de archivos.

Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje.

También puede agregar un archivo de texto; para ello, seleccione el botón de puntos suspensivos ( ... ) situado en el lado derecho del modelo de lenguaje y seleccione Agregar archivo.

Eliminar archivos

Para eliminar un archivo del modelo de lenguaje, seleccione el botón de puntos suspensivos ( ... ) situado en el lado derecho del archivo de texto y seleccione Eliminar. Aparece una nueva ventana que le indica que la eliminación no se puede deshacer. Seleccione la opción Eliminar en la nueva ventana.

Esta acción quita completamente el archivo del modelo de lenguaje.

Eliminación de un modelo de lenguaje

Para eliminar un modelo de lenguaje de su cuenta, seleccione el botón de puntos suspensivos ( ... ) situado en el lado derecho del modelo de lenguaje y seleccione Eliminar.

Aparece una nueva ventana que le indica que la eliminación no se puede deshacer. Seleccione la opción Eliminar en la nueva ventana.

Esta acción quita completamente el modelo de lenguaje de su cuenta. Cualquier vídeo que haya estado usando el modelo de lenguaje eliminado mantendrá el mismo índice hasta que vuelva a indexar el vídeo. Si vuelve a indexar el vídeo, puede asignarle un nuevo modelo de lenguaje. En caso contrario, Video Analyzer for Media usará el modelo predeterminado para volver a indexar el vídeo.

Personalización de modelos de lenguaje mediante la corrección de transcripciones

Video Analyzer for Media admite la personalización automática del lenguaje de los modelos basados en las correcciones reales que los usuarios realizan en las transcripciones de sus vídeos.

  1. Para realizar correcciones en una transcripción, abra el vídeo que desee editar de la cuenta. Seleccione la pestaña Timeline (Escala de tiempo).

    Pestaña de escala de tiempo de la personalización de un modelo de lenguaje: Video Analyzer for Media

  2. Seleccione el icono del lápiz para editar la transcripción.

    Personalización de la edición de la transcripción del modelo de lenguaje: Video Analyzer for Media

    Video Analyzer for Media captura todas las líneas que corrigió en la transcripción del vídeo y las agrega automáticamente a un archivo de texto denominado "Ediciones de transcripción de origen". Estas ediciones se usan para volver a entrenar el modelo de lenguaje específico que se usó para indexar el vídeo.

    También se incluyen las modificaciones realizadas en la escala de tiempo del widget.

    Si no especificó un modelo de lenguaje al indexar el vídeo, todas las ediciones se almacenarán en uno predeterminado llamado "Account adaptations" (Adaptaciones de la cuenta) en el idioma detectado del vídeo.

    En caso de que se hayan realizado varias modificaciones en la misma línea, se usará solo la última versión de la línea corregida para actualizar el modelo de lenguaje.

    Nota

    Solo las correcciones textuales se usan para la personalización. No se incluyen las correcciones que no impliquen palabras reales (por ejemplo, los signos de puntuación o los espacios).

  3. Se mostrarán las correcciones de las transcripciones en la pestaña Idioma de la página Personalización del modelo de contenido.

    Seleccione el modelo de lenguaje que desee para ver su archivo "Ediciones de transcripción de origen".

    Ediciones de transcripción de origen: Video Analyzer for Media

Pasos siguientes

Personalización del modelo de lenguaje mediante las API