Entrenamiento de un modelo personalizado

Un modelo proporciona traducciones para un par de idiomas específico. El resultado de un entrenamiento correcto es un modelo. Para entrenar un modelo personalizado, se requieren tres tipos de documentos mutuamente exclusivos: aprendizaje, ajuste y pruebas. Si solo se proporcionan datos de aprendizaje al poner en cola un entrenamiento, Custom Translator reunirá automáticamente los datos de pruebas y de ajuste. Usará un subconjunto aleatorio de frases de los documentos de aprendizaje y excluirá estas frases de los propios datos de aprendizaje. Se necesitan como mínimo 10 000 oraciones de entrenamiento paralelas para entrenar un modelo completo.

Crear modelo

  1. Seleccione la hoja Entrenar modelo.

  2. Escriba el nombre en Nombre del modelo.

  3. Mantenga seleccionada la opción predeterminada Full training (Entrenamiento completo) o seleccione Dictionary-only training (Entrenamiento de solo diccionario).

    Nota

    El entrenamiento completo muestra todos los tipos de documentos cargados. La opción de solo diccionario muestra únicamente documentos de diccionario.

  4. En Select documents (Seleccionar documentos), seleccione los documentos que desea usar para entrenar el modelo, por ejemplo, sample-English-German, y revise el costo de entrenamiento asociado al número de oraciones seleccionadas.

  5. Seleccione Train now (Entrenar ahora).

  6. Seleccione Entrenar para confirmar.

    Nota:

    Las notificaciones muestran el entrenamiento del modelo en curso, por ejemplo, el estado Submitting data (Enviando datos). El modelo de entrenamiento tarda unas horas, según el número de oraciones seleccionadas.

    Captura de pantalla que ilustra la hoja de entrenamiento del modelo.

Cuándo seleccionar el entrenamiento de solo diccionario

Para unos mejores resultados, se recomienda permitir que el sistema aprenda de los datos de entrenamiento. Sin embargo, si no tiene suficientes oraciones paralelas para cumplir los requisitos mínimos de 10 000 o las oraciones y los nombres compuestos deben representarse tal cual, utilice el entrenamiento de solo diccionario. Normalmente, el modelo completará el entrenamiento mucho más rápido que con un entrenamiento completo. Los modelos resultantes utilizarán los modelos de base de referencia para la traducción, junto con los diccionarios que has agregado. No verá las puntuaciones BLEU ni obtendrá un informe de prueba.

Nota

Traductor personalizado no alinea las oraciones en archivos de diccionario. Por lo tanto, es importante que haya el mismo número de frases u oraciones de origen y destino en el diccionario y que estén alineadas con precisión. Si no es así, se producirá un error en la carga del documento.

Detalles del modelo

  1. Después de entrenar el modelo correctamente, seleccione la hoja Detalles del modelo.

  2. Seleccione Nombre del modelo para revisar la fecha y hora del entrenamiento, el tiempo total de entrenamiento, el número de oraciones usadas para el entrenamiento, el ajuste, las pruebas, el diccionario y si el sistema ha generado los conjuntos de prueba y ajuste. Usarás Category ID para realizar solicitudes de traducción.

  3. Evalúe la puntuación BLEU del modelo. Revisa el conjunto de pruebas, la BLEU score (Puntuación BLEU) es la puntuación del modelo personalizado y la Baseline BLEU (BLEU de base de referencia) es el modelo de línea base previamente entrenado que se usa para la personalización. Un valor de BLEU score (Puntuación BLEU) más alto significa una mayor calidad de la traducción mediante el modelo personalizado.

    Captura de pantalla que ilustra los detalles de los campos.

Modelo duplicado

  1. Seleccione la hoja Detalles del modelo.

  2. Mantenga el puntero sobre el nombre del modelo y active el botón de selección.

  3. Seleccione Duplicar.

  4. Rellene Nombre del nuevo modelo.

  5. Mantén activado Train immediately (Entrenar inmediatamente) si no se van a seleccionar o cargar datos adicionales. De lo contrario, activa Guardar como borrador

  6. Seleccione Guardar.

    Nota

    Si guarda el modelo como Draft, Detalles del modelo, se actualiza con el nombre del modelo en el estado Draft.

    Para agregar más documentos, seleccione el nombre del modelo y siga la sección Create model anterior.

    Captura de pantalla que ilustra el duplicado de la hoja de entrenamiento del modelo.

Pasos siguientes