Treinar um modelo personalizado

Um modelo fornece traduções para um par de idiomas específico. O resultado de um treinamento bem sucedido é um modelo. Para treinar um modelo personalizado, são necessários três tipos de documentos mutuamente exclusivos: treinamento, ajuste e teste. Se apenas os dados de treinamento forem fornecidos ao enfileirar um treinamento, o Tradutor Personalizado montará automaticamente os dados de ajuste e teste. Ele usará um subconjunto aleatório de frases de seus documentos de treinamento e excluirá essas frases dos dados de treinamento. São necessárias, no mínimo, dez mil frases de treinamento paralelo para treinar um modelo completo.

Criar modelo

  1. Selecione a folha Treinar modelo.

  2. Digite o Nome do modelo.

  3. Mantenha o Treinamento completo padrão selecionado ou escolha Treinamento somente de dicionário.

    Observação

    O treinamento completo exibe todos os tipos de documentos carregados. O somente de dicionário exibe apenas os documentos de dicionário.

  4. Em Selecionar documentos, escolha os documentos que deseja usar para treinar o modelo. Por exemplo, sample-English-German, e revise o custo de treinamento associado ao número selecionado de frases.

  5. Selecione Treinar agora.

  6. Escolha Treinar para confirmar.

    Observação

    As notificações exibem o treinamento de modelo em andamento, por exemplo, o estado Enviando dados. O modelo de treinamento leva algumas horas, sujeito ao número de sentenças selecionadas.

    Captura de tela que ilustra a folha do modelo de treinamento.

Quando selecionar o treinamento somente de dicionário

Para resultados melhores, recomendamos permitir que o sistema aprenda com os seus dados de treinamento. No entanto, quando você não tiver frases paralelas suficientes para atender aos requisitos mínimos de 10 mil ou as frases e os substantivos compostos precisarem ser renderizados no estado em que se encontram, use o treinamento somente de dicionário. Seu modelo normalmente completará o treinamento muito mais rápido do que o treinamento completo. Os modelos resultantes usarão os modelos de linha de base para tradução junto com os dicionários que você adicionou. Você não verá as pontuações BLEU nem receberá um relatório de teste.

Observação

O Tradutor Personalizado não alinha as frases dos arquivos de dicionário. Portanto, portanto é importante que haja um número igual de frases/sentenças de origem e de destino nos documentos do dicionário e que elas estejam alinhadas corretamente. Caso contrário, o upload do documento falhará.

Detalhes do modelo

  1. Após o treinamento de modelo bem-sucedido, selecione a folha Detalhes do modelo.

  2. Selecione o Nome do Modelo para revisar a data/a hora do treinamento, o tempo total de treinamento, o número de frases usadas para treinamento, o ajuste, o teste e o dicionário e para saber se o sistema gerou os conjuntos de teste e de ajuste. Você usará Category ID para fazer solicitações de tradução.

  3. Avalie a pontuação BLEU do modelo. Revise o conjunto de testes: a pontuação do BLEU é a pontuação de modelo personalizada e o BLEU de Linha de Base é o modelo de linha de base pré-treinado usado para personalização. Uma Pontuação BLEU superior significa maior qualidade de tradução usando o modelo personalizado.

    Captura de tela ilustrando campos de detalhes do modelo.

Modelo duplicado

  1. Selecione a folha Detalhes do modelo.

  2. Focalize o cursor no nome do modelo e marque o botão de seleção.

  3. Selecione Duplicar.

  4. Preencha Novo nome do modelo.

  5. Mantenha a opção Treinar imediatamente marcada se nenhum dado adicional for selecionado ou carregado, caso contrário, marque Salvar como rascunho

  6. Selecione Salvar

    Observação

    Se você salvar o modelo como Draft, os Detalhes do modelo serão atualizados com o nome do modelo no status Draft.

    Para adicionar mais documentos, selecione no nome do modelo e siga a seção Create model acima.

    Captura de tela que ilustra a folha do modelo duplicado.

Próximas etapas