Обучение пользовательской модели
Модель предоставляет переводы для определенной языковой пары. Модель создается в результате успешного обучения. Для обучения пользовательской модели требуются три взаимоисключающих типа документов: обучение, настройка и тестирование. Если при постановке задания обучения в очередь вы предоставите только учебный набор данных, Пользовательский переводчик автоматически составит настроечный и тестовый наборы. Он будет использовать случайное подмножество предложений из учебных документов и исключит эти предложения из самих учебных данных. Для обучения полной модели требуется не менее 10 000 параллельных предложений с обучающими данными.
Создание модели
Выберите колонку Обучение модели.
Введите имя модели.
Оставьте выбранным флажок по умолчанию Полное обучение или выберите Обучение только для словаря.
Примечание
В режиме полного обучения отображаются все отправленные типы документов. В режиме обучения только для словаря отображаются только документы словаря.
В разделе Выбор документов выберите документы, которые нужно использовать для обучения модели (например,
sample-English-German
), а также просмотрите затраты на обучение, связанные с выбранным количеством предложений.Щелкните Обучить.
Для подтверждения щелкните Обучить.
Примечание
В уведомлениях отображается ход обучения модели, например состояние Отправка данных. Обучение модели занимает несколько часов в зависимости от количества выбранных предложений.
Когда следует выбирать обучение только для словаря
Для получения лучших результатов рекомендуется позволить системе обучаться с помощью данных для обучения. Однако если у вас недостаточно параллельных предложений, чтобы удовлетворить минимальные требования в 10 000 предложений, либо если предложения и составные существительные должны предъявляться без изменений, используйте обучение только для словаря. Обычно такое обучение выполняется намного быстрее полного. Результирующая модель будет использовать базовые модели для перевода вместе с добавленными словарями. Вы не увидите оценки BLEU и не получите отчет о тестировании.
Примечание
Пользовательский переводчик не выравнивает предложения в файлах словарей. Поэтому важно, чтобы количество и расположения фраз и (или) предложений в исходном и целевом документах словаря совпадали. В противном случае отправка документа завершится ошибкой.
Сведения о модели
После успешного обучения модели выберите колонку Сведения о модели.
Выберите Имя модели, чтобы просмотреть дату и время обучения, общую продолжительность обучения, количество предложений, использованных для обучения, настройки, тестирования, словаря, а также сведений о том, создала ли система наборы для тестирования и настройки. Вы будете использовать для
Category ID
выполнения запросов на перевод.Выполните оценку BLEU модели. Просмотрите тестовый набор: оценка BLEU — это оценка пользовательской модели, а базовая bleu — предварительно обученная базовая модель, используемая для настройки. Чем выше оценка BLEU, тем лучше качество перевода у пользовательской модели.
Дублирование модели
Выберите колонку Сведения о модели.
Наведите указатель мыши на имя модели и отметьте кнопку выбора.
Щелкните Дублировать.
Заполните поле Имя новой модели.
Если дополнительные данные не будут выбраны или отправлены, установите флажок "Обучить немедленно". В противном случае проверка сохранить как черновик
Нажмите кнопку Сохранить.
Примечание
Если модель сохраняется как
Draft
, в Сведения о модели заносится имя модели в состоянииDraft
.Чтобы добавить дополнительные документы, выберите имя модели и следуйте инструкциям в разделе
Create model
выше.
Дальнейшие действия
- Узнайте, как тестировать и оценивать качество модели.
- Узнайте, как опубликовать модель.
- Узнайте, как выполнять перевод с помощью пользовательских моделей.