Обучение пользовательской модели

Модель предоставляет переводы для определенной языковой пары. Модель создается в результате успешного обучения. Для обучения пользовательской модели требуются три взаимоисключающих типа документов: обучение, настройка и тестирование. Если при постановке задания обучения в очередь вы предоставите только учебный набор данных, Пользовательский переводчик автоматически составит настроечный и тестовый наборы. Он будет использовать случайное подмножество предложений из учебных документов и исключит эти предложения из самих учебных данных. Для обучения полной модели требуется не менее 10 000 параллельных предложений с обучающими данными.

Создание модели

  1. Выберите колонку Обучение модели.

  2. Введите имя модели.

  3. Оставьте выбранным флажок по умолчанию Полное обучение или выберите Обучение только для словаря.

    Примечание

    В режиме полного обучения отображаются все отправленные типы документов. В режиме обучения только для словаря отображаются только документы словаря.

  4. В разделе Выбор документов выберите документы, которые нужно использовать для обучения модели (например, sample-English-German), а также просмотрите затраты на обучение, связанные с выбранным количеством предложений.

  5. Щелкните Обучить.

  6. Для подтверждения щелкните Обучить.

    Примечание

    В уведомлениях отображается ход обучения модели, например состояние Отправка данных. Обучение модели занимает несколько часов в зависимости от количества выбранных предложений.

    Снимок экрана: колонка обучения модели.

Когда следует выбирать обучение только для словаря

Для получения лучших результатов рекомендуется позволить системе обучаться с помощью данных для обучения. Однако если у вас недостаточно параллельных предложений, чтобы удовлетворить минимальные требования в 10 000 предложений, либо если предложения и составные существительные должны предъявляться без изменений, используйте обучение только для словаря. Обычно такое обучение выполняется намного быстрее полного. Результирующая модель будет использовать базовые модели для перевода вместе с добавленными словарями. Вы не увидите оценки BLEU и не получите отчет о тестировании.

Примечание

Пользовательский переводчик не выравнивает предложения в файлах словарей. Поэтому важно, чтобы количество и расположения фраз и (или) предложений в исходном и целевом документах словаря совпадали. В противном случае отправка документа завершится ошибкой.

Сведения о модели

  1. После успешного обучения модели выберите колонку Сведения о модели.

  2. Выберите Имя модели, чтобы просмотреть дату и время обучения, общую продолжительность обучения, количество предложений, использованных для обучения, настройки, тестирования, словаря, а также сведений о том, создала ли система наборы для тестирования и настройки. Вы будете использовать для Category ID выполнения запросов на перевод.

  3. Выполните оценку BLEU модели. Просмотрите тестовый набор: оценка BLEU — это оценка пользовательской модели, а базовая bleu — предварительно обученная базовая модель, используемая для настройки. Чем выше оценка BLEU, тем лучше качество перевода у пользовательской модели.

    Снимок экрана: поля сведений о модели.

Дублирование модели

  1. Выберите колонку Сведения о модели.

  2. Наведите указатель мыши на имя модели и отметьте кнопку выбора.

  3. Щелкните Дублировать.

  4. Заполните поле Имя новой модели.

  5. Если дополнительные данные не будут выбраны или отправлены, установите флажок "Обучить немедленно". В противном случае проверка сохранить как черновик

  6. Нажмите кнопку Сохранить.

    Примечание

    Если модель сохраняется как Draft, в Сведения о модели заносится имя модели в состоянии Draft.

    Чтобы добавить дополнительные документы, выберите имя модели и следуйте инструкциям в разделе Create model выше.

    Снимок экрана: колонка дублирования модели.

Дальнейшие действия