Trainingsdocumenten bouwen en beheren

Met Custom Translator kunt u vertaalmodellen maken die overeenkomen met de terminologie en stijl van uw bedrijf, branche en domein. Het trainen en implementeren van een aangepast model is eenvoudig en vereist geen programmeervaardigheden. Met Custom Translator kunt u parallelle bestanden, geheugenbestanden voor vertaling of zip-bestanden uploaden.

Parallelle documenten zijn paren van documenten waarbij de ene (doel) een vertaling van de andere is (bron). Het ene document in het paar bevat zinnen in de brontaal en het andere document bevat die zinnen die zijn vertaald in de doeltaal.

Voordat u uw documenten uploadt, raadpleegt u de richtlijnen voor documentindelingen en naamconventie om ervoor te zorgen dat uw bestandsindeling wordt ondersteund door Custom Translator.

Documentensets maken

Het vinden van kwaliteitsgegevens in het domein is vaak een uitdagende taak die varieert op basis van gebruikersclassificatie. Hier volgen enkele vragen die u uzelf kunt stellen wanneer u evalueert welke gegevens voor u beschikbaar zijn:

  • Ondernemingen hebben vaak een schat aan vertaalgegevens die zich gedurende vele jaren van het gebruik van menselijke vertaling hebben verzameld. Beschikt uw bedrijf over eerdere vertaalgegevens die u kunt gebruiken?

  • Hebt u een enorme hoeveelheid eentalige gegevens? Eentalige gegevens zijn gegevens in slechts één taal. Zo ja, kunt u dan vertalingen voor deze gegevens krijgen?

  • Kunt u online portals verkennen om bronzinnen te verzamelen en doelzinnen te synthetiseren?

Trainingsmateriaal voor elk documenttype

Bron Wat het doet Regels die moeten worden gevolgd
Tweetalige trainingsdocumenten Leert het systeem uw terminologie en stijl. Wees liberaal. Een menselijke vertaling binnen het domein is beter dan automatische vertaling. Voeg documenten toe en verwijder deze terwijl u bezig bent en probeer de BLEU-score te verbeteren.
Documenten afstemmen Traint de parameters voor neurale machinevertaling. Wees streng. Stel ze samen om optimaal representatief te zijn voor wat u in de toekomst gaat vertalen.
Documenten testen Bereken de BLEU-score. Wees streng. Stel testdocumenten op om optimaal representatief te zijn voor wat u in de toekomst wilt vertalen.
Woordenlijst voor woordgroepen Dwingt de opgegeven vertaling 100% van de tijd af. Wees beperkend. Een woordgroep is hoofdlettergevoelig en elk woord of elke woordgroep die wordt vermeld, wordt vertaald op de manier die u opgeeft. In veel gevallen is het beter om geen woordgroepenwoordenlijst te gebruiken en het systeem te laten leren.
Woordenlijst voor zinnen Dwingt de opgegeven vertaling 100% van de tijd af. Wees streng. Een zinswoordenlijst is niet hoofdlettergevoelig en geschikt voor algemene korte zinnen in een domein. Een woordenlijstovereenkomst vindt alleen plaats als de hele verzonden zin overeenkomt met de bronwoordenlijstvermelding. Als slechts een deel van de zin overeenkomt, komt de vermelding niet overeen.

Documenten uploaden

Documenttypen zijn gekoppeld aan het taalpaar dat is geselecteerd wanneer u een project maakt.

  1. Meld u aan bij de Custom Translator-portal . Uw standaardwerkruimte wordt geladen en er wordt een lijst met eerder gemaakte projecten weergegeven.

  2. Selecteer de gewenste projectnaam. Standaard is de blade Documenten beheren geselecteerd en wordt een lijst met eerder geüploade documenten weergegeven.

  3. Selecteer Documentenset toevoegen en kies het documenttype:

    • Trainingsset
    • Testset
    • Set afstemmen
    • Woordenlijstset:
      • Woordgroepenwoordenlijst
      • Woordenlijst voor zinnen
  4. Selecteer Next.

    Schermopname van de koppeling voor het uploaden van het document.

    Notitie

    Als u woordenlijstset kiest , wordt het dialoogvenster Type woordenlijst kiezen gestart. Kies er een en selecteer Volgende

  5. Selecteer de indeling van uw documenten via het keuzerondje.

    Schermopname van de pagina voor het uploaden van het document.

    • Voor Parallelle documenten vult u de Document set name in en selecteert u Bladeren in bestanden om bron- en doeldocumenten te selecteren.
    • Voor TM-bestand (Translation Memory) of Meerdere sets uploaden met ZIP selecteert u Bladeren in bestanden om het bestand te selecteren
  6. Selecteer Uploaden.

Op dit moment verwerkt Custom Translator uw documenten en probeert zinnen te extraheren zoals aangegeven in de uploadmelding. Zodra de verwerking is voltooid, ziet u de melding dat het uploaden is voltooid.

Schermopname van het dialoogvenster documentverwerking uploaden.

Uploadgeschiedenis weergeven

Op de werkruimtepagina kunt u de geschiedenis bekijken van alle details van het uploaden van documenten, zoals documenttype, taalpaar, uploadstatus, enzovoort.

  1. Klik op de pagina Custom Translator-portalwerkruimte op het tabblad Uploadgeschiedenis om de geschiedenis weer te geven.

    Schermopname van het tabblad Uploadgeschiedenis.

  2. Op deze pagina ziet u de status van al uw eerdere uploads. Er worden uploads weergegeven van meest recente naar minst recente. Voor elke upload worden de documentnaam, de uploadstatus, de uploaddatum, het aantal geüploade bestanden, het type bestand dat is geüpload, het taalpaar van het bestand en gemaakt door weergegeven. U kunt Filter gebruiken om snel documenten te vinden op naam, status, taal en datumbereik.

    Schermopname van de pagina uploadgeschiedenis.

  3. Selecteer een record voor de uploadgeschiedenis. Op de pagina met details van de uploadgeschiedenis kunt u de bestanden bekijken die zijn geüpload als onderdeel van het uploaden, de geüploade status van het bestand, de taal van het bestand en het foutbericht (als er een fout optreedt bij het uploaden).

Volgende stappen