Wat is een woordenlijst?

Een woordenlijst is een uitgelijnd paar documenten dat een lijst met zinnen of zinnen en de bijbehorende vertalingen specificeert. Gebruik een woordenlijst in uw training als u wilt dat Microsoft Translator altijd exemplaren van de bronzin of zin vertaalt met behulp van de vertaling die u in de woordenlijst hebt opgegeven. Woordenlijsten worden ook wel woordenlijsten of termbases genoemd. U kunt de woordenlijst zien als een brute force 'copy and replace' voor alle termen die u vermeldt. Bovendien bouwt Microsoft Custom Vertalen service en maakt deze gebruik van eigen woordenlijsten voor algemeen gebruik om de kwaliteit van de vertaling te verbeteren. Een door de klant geleverde woordenlijst neemt echter eerst een zoekopdracht uit om woorden of zinnen op te zoeken.

Woordenlijsten werken alleen voor projecten in taalparen met een volledig ondersteund algemeen neuraal netwerkmodel van Microsoft. Bekijk de volledige lijst met talen.

Woordenlijst

Woordgroepenwoordenlijst is hoofdwoordgevoelig. Het is een exacte zoek- en vervangbewerking. Wanneer u een woordenlijst met woordenlijsten op te nemen in het trainen van uw model, wordt elk woord of elke woordgroep die wordt vermeld, vertaald op de manier die u hebt opgegeven. De rest van de zin wordt zoals gebruikelijk vertaald. U kunt een woordenlijst voor woordengroepen gebruiken om zinnen op te geven die niet moeten worden vertaald door dezelfde niet-vertaalde woordgroep op te geven in het bron- en doelbestand in de woordenlijst.

Woordenlijst met zinnen

De woordenlijst met zinnen is niet hoofd- en hoofdindijf. In de zinswoordenlijst kunt u een exacte doelvertaling voor een bronzin opgeven. Om een overeenkomst met een zinwoordenlijst te kunnen vinden, moet de hele ingediende zin overeenkomen met de vermelding in de bronwoordenlijst. Als de vermelding in de bronwoordenlijst eindigt met leestekens, wordt deze genegeerd tijdens de overeenkomst. Als slechts een deel van de zin overeenkomt, komt de vermelding niet overeen. Wanneer een overeenkomst wordt gedetecteerd, wordt de doelinvoer van de zinswoordenlijst geretourneerd.

Trainings alleen in woordenlijst

U kunt een model trainen met alleen woordenlijstgegevens. Als u dit wilt doen, selecteert u alleen het woordenlijstdocument (of meerdere woordenlijstdocumenten) dat u wilt opnemen en tikt u op Model maken. Omdat dit een alleen-woordenlijsttraining is, is er geen minimum aantal trainings zinnen vereist. Uw model voltooit de training doorgaans veel sneller dan een standaardtraining. De resulterende modellen gebruiken de Microsoft-basislijnmodellen voor vertaling met de toevoeging van de woordenlijsten die u hebt toegevoegd. U krijgt geen testrapport.

Notitie

Met aangepaste Vertalen worden woordenlijstbestanden niet uitgelijnd met zinnen. Het is dus belangrijk dat er een gelijk aantal bron- en doeltermen/zinnen in uw woordenlijstdocumenten staat en dat ze nauwkeurig zijn uitgelijnd.

Aanbevelingen

  • Woordenlijsten zijn geen vervanging voor het trainen van een model met trainingsgegevens. Het wordt aanbevolen deze te vermijden en het systeem te laten leren van uw trainingsgegevens. Wanneer zinnen of samengestelde zelfstandige naamwoorden echter moeten worden weergegeven zoals ze zijn, gebruikt u een woordenlijst.
  • De woordgroepenlijst moet spaarzaam worden gebruikt. Let er dus op dat wanneer een zin in een zin wordt vervangen, de context in die zin verloren gaat of beperkt is voor het vertalen van de rest van de zin. Het resultaat is dat hoewel de zin of het woord in de zin wordt vertaald volgens de opgegeven woordenlijst, de algehele vertaalkwaliteit van de zin hier vaak onder zal leiden.
  • De woordenlijst met woordenlijsten werkt goed voor samengestelde zelfstandige naamwoorden, zoals productnamen ('Microsoft SQL Server'), de juiste namen ('Plaats van Den') of functies van het product ('draaitabel'). Het werkt niet even goed voor werkwoorden of bijvoeglijke naamwoorden, omdat deze doorgaans in hoge mate worden gebruikt in de bron- of doeltaal. Best practices zijn om vermeldingen in woordgroepenlijsten te voorkomen voor alles behalve samengestelde zelfstandige naamwoorden.
  • Bij het gebruik van een woordenlijst zijn hoofdletters en leestekens belangrijk. Woordenlijst-vermeldingen komen alleen overeen met woorden en woordgroepen in de invoerzin die exact dezelfde hoofdletters en leestekens gebruiken als is opgegeven in het bronwoordenlijstbestand. De vertalingen weerspiegelen ook de hoofdletters en leestekens in het doelwoordenlijstbestand. Als u bijvoorbeeld een Engels-Spaans systeem hebt getraind dat gebruikmaakt van een woordenlijst waarin 'US' wordt opgegeven in het bronbestand, en 'EE. UU." in het doelbestand. Wanneer u een vertaling aanvraagt van een zin die het woord 'us' bevat (niet met hoofdletters), komt dit niet overeen met de woordenlijst. Als u echter een vertaling aanvraagt van een zin die het woord 'US' (hoofdletters) bevat, komt deze overeen met de woordenlijst en bevat de vertaling 'EE. UU." Houd er rekening mee dat de hoofdletters en interpunctie in de vertaling anders kunnen zijn dan opgegeven in het doelbestand van de woordenlijst en kunnen verschillen van de hoofdletters en leestekens in de bron. Deze volgt de regels van de doeltaal.
  • Wanneer u een woordenlijst met zinnen gebruikt, wordt het einde van zinspunctie genegeerd. Als uw bronwoordenlijst bijvoorbeeld 'deze zin eindigt op interpunctie!' bevat, komen alle vertaalaanvragen met 'deze zin eindigt op interpunctie' overeen.
  • Als een woord meer dan één keer in een woordenlijstbestand wordt weergegeven, gebruikt het systeem altijd de laatste vermelding. Uw woordenlijst mag daarom niet meerdere vertalingen van hetzelfde woord bevatten.

Volgende stappen