De richtlijnen voor documentindelingen en naamconventie
Elk bestand dat wordt gebruikt voor aangepaste vertaling, moet ten minste vier tekens lang zijn.
Deze tabel bevat alle ondersteunde bestandsindelingen die u kunt gebruiken om uw vertaalsysteem te bouwen:
Indeling | Uitbreidingen | Beschrijving |
---|---|---|
XLIFF | . XLF. XLIFF | Een parallelle documentindeling, export van vertaalgeheugensystemen. De gebruikte talen worden gedefinieerd in het bestand. |
TMX | . TMX | Een parallelle documentindeling, export van vertaalgeheugensystemen. De gebruikte talen worden gedefinieerd in het bestand. |
ZIP | .ZIP | ZIP is een archiefbestandsindeling. |
Locstudio | . LCL | Een Microsoft-indeling voor parallelle documenten |
Microsoft Word | .DOCX | Microsoft Word-document |
Adobe Acrobat | Adobe Acrobat portable document | |
HTML | .HTML, .HTM | HTML-document |
Tekstbestand | .TXT | Met UTF-16 of UTF-8 gecodeerde tekstbestanden. De bestandsnaam mag geen Japanse tekens bevatten. |
Uitgelijnd tekstbestand | . UITLIJNEN | De extensie .ALIGN is een speciale extensie die u kunt gebruiken als u weet dat de zinnen in het documentpaar perfect zijn uitgelijnd. Als u een .ALIGN bestand opgeeft, worden de zinnen niet voor u uitgelijnd. |
Excel-bestand | .XLSX | Excel-bestand (2013 of hoger). De eerste regel/rij van het werkblad moet taalcode zijn. |
De woordenlijstindelingen
Voor de woordenlijsten ondersteunt Custom Translator alle bestandsindelingen die worden ondersteund voor trainingssets. Als u een Excel-woordenlijst gebruikt, dan moet de eerste regel/rij van het werkblad taalcodes zijn.
De zip-bestandsindelingen
Documenten kunnen worden gegroepeerd in één zip-bestand en dan worden geüpload. Custom Translator ondersteunt deze volgende zip-bestandsindelingen (ZIP, GZ en TGZ).
Elk document in het zip-bestand met de extensie TXT, HTML, HTM, PDF, DOCX, ALIGN moet deze naamconventie volgen:
{documentnaam}_{taalcode} waarbij {documentnaam} de naam van uw document is, is {language code} de ISO LanguageID (twee tekens), waarmee wordt aangegeven dat het document zinnen in die taal bevat. Er moet een onderstrepingsteken (_) vóór de taalcode staan.
Als u bijvoorbeeld twee parallelle documenten in een zip wilt uploaden voor een systeem met Engels naar Spaans, moeten de bestanden de naam 'data_en' en 'data_es' hebben.
Vertaalgeheugenbestanden (TMX, XLF, XLIFF, LCL, XLSX) hoeven niet de specifieke taalnaamconventie te volgen.