De richtlijnen voor documentindelingen en naamconventie

Elk bestand dat wordt gebruikt voor aangepaste vertaling, moet ten minste vier tekens lang zijn.

Deze tabel bevat alle ondersteunde bestandsindelingen die u kunt gebruiken om uw vertaalsysteem te bouwen:

Indeling Uitbreidingen Beschrijving
XLIFF . XLF. XLIFF Een parallelle documentindeling, export van vertaalgeheugensystemen. De gebruikte talen worden gedefinieerd in het bestand.
TMX . TMX Een parallelle documentindeling, export van vertaalgeheugensystemen. De gebruikte talen worden gedefinieerd in het bestand.
ZIP .ZIP ZIP is een archiefbestandsindeling.
Locstudio . LCL Een Microsoft-indeling voor parallelle documenten
Microsoft Word .DOCX Microsoft Word-document
Adobe Acrobat .PDF Adobe Acrobat portable document
HTML .HTML, .HTM HTML-document
Tekstbestand .TXT Met UTF-16 of UTF-8 gecodeerde tekstbestanden. De bestandsnaam mag geen Japanse tekens bevatten.
Uitgelijnd tekstbestand . UITLIJNEN De extensie .ALIGN is een speciale extensie die u kunt gebruiken als u weet dat de zinnen in het documentpaar perfect zijn uitgelijnd. Als u een .ALIGN bestand opgeeft, worden de zinnen niet voor u uitgelijnd.
Excel-bestand .XLSX Excel-bestand (2013 of hoger). De eerste regel/rij van het werkblad moet taalcode zijn.

De woordenlijstindelingen

Voor de woordenlijsten ondersteunt Custom Translator alle bestandsindelingen die worden ondersteund voor trainingssets. Als u een Excel-woordenlijst gebruikt, dan moet de eerste regel/rij van het werkblad taalcodes zijn.

De zip-bestandsindelingen

Documenten kunnen worden gegroepeerd in één zip-bestand en dan worden geüpload. Custom Translator ondersteunt deze volgende zip-bestandsindelingen (ZIP, GZ en TGZ).

Elk document in het zip-bestand met de extensie TXT, HTML, HTM, PDF, DOCX, ALIGN moet deze naamconventie volgen:

{documentnaam}_{taalcode} waarbij {documentnaam} de naam van uw document is, is {language code} de ISO LanguageID (twee tekens), waarmee wordt aangegeven dat het document zinnen in die taal bevat. Er moet een onderstrepingsteken (_) vóór de taalcode staan.

Als u bijvoorbeeld twee parallelle documenten in een zip wilt uploaden voor een systeem met Engels naar Spaans, moeten de bestanden de naam 'data_en' en 'data_es' hebben.

Vertaalgeheugenbestanden (TMX, XLF, XLIFF, LCL, XLSX) hoeven niet de specifieke taalnaamconventie te volgen.

Volgende stappen