Share via


Guide sur les formats de documents et les conventions d’affectation de noms

N’importe quel fichier utilisé pour un modèle de traduction personnalisée doit être d’au moins quatre caractères.

Cette table comprend tous les formats de fichier pris en charge que vous pouvez utiliser pour générer votre système de traduction :

Format Extensions Description
XLIFF .XLF, .XLIFF Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier.
TMX .TMX Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier.
ZIP .ZIP ZIP est un format de fichier d’archive.
LocStudio .LCL Un format de Microsoft pour les documents parallèles
Microsoft Word .DOCX Document Microsoft Word
Adobe Acrobat .PDF Document de la version portable d’Adobe Acrobat
HTML .HTML, .HTM Document HTML
Fichier texte .TXT Fichiers texte encodés en UTF-16 ou UTF-8. Le nom de fichier ne doit pas contenir de caractères japonais.
Fichier d’alignement de textes .ALIGN L’extension .ALIGN est une extension spéciale que vous pouvez utiliser si vous savez que des phrases de votre paire de documents se correspondent parfaitement. Si vous fournissez un fichier .ALIGN, Custom Translator n’aligne pas les phrases pour vous.
Fichier Excel .XLSX Fichier Excel (2013 ou version ultérieure). La première ligne de la feuille de calcul doit être le code de langue.

Formats de dictionnaires

Pour les dictionnaires, Custom Translator prend en charge tous les formats de fichier pris en charge pour les jeux d’entraînement. Si vous utilisez un dictionnaire Excel, la première ligne de la feuille de calcul doit correspondre aux codes de langue.

Formats de fichiers compressés

Les documents peuvent être regroupées dans un seul fichier compressé et téléchargés. Custom Translator prend en charge les formats de fichiers compressés .ZIP, .GZ et .TGZ.

Chaque document du fichier zip avec l’extension TXT, HTML, HTM, PDF, DOCX, ALIGN doit suivre cette convention de nommage :

{nom du document}_{code de langue} où {nom du document} correspond au nom de votre document, {code de langue} correspond au LanguageID ISO (deux caractères), indiquant que le document contient des phrases dans cette langue. Il doit y avoir le code de langue doit être précédé d’un trait de soulignement (_).

Par exemple, afin de charger deux documents parallèles dans un fichier zip pour un système traduisant de l’anglais vers l’espagnol, les fichiers doivent être nommés « data_en » et « data_es ».

Cette convention de nommage utilisée pour indiquer une langue spécifique ne s’applique pas aux fichiers de mémoire de traduction (TMX, XLF, XLIFF, LCL, XLSX).

Étapes suivantes