Doprovodné materiály pro zásady vytváření názvů a formáty dokumentů

Každý soubor použitý pro vlastní překlad musí mít délku aspoň čtyři znaky.

Tato tabulka obsahuje všechny podporované formáty souborů, které můžete použít k sestavení systému překladu:

Formát Rozšíření Description
Soubor XLIFF . XLF. Soubor XLIFF Paralelní formát dokumentu, export systémů překladové paměti. Použité jazyky jsou definovány uvnitř souboru.
TMX . TMX Paralelní formát dokumentu, export systémů překladové paměti. Použité jazyky jsou definovány uvnitř souboru.
ZIP .ZIP ZIP je formát souboru archivu.
Locstudio . LCL Formát Microsoftu pro paralelní dokumenty
Microsoft Word .DOCX Dokument microsoft Word
Adobe Acrobat .PDF Přenosný dokument Adobe Acrobat
HTML .HTML, .HTM Dokument HTML
Textový soubor .TXT Textové soubory s kódováním UTF-16 nebo UTF-8. Název souboru nesmí obsahovat japonské znaky.
Zarovnaný textový soubor . ZAROVNAT .ALIGN Rozšíření je speciální rozšíření, které můžete použít, pokud víte, že věty v páru dokumentů jsou dokonale zarovnané. Pokud zadáte .ALIGN soubor, Custom Translator nezarovná věty za vás.
Excelové soubory .XLSX Excelový soubor (2013 nebo novější). První řádek nebo řádek tabulky by měl být kód jazyka.

Formáty slovníku

Pro slovníky podporuje Custom Translator všechny formáty souborů, které se podporují pro trénovací sady. Pokud používáte slovník v Excelu, měl by první řádek nebo řádek tabulky obsahovat kódy jazyka.

Formáty souborů ZIP

Dokumenty je možné seskupit do jednoho souboru ZIP a nahrát je. Custom Translator podporuje formáty souborů ZIP (ZIP, GZ a TGZ).

Každý dokument v souboru zip s příponou TXT, HTML, HTM, PDF, DOCX, ALIGN musí dodržovat tyto zásady vytváření názvů:

{document name}_{language code} kde {document name} je název dokumentu, {language code} je ISO LanguageID (dva znaky), což označuje, že dokument obsahuje věty v daném jazyce. Před kódem jazyka musí být podtržítko (_).

Pokud chcete například nahrát dva paralelní dokumenty v souboru ZIP pro systém překladu z angličtiny do španělštiny, měly by tyto soubory být pojmenovány data_en a data_es.

U souborů překladových paměti (TMX, XLF, XLIFF, LCL, XLSX) se dodržování konkrétních zásad pojmenování pro dané jazyky nevyžaduje.

Další kroky