Doprovodné materiály pro zásady vytváření názvů a formáty dokumentů
Každý soubor použitý pro vlastní překlad musí mít délku aspoň čtyři znaky.
Tato tabulka obsahuje všechny podporované formáty souborů, které můžete použít k sestavení systému překladu:
Formát | Rozšíření | Description |
---|---|---|
Soubor XLIFF | . XLF. Soubor XLIFF | Paralelní formát dokumentu, export systémů překladové paměti. Použité jazyky jsou definovány uvnitř souboru. |
TMX | . TMX | Paralelní formát dokumentu, export systémů překladové paměti. Použité jazyky jsou definovány uvnitř souboru. |
ZIP | .ZIP | ZIP je formát souboru archivu. |
Locstudio | . LCL | Formát Microsoftu pro paralelní dokumenty |
Microsoft Word | .DOCX | Dokument microsoft Word |
Adobe Acrobat | Přenosný dokument Adobe Acrobat | |
HTML | .HTML, .HTM | Dokument HTML |
Textový soubor | .TXT | Textové soubory s kódováním UTF-16 nebo UTF-8. Název souboru nesmí obsahovat japonské znaky. |
Zarovnaný textový soubor | . ZAROVNAT | .ALIGN Rozšíření je speciální rozšíření, které můžete použít, pokud víte, že věty v páru dokumentů jsou dokonale zarovnané. Pokud zadáte .ALIGN soubor, Custom Translator nezarovná věty za vás. |
Excelové soubory | .XLSX | Excelový soubor (2013 nebo novější). První řádek nebo řádek tabulky by měl být kód jazyka. |
Formáty slovníku
Pro slovníky podporuje Custom Translator všechny formáty souborů, které se podporují pro trénovací sady. Pokud používáte slovník v Excelu, měl by první řádek nebo řádek tabulky obsahovat kódy jazyka.
Formáty souborů ZIP
Dokumenty je možné seskupit do jednoho souboru ZIP a nahrát je. Custom Translator podporuje formáty souborů ZIP (ZIP, GZ a TGZ).
Každý dokument v souboru zip s příponou TXT, HTML, HTM, PDF, DOCX, ALIGN musí dodržovat tyto zásady vytváření názvů:
{document name}_{language code} kde {document name} je název dokumentu, {language code} je ISO LanguageID (dva znaky), což označuje, že dokument obsahuje věty v daném jazyce. Před kódem jazyka musí být podtržítko (_).
Pokud chcete například nahrát dva paralelní dokumenty v souboru ZIP pro systém překladu z angličtiny do španělštiny, měly by tyto soubory být pojmenovány data_en a data_es.
U souborů překladových paměti (TMX, XLF, XLIFF, LCL, XLSX) se dodržování konkrétních zásad pojmenování pro dané jazyky nevyžaduje.