Co je překlad dokumentu?

Překlad dokumentů je cloudová funkce strojového překladu služby Azure AI Translator . Při zachování původní struktury dokumentů a datového formátu můžete přeložit více a složitých dokumentů ve všech podporovaných jazycích a dialektech . Rozhraní API pro překlad dokumentů podporuje dvě operace překladu:

  • Asynchronní dávkové překlady dokumentů podporují asynchronní zpracování více dokumentů a velkých souborů. Proces dávkového překladu vyžaduje účet služby Azure Blob Storage s kontejnery pro váš zdrojový a přeložený dokument.

  • Synchronní překlad dokumentů podporuje synchronní zpracování jednoho překladu souborů. Proces překladu souborů nevyžaduje účet služby Azure Blob Storage. Konečná odpověď obsahuje přeložený dokument a vrátí se přímo volajícímu klientovi.

Asynchronní dávkové překlady

K překladu více dokumentů a velkých souborů použijte asynchronní zpracování dokumentů.

Klíčové funkce služby Batch

Funkce Popis
Překlad velkých souborů Asynchronní překlad celých dokumentů
Překlad mnoha souborů Při zachování struktury dokumentů a formátu dat můžete přeložit více souborů ve všech podporovaných jazycích a dialektech.
Zachování prezentace zdrojového souboru Soubory můžete přeložit při zachování původního rozložení a formátu.
Použití vlastního překladu Překlad dokumentů pomocí obecných a vlastních modelů překladu
Použití vlastních glosářů Překlad dokumentů pomocí vlastních glosářů
Automatická detekce jazyka dokumentu Nechte službu Překlad dokumentů určit jazyk dokumentu.
Překlad dokumentů s obsahem ve více jazycích Pomocí funkce automatického rozpoznávání můžete překládat dokumenty s obsahem ve více jazycích do cílového jazyka.

Možnosti vývoje služby Batch

Překlad dokumentů můžete do svých aplikací přidat pomocí rozhraní REST API nebo sady SDK klientské knihovny:

  • Rozhraní REST API. je jazykové nezávislé rozhraní, které umožňuje vytvářet požadavky HTTP a autorizační hlavičky pro překlad dokumentů.

  • Sady SDK klientské knihovny jsou třídy specifické pro jazyk, objekty, metody a kód, které můžete rychle použít přidáním odkazu do projektu. Překlad dokumentů v současné době podporuje programovací jazyk C#/.NET a Python.

Formáty dokumentů podporované službou Batch

Metoda Získat podporované formáty dokumentů vrátí seznam formátů dokumentů podporovaných službou Překlad dokumentů. Seznam obsahuje společnou příponu souboru a typ obsahu, pokud používáte rozhraní API pro nahrávání.

Typ souboru Přípona souboru Popis
Adobe PDF pdf Formát souboru přenosného dokumentu. Překlad dokumentů používá technologii optického rozpoznávání znaků (OCR) k extrakci a překladu textu v naskenovaném dokumentu PDF při zachování původního rozložení.
Hodnoty oddělené čárkami csv Soubor nezpracovaných dat oddělený čárkami používaný tabulkovými programy.
HTML html, htm Jazyk značek hypertextu
Formát souboru Interchange pro lokalizaci Xlf Paralelní formát dokumentu, export systémů paměti překladu. Používané jazyky jsou definovány uvnitř souboru.
Markdown markdown, mdown, , mdmdwnmdtxtmkdnmkd, , mdtextrmd Jednoduchý jazyk značek pro vytváření formátovaného textu.
MHTML mthml, mht Formát archivu webové stránky, který slouží ke kombinování kódu HTML a jeho doprovodných prostředků.
Microsoft Excel xls, xlsx Tabulkový soubor pro analýzu dat a dokumentaci.
Microsoft Outlook msg E-mailová zpráva vytvořená nebo uložená v aplikaci Microsoft Outlook
Microsoft PowerPoint ppt, pptx Soubor prezentace použitý k zobrazení obsahu ve formátu prezentace.
Microsoft Word doc, docx Textový soubor dokumentu.
OpenDocument Text odt Soubor open source textového dokumentu.
Prezentace ve formátu OpenDocument odp Opensourcový soubor prezentace.
OpenDocument Spreadsheet ods Opensourcový soubor tabulky.
Formát RTF rtf Textový dokument obsahující formátování.
Hodnoty oddělené tabulátorem /TAB tsv/tab Nezpracovaný datový soubor oddělený tabulátorem používaný tabulátory.
Text txt Neformátovaný textový dokument

Starší typy souborů služby Batch

Typy zdrojových souborů se zachovají během překladu dokumentu s následujícími výjimkami:

Přípona zdrojového souboru Přeložená přípona souboru
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Formáty glosáře podporované službou Batch

Překlad dokumentů podporuje následující typy souborů glosáře:

Typ souboru Přípona souboru Popis
Hodnoty oddělené čárkami csv Soubor nezpracovaných dat oddělený čárkami používaný tabulkovými programy.
Formát souboru Interchange pro lokalizaci xlf , xliff Paralelní formát dokumentu, export systémů paměti překladu Jazyky, které se používají, jsou definovány uvnitř souboru.
Hodnoty oddělené tabulátory /TAB tsv, tab Nezpracovaný datový soubor oddělený tabulátorem používaný tabulátory.

Synchronní překlad

Pomocí synchronního zpracování překladu odešlete dokument jako součást textu požadavku HTTP a obdržíte přeložený dokument v odpovědi HTTP.

Funkce synchronního klíče překladu

Funkce Popis
Překlad jednostrákových souborů Synchronní požadavek přijímá jako vstup jenom jeden dokument.
Zachování prezentace zdrojového souboru Soubory můžete přeložit při zachování původního rozložení a formátu.
Použití vlastního překladu Překlad dokumentů pomocí obecných a vlastních modelů překladu
Použití vlastních glosářů Překlad dokumentů pomocí vlastních glosářů
Překlad s jedním jazykem Přeložit do a z jednoho podporovaného jazyka
Automatická detekce jazyka dokumentu Nechte službu Překlad dokumentů určit jazyk dokumentu.
Použití vlastních glosářů Přeloží dokument pomocí vlastního glosáře.

Synchronní podporované formáty dokumentů

Typ souboru Přípona souboru Typ obsahu Popis
Prostý text .txt text/plain Neformátovaný textový dokument
Hodnoty oddělené tabulátorem .txv
.tab
text/tab-separated-values Formát textového souboru, který používá tabulátory k oddělení hodnot a nových řádků k oddělení záznamů.
Hodnoty oddělené čárkami .csv text/csv Formát textového souboru, který používá čárky jako oddělovač mezi hodnotami.
Jazyk značek hypertextu .html
.htm
text/html HTML je standardní jazyk značek používaný ke strukturování webových stránek a obsahu.
MHTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Formát souboru archivu webové stránky.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Formát souboru založený na jazyce XML používaný pro prezentace powerpointové prezentace.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Formát souboru založený na jazyce XML používaný pro excelové tabulky.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Formát souboru založený na jazyce XML používaný pro wordové dokumenty.
Microsoft Outlook .msg application/vnd.ms-outlook Formát souboru používaný pro uložené objekty poštovní zprávy aplikace Outlook.
Výměna lokalizací xml .xlf
.xliff
application/xliff+xml Standardizovaný formát souborů založený na JAZYCE XML, který se běžně používá při zpracování překladu a lokalizačního softwaru.

Synchronní podporované formáty glosáře

Překlad dokumentů podporuje následující typy souborů glosáře:

Typ souboru Přípona souboru Popis
Hodnoty oddělené čárkami csv Soubor nezpracovaných dat oddělený čárkami používaný tabulkovými programy.
XmlLocalizationInterchange xlf , xliff Formát založený na jazyce XML navržený tak, aby standardizoval způsob předávání dat během procesu lokalizace.
TabSeparatedValues tsv, tab Nezpracovaný datový soubor oddělený tabulátorem používaný tabulátory.

Omezení žádosti o překlad dokumentů

Podrobné informace o omezeních požadavků služby Azure AI Translator najdete v tématuOmezení požadavků na překlad dokumentů.

Rezidence dat překladu dokumentů

Rezidence dat překladu dokumentů závisí na oblasti Azure, ve které byl váš prostředek Translator vytvořen:

✔️ Funkce: Koncový bod služby překladu ✔️
dokumentů: Vlastní: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Vytvořená oblast prostředku Žádost o zpracování datacentra
Globální Nejbližší dostupné datové centrum
Amerika USA – východ 2 • USA – západ 2
Asie a Tichomoří Japonsko – východ • Jihovýchodní Asie
Evropa (s výjimkou Švýcarska) Francie – střed • Západní Evropa
Švýcarsko Švýcarsko – sever • Švýcarsko – západ

Další kroky

V našem rychlém startu se dozvíte, jak rychle začít používat překlad dokumentů. Abyste mohli začít, potřebujete aktivní účet Azure. Pokud žádné nemáte, můžete si vytvořit bezplatný účet.