Co je překlad dokumentů?

překlad dokumentů je cloudová funkce služby azure Translator , která je součástí řady rozhraní REST api služby azure pro rozpoznávání. V tomto přehledu se dozvíte, jak můžete použít rozhraní API pro překlad dokumentu k překladu několika a složitých dokumentů napříč všemi podporovanými jazyky a dialekty při zachování původní struktury dokumentů a formátu dat.

Tato dokumentace obsahuje následující typy článků:

  • Rychlé starty jsou pokyny Začínáme, které vám pomohou při provádění požadavků na službu.
  • Návody obsahují pokyny k použití této funkce v konkrétnějším nebo přizpůsobeném způsobu.
  • Odkaz poskytuje REST API nastavení, hodnoty, klíčová slova a konfiguraci.

Funkce klíče pro překlad dokumentu

Funkce Popis
Překlad velkých souborů Převede všechny dokumenty asynchronně.
Přeložit množství souborů Přeloží více souborů napříč všemi podporovanými jazyky a dialekty při zachování struktury dokumentů a formátu dat.
Zachovat prezentaci zdrojového souboru Přeloží soubory a zachová původní rozložení a formát.
Použít vlastní překlad Přeloží dokumenty pomocí obecných a vlastních modelů překladu .
Použít vlastní Glossaries Přeloží dokumenty pomocí vlastních Glossaries.
Automaticky zjišťovat jazyk dokumentu Umožňuje, aby služba překladu dokumentů určila jazyk dokumentu.
Překlad dokumentů s obsahem v různých jazycích Použijte funkci automatického rozpoznávání k překladu dokumentů s obsahem v různých jazycích do svého cílového jazyka.

Poznámka

Při překladu dokumentů s obsahem v různých jazycích je tato funkce určena pro úplné věty v jednom jazyce. Pokud se věty skládají z více než jednoho jazyka, nemusí se tento obsah přeložit do cílového jazyka.

Možnosti vývoje překladu dokumentů

Překlad dokumentů můžete do svých aplikací přidat pomocí REST API nebo sady SDK pro klientské knihovny:

  • REST API. je rozhraní nezávislá jazyka, které umožňuje vytvářet požadavky HTTP a hlavičky autorizace k překladu dokumentů.

  • Sady SDK klientské knihovny jsou třídy, objekty, metody a kód specifické pro jazyk, které lze rychle použít přidáním odkazu do projektu. V současné době překlad dokumentů má programovací jazykovou podporu pro C#/.NET a Python.

Začínáme

V průvodci návodem se dozvíte, jak rychle začít používat Translator dokumentů. Začněte tím, že budete potřebovat aktivní účet Azure. Pokud ho nemáte, můžete si vytvořit bezplatný účet.

Podporované formáty dokumentů

Překlad dokumentu podporuje následující typy souborů dokumentů:

Typ souboru Přípona souboru Popis
Adobe PDF formátu Formát formátu PDF aplikace Adobe Acrobat
Comma-Separated hodnoty csv Soubor nezpracovaných dat oddělený čárkami, který používají tabulkové programy.
HTML HTML, htm Technologie Hyper Text Markup Language.
Formát souborů pro výměnu lokalizace xlf. , XLIFF Formát paralelního dokumentu, který exportuje systémy překladu paměti. Používané jazyky jsou definovány v souboru.
Markdown Markdownu, mdown, mkdn, MD, MKD, mdwn, mdtxt, mdtext, RMD Jednoduchý jazyk značek pro vytváření formátovaného textu.
MHTML MTHML, MHT Formát archivu webové stránky, který slouží ke kombinování kódu HTML a jeho doprovodných prostředků.
Microsoft Excel XLS, XLSX Soubor tabulky pro analýzu a dokumentaci k datům.
Microsoft Outlook msg E-mailová zpráva vytvořená nebo uložená v rámci Microsoft Outlook.
Microsoft PowerPoint PPT, PPTX Prezentační soubor, který slouží k zobrazení obsahu ve formátu prezentace.
Microsoft Word doc, DOCX Textový soubor dokumentu.
Text ve formátu OpenDocument Nástroj Otevřený zdrojový soubor s textovými dokumenty.
Prezentace ve formátu OpenDocument ODP Open Source prezentační soubor.
Tabulka ve formátu OpenDocument ODS Open Source soubor tabulky.
Rich Text Format připojeny Textový dokument obsahující formátování
Tabulátory nebo hodnoty oddělené tabulátorem TSV/TAB Soubor nezpracovaných dat oddělený tabulátorem používaný tabulkovými aplikacemi.
Text txt Neformátovaný textový dokument.

Podporované formáty glosáře

Překlad dokumentu podporuje následující typy souborů glosáře:

Typ souboru Přípona souboru Popis
Comma-Separated hodnoty csv Soubor nezpracovaných dat oddělený čárkami, který používají tabulkové programy.
Formát souborů pro výměnu lokalizace XLF, XLIFF Formát paralelního dokumentu, který umožňuje exportovat systémy překladu paměti, které používají jazyky, jsou definovány v souboru.
Hodnoty Tab-Separated/TAB TSV, TAB Soubor nezpracovaných dat oddělený tabulátorem používaný tabulkovými aplikacemi.

Další kroky