Vad är dokumentöversättning?

Dokumentöversättning är en molnbaserad funktion i Azure Translator-tjänsten och är en del av Azure Cognitive Service-familjen med REST-API:er. I den här översikten får du lära dig hur API:et för dokumentöversättning kan användas för att översätta flera och komplexa dokument på alla språk och dialekter som stöds samtidigt som den ursprungliga dokumentstrukturen och dataformatet bevaras.

Den här dokumentationen innehåller följande artikeltyper:

  • Snabbstarter är komma igång-instruktioner som vägleder dig genom att göra begäranden till tjänsten.
  • Instruktionsguider innehåller instruktioner för att använda funktionen på mer specifika eller anpassade sätt.
  • Referens anger REST API, värden, nyckelord och konfiguration.

Nyckelfunktioner för dokumentöversättning

Funktion Beskrivning
Översätta stora filer Översätta hela dokument asynkront.
Översätta flera filer Översätta flera filer över alla språk och dialekter som stöds samtidigt som dokumentstrukturen och dataformatet bevaras.
Bevara presentationen av källfilen Översätt filer samtidigt som den ursprungliga layouten och formatet bevaras.
Använda anpassad översättning Översätta dokument med hjälp av allmänna och anpassade översättningsmodeller.
Använda anpassade ordlistor Översätta dokument med hjälp av anpassade ordlistor.
Identifiera dokumentspråk automatiskt Låt tjänsten För dokumentöversättning fastställa språket i dokumentet.
Översätta dokument med innehåll på flera språk Använd funktionen Identifiera automatiskt för att översätta dokument med innehåll på flera språk till målspråket.

Anteckning

När du översätter dokument med innehåll på flera språk är funktionen avsedd för fullständiga meningar på ett enda språk. Om meningar består av mer än ett språk kan det hända att innehållet inte översätts till målspråket.

Utvecklingsalternativ för dokumentöversättning

Du kan lägga till dokumentöversättning i dina program med REST API eller ett klientbiblioteks-SDK:

  • Den REST API. är ett språkoberoende gränssnitt som gör att du kan skapa HTTP-begäranden och auktoriseringshuvuden för att översätta dokument.

  • Klientbiblioteks-SDK:erna är språkspecifika klasser, objekt, metoder och kod som du snabbt kan använda genom att lägga till en referens i projektet. För närvarande har dokumentöversättning stöd för programmeringsspråk för C#/.NET och Python.

Kom igång

I vår guide får du lära dig hur du snabbt kommer igång med document Translator. För att börja behöver du ett aktivt Azure-konto. Om du inte har ett konto kan du skapa ett kostnadsfritt konto.

Dokumentformat som stöds

Följande dokumentfiltyper stöds av dokumentöversättning:

Filtyp Filnamnstillägg Description
Adobe PDF pdf Adobe Acrobat Portable Document-format
Comma-Separated värden csv En kommaavgränsad rådatafil som används av kalkylbladsprogram.
HTML html, htm Hyper Text Markup Language.
Format för växlingsfil för lokalisering Xlf. , xliff Ett parallellt dokumentformat, export av översättningsminnessystem. De språk som används definieras i filen.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Ett förenklat markeringsspråk för att skapa formaterad text.
MHTML mthml, mht Ett format för webbplatsarkiv som används för att kombinera HTML-kod och tillhörande resurser.
Microsoft Excel xls, xlsx En kalkylbladsfil för dataanalys och dokumentation.
Microsoft Outlook msg Ett e-postmeddelande som skapats eller sparats i Microsoft Outlook.
Microsoft PowerPoint ppt, pptx En presentationsfil som används för att visa innehåll i ett bildspelsformat.
Microsoft Word doc, docx En textdokumentfil.
OpenDocument-text Odt En textdokumentfil med öppen källkod.
OpenDocument-presentation Odp En presentationsfil med öppen källkod.
OpenDocument-kalkylblad Ods En kalkylbladsfil med öppen källkod.
RTF-format rtf Ett textdokument som innehåller formatering.
Tabbavgränsade värden/TABB tsv/tab En tabbavgränsad rådatafil som används av kalkylbladsprogram.
Text Txt Ett oformaterat textdokument.

Ordlisteformat som stöds

Följande typer av ordlista stöds av dokumentöversättning:

Filtyp Filnamnstillägg Description
Comma-Separated värden csv En kommaavgränsad rådatafil som används av kalkylbladsprogram.
Format för växlingsfil för lokalisering xlf , xliff Ett parallellt dokumentformat, export av översättningsminnessystem De språk som används definieras i filen.
Tab-Separated värden/TAB tsv, tab En tabbavgränsad rådatafil som används av kalkylbladsprogram.

Nästa steg