¿Qué es la traducción de documentos?
La traducción de documentos es una característica basada en la nube del servicio Azure Translator y forma parte de la familia de Azure Cognitive Services de las API de REST. En esta introducción, aprenderá cómo se puede usar la API de traducción de documentos para traducir varios documentos complejos en todos los idiomas y dialectos admitidos, a la vez que se conserva la estructura del documento original y el formato de datos.
Esta documentación contiene los siguientes tipos de artículos:
- Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
- Las guías de procedimientos contienen instrucciones para usar la característica de una manera más específica o personalizada.
- La referencia proporciona la configuración, los valores, las palabras clave y la configuración de la API REST.
Características clave de la traducción de documentos
| Característica | Descripción |
|---|---|
| Traducir archivos grandes | Traducir documentos completos de forma asincrónica. |
| Traducir numerosos archivos | Traduzca varios archivos entre todos los idiomas y dialectos admitidos manteniendo la estructura del documento y el formato de los datos. |
| Conservar la presentación del archivo de origen | Traducir archivos conservando el diseño y el formato originales. |
| Aplicar traducción personalizada | Traducir documentos con modelos de traducción personalizada y general. |
| Aplicar glosarios personalizados | Traducir documentos mediante glosarios personalizados. |
| Detectar automáticamente el idioma del documento | Permita que el servicio de traducción de documentos determine el idioma del documento. |
| Traducir documentos con contenido en varios idiomas | Use la característica de detección automática para traducir documentos con contenido en varios idiomas al idioma de destino. |
Nota
Al traducir documentos con contenido en varios idiomas, la característica está pensada para oraciones completas en un solo idioma. Si las oraciones incluyen más de un idioma, es posible que el contenido no se traduzca al idioma de destino.
Opciones de desarrollo de traducción de documentos
Puede agregar la traducción de documentos a las aplicaciones mediante la API REST o un SDK de biblioteca de cliente:
La API REST. es una interfaz independiente del lenguaje que permite crear solicitudes HTTP y encabezados de autorización para traducir documentos.
Los SDK de biblioteca cliente son clases, objetos, métodos y código específicos del lenguaje que puede usar rápidamente si agrega una referencia en el proyecto. Actualmente, la traducción de documentos es compatible con los lenguajes de programación C#/.NET y Python.
Introducción
En nuestra guía de paso a paso, aprenderá a empezar a trabajar rápidamente con el traductor de documentos. Para empezar, necesitará una cuenta de Azure activa. En caso de no tener ninguna, puede crear una gratis.
Formatos de documento admitidos
Los siguientes tipos de archivo de documento son compatibles con la traducción de documentos:
| Tipo de archivo | Extensión de archivo | Descripción |
|---|---|---|
| PDF de Adobe | Portable Document Format de Adobe Acrobat | |
| Valores separados por comas | csv | Archivo de datos sin formato delimitados por comas que usan los programas de hoja de cálculo. |
| HTML | html, htm | Lenguaje de marcado de hipertexto |
| Formato de archivo de intercambio de localización | xlf. , xliff | Formato de documento paralelo que se exporta desde los sistemas de memoria de traducción. Los idiomas utilizados se definen dentro del archivo. |
| Markdown | markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd | Lenguaje de incremento ligero para crear texto con formato. |
| MHTML | mthml, mht | Formato de archivo de página web que se usa para combinar código HTML y sus recursos complementarios. |
| Microsoft Excel | xls, xlsx | Archivo de hoja de cálculo para el análisis de datos y la documentación |
| Microsoft Outlook | msg | Mensaje de correo electrónico creado o guardado en Microsoft Outlook |
| Microsoft PowerPoint | ppt, pptx | Archivo de presentación utilizado para mostrar contenido en formato de presentación |
| Microsoft Word | doc, docx | Archivo de documento de texto |
| Texto de OpenDocument | odt | Archivo de documento de texto de código abierto. |
| Presentación de OpenDocument | odp | Archivo de presentación de código abierto. |
| Hoja de cálculo de OpenDocument | ods | Archivo de hoja de cálculo de código abierto. |
| Formato de texto enriquecido | rtf | Documento de texto que incluye formato. |
| Valores separados por tabulaciones/TAB | tsv/tab | Archivo de datos sin formato delimitado por tabulaciones que usan los programas de hoja de cálculo. |
| Texto | txt | Documento de texto sin formato |
Formatos de glosario compatibles
Los siguientes tipos de archivo de glosario son compatibles con la traducción de documentos:
| Tipo de archivo | Extensión de archivo | Descripción |
|---|---|---|
| Valores separados por comas | csv | Archivo de datos sin formato delimitados por comas que usan los programas de hoja de cálculo. |
| Formato de archivo de intercambio de localización | xlf , xliff | Formato de documento paralelo, exportación de sistemas de memoria de traducción. Los idiomas usados se definen dentro del archivo. |
| Valores separados por tabulaciones/TAB | tsv, tab | Archivo de datos sin formato delimitado por tabulaciones que usan los programas de hoja de cálculo. |