O que é a Tradução de Documentos?
A Tradução de Documentos é um recurso de tradução automática baseado em nuvem do serviço Azure AI Translator . Você pode traduzir vários documentos complexos em todos os idiomas e dialetos suportados, preservando a estrutura original do documento e o formato de dados. A API de tradução de documentos suporta duas operações de tradução:
A tradução assíncrona de documentos em lote suporta o processamento assíncrono de vários documentos e arquivos grandes. O processo de tradução em lote requer uma conta de armazenamento de Blob do Azure com contêineres para seus documentos de origem e traduzidos.
A tradução síncrona de documentos suporta o processamento síncrono de traduções de arquivo único. O processo de tradução de arquivos não requer uma conta de armazenamento de Blob do Azure. A resposta final contém o documento traduzido e é devolvida diretamente ao cliente chamador.
Tradução em lote assíncrona
Use o processamento assíncrono de documentos para traduzir vários documentos e arquivos grandes.
Principais recursos do lote
Funcionalidade | Description |
---|---|
Traduzir arquivos grandes | Traduza documentos inteiros de forma assíncrona. |
Traduzir inúmeros arquivos | Traduza vários arquivos em todos os idiomas e dialetos suportados, preservando a estrutura do documento e o formato de dados. |
Preservar a apresentação do arquivo de origem | Traduza arquivos preservando o layout e o formato originais. |
Aplicar tradução personalizada | Traduza documentos usando modelos de tradução gerais e personalizados. |
Aplicar glossários personalizados | Traduza documentos usando glossários personalizados. |
Detetar automaticamente o idioma do documento | Deixe que o serviço de Tradução de Documentos determine o idioma do documento. |
Traduzir documentos com conteúdo em vários idiomas | Use o recurso de deteção automática para traduzir documentos com conteúdo em vários idiomas para o idioma de destino. |
Opções de desenvolvimento em lote
Você pode adicionar a Tradução de Documentos aos seus aplicativos usando a API REST ou um SDK de biblioteca cliente:
A API REST. é uma interface agnóstica de linguagem que permite criar solicitações HTTP e cabeçalhos de autorização para traduzir documentos.
Os SDKs de biblioteca de cliente são classes, objetos, métodos e código específicos do idioma que você pode usar rapidamente adicionando uma referência em seu projeto. Atualmente a Tradução de Documentos tem suporte à linguagem de programação para C#/.NET e Python.
Formatos de documentos suportados em lote
O método Get supported document formats devolve uma lista de formatos de documentos suportados pelo serviço de Tradução de Documentos. A lista inclui a extensão de arquivo comum e o tipo de conteúdo se estiver usando a API de carregamento.
Tipo de ficheiro | Extensão de nome de ficheiro | Description |
---|---|---|
Adobe PDF | pdf |
Formato de arquivo de documento portátil. A tradução de documentos usa a tecnologia de reconhecimento ótico de caracteres (OCR) para extrair e traduzir texto em documento PDF digitalizado, mantendo o layout original. |
Valores separados por vírgulas | csv |
Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha. |
HTML | html , htm |
Linguagem de marcação de hipertexto. |
Formato de arquivo de intercâmbio de localização | XLF | Um formato de documento paralelo, exportação de sistemas de memória de tradução. As línguas utilizadas são definidas dentro do ficheiro. |
Markdown | markdown , , , , , , , mdtext , mdtxt mkdn md mdown mkd mdwn rmd |
Uma linguagem de marcação leve para criar texto formatado. |
MHTML | mthml , mht |
Um formato de arquivo de página da Web usado para combinar código HTML e seus recursos complementares. |
Microsoft Excel | xls , xlsx |
Um arquivo de planilha para análise de dados e documentação. |
Microsoft Outlook | msg |
Uma mensagem de email criada ou salva no Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
Um arquivo de apresentação usado para exibir conteúdo em um formato de apresentação de slides. |
Microsoft Word | doc , docx |
Um arquivo de documento de texto. |
Texto OpenDocument | odt |
Um ficheiro de documento de texto de código aberto. |
Apresentação OpenDocument | odp |
Um arquivo de apresentação de código aberto. |
Folha de cálculo OpenDocument | ods |
Um ficheiro de folha de cálculo de código aberto. |
Formato Rich Text | rtf |
Um documento de texto que contém formatação. |
Valores separados por tabulação/TAB | tsv /tab |
Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha. |
Texto | txt |
Um documento de texto não formatado. |
Tipos de arquivo herdados em lote
Os tipos de arquivo de origem são preservados durante a tradução do documento, com as seguintes exceções:
Extensão do arquivo de origem | Extensão de arquivo traduzido |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Formatos de glossário suportados por lote
A Tradução de Documentos suporta os seguintes tipos de ficheiros de glossário:
Tipo de ficheiro | Extensão de nome de ficheiro | Description |
---|---|---|
Valores separados por vírgulas | csv |
Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha. |
Formato de arquivo de intercâmbio de localização | xlf , xliff |
Um formato de documento paralelo, exportação de sistemas de memória de tradução As línguas utilizadas são definidas dentro do ficheiro. |
Valores separados por tabulações/TAB | tsv , tab |
Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha. |
Tradução síncrona
Use o processamento de tradução síncrona para enviar um documento como parte do corpo da solicitação HTTP e receber o documento traduzido na resposta HTTP.
Principais recursos de tradução síncrona
Funcionalidade | Description |
---|---|
Traduzir arquivos de página única | A solicitação síncrona aceita apenas um único documento como entrada. |
Preservar a apresentação do arquivo de origem | Traduza arquivos preservando o layout e o formato originais. |
Aplicar tradução personalizada | Traduza documentos usando modelos de tradução gerais e personalizados. |
Aplicar glossários personalizados | Traduza documentos usando glossários personalizados. |
Tradução em língua única | Traduza de e para um idioma suportado. |
Detetar automaticamente o idioma do documento | Deixe que o serviço de Tradução de Documentos determine o idioma do documento. |
Aplicar glossários personalizados | Traduzir um documento usando um glossário personalizado. |
Formatos de documentos síncronos suportados
Tipo de ficheiro | Extensão de nome de ficheiro | Tipo do conteúdo | Description |
---|---|---|---|
Texto simples | .txt |
text/plain |
Um documento de texto não formatado. |
Valores separados por tabulação | .txv .tab |
text/tab-separated-values |
Um formato de arquivo de texto que usa guias para separar valores e novas linhas para separar registros. |
Valores separados por vírgulas | .csv |
text/csv |
Um formato de arquivo de texto que usa vírgulas como um delimitador entre valores. |
Linguagem de marcação de hipertexto | .html .htm |
text/html |
HTML é uma linguagem de marcação padrão usada para estruturar páginas da web e conteúdo. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Um formato de arquivo de página da Web. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Um formato de arquivo baseado em XML usado para apresentações de slides do PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Um formato de arquivo baseado em XML usado para planilhas do Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Um formato de arquivo baseado em XML usado para documentos do Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Um formato de arquivo usado para objetos de mensagem de email do Outlook armazenados. |
Intercâmbio de localização XML | .xlf .xliff |
application/xliff+xml |
Um formato de arquivo padronizado baseado em XML amplamente utilizado no processamento de software de tradução e localização. |
Formatos de glossário síncronos suportados
A Tradução de Documentos suporta os seguintes tipos de ficheiros de glossário:
Tipo de ficheiro | Extensão de nome de ficheiro | Description |
---|---|---|
Valores separados por vírgulas | csv |
Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha. |
XmlLocalizationInterchange | xlf , xliff |
Um formato baseado em XML projetado para padronizar como os dados são passados durante o processo de localização. |
TabSeparatedValues | tsv , tab |
Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha. |
Limites de Pedidos de Tradução de Documentos
Para obter informações detalhadas sobre os limites de solicitação do Serviço Azure AI Translator, consulteLimites de solicitação de tradução de documentos.
Residência de dados de tradução de documentos
A residência de dados da Tradução de Documentos depende da região do Azure onde o recurso do Translator foi criado:
- Os recursos do tradutor criados em qualquer região da Europa (exceto na Suíça) são processados no centro de dados no norte da Europa e na Europa Ocidental.
- Os recursos de tradutores criados em qualquer região da Suíça são processados no data center na Suíça Norte e Suíça Oeste.
- Os recursos de tradutores criados em qualquer região da Ásia-Pacífico ou Austrália são processados em data centers no Sudeste Asiático e no Leste da Austrália.
- O recurso de tradutor criado em todas as outras regiões, incluindo Global, América do Norte e América do Sul, é processado no data center no Leste dos EUA e no Oeste dos EUA 2.
✔️ Funcionalidade: Ponto de extremidade do Serviço de Tradução ✔️
de Documentos: Personalizado: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Região do recurso | Centro de dados de processamento de pedidos |
---|---|
Qualquer região da Europa (exceto Suíça) | Europa: Norte da Europa • Europa Ocidental |
Suíça | Suíça: Suíça Norte • Suíça Oeste |
Qualquer região da Ásia-Pacífico e Austrália | Ásia: Sudeste Asiático • Austrália Leste |
Todas as outras regiões, incluindo Global, América do Norte e América do Sul | EUA: Leste dos EUA • Oeste dos EUA 2 |
Próximos passos
Em nosso guia de início rápido, você aprende como começar a usar rapidamente a Tradução de Documentos. Para começar, você precisa de uma conta ativa do Azure. Se não tiver uma, poderá criar uma conta gratuita.