{ End Bracket }

O surgimento da tradução automática

Vikram Dendi

Historiadores e futurologistas têm ficado igualmente fascinados com a idéia da comunicação sem a barreira dos idiomas. Celebridades da ficção científica deram asas à idéia criando o Babel Fish ou o Universal Translator, enquanto a história nos informa sobre a lendária Pedra de Roseta, na qual um só texto estava escrito em três idiomas. Em um mundo cada vez mais nivelado, é mais importante do que nunca ser capaz de entender uma mensagem, independentemente do idioma.

Nas últimas décadas, muitos métodos têm sido adotados para solucionar esse problema. A tradução automática (TA) é um deles e está disponível há décadas, mas não conseguiu se tornar onipresente mesmo depois de anos de investimentos em pesquisa. Nos anos 60, havia um acrônimo inventado para aquilo que os pesquisadores queriam obter com a tradução: FAHQT — tradução automática de texto totalmente automática e de alta qualidade. Essa abordagem idealista da TA provou ser ilusória e, com o tempo, foi inventado um acrônimo talvez um pouco mais preciso: FAUT — tradução útil totalmente automática. A meta não era competir com um tradutor humano, mas criar um sistema que fosse suficientemente preciso para oferecer traduções em tempo real que fossem úteis para o usuário médio.

Na Microsoft, os pesquisadores vêm trabalhando por mais de uma década visando esse objetivo. O método que esses pesquisadores adotam combina lógica baseada em regras com métodos estatísticos, criando um sistema híbrido sintático e estatístico. Nos pares de idiomas (texto original e traduzido) em que se pode usar informações linguísticas substanciais, utiliza-se o conhecimento de gramática e de sintaxe no pré-processamento e no pós-processamento, em torno de um mecanismo estatístico básico. Quando não dispomos de tantas informações, mudamos para um modelo puramente estatístico que se adapta bem a um grande número de pares de idiomas.

A tecnologia de tradução automática que desenvolvemos já provou ser muito valiosa na Microsoft, tendo sido usada desde 2003 para traduzir aproximadamente 140.000 artigos da Base de Dados para nove importantes idiomas. Muitas outras equipes da empresa têm usado a tecnologia para reduzir os custos e aprimorar a cobertura de seus esforços de localização. Em 2005, a equipe de TA foi solicitada a ampliar seu escopo e, desde então, concentrou-se em expandir o uso dessa tecnologia fora da empresa. Nosso serviço Web de tradução, de domínio geral, tem sido exposto por meio de pesquisa (fornecendo a funcionalidade de tradução para os resultados de pesquisas), do Microsoft Office (fornecendo tradução de documentos e trechos), do Windows Live Messenger (como um programa bot de tradução) e outros (consulte microsofttranslator.com).

Os esforços para oferecer serviços de tradução de domínio geral para a Web estão ganhando força. O real valor da TA não está apenas na qualidade oferecida pelo mecanismo de tradução, mas em como essas traduções são oferecidas nos cenários e nos meios de abordar qualquer questão de qualidade. Diferentemente de pesquisa, notícias, entretenimento ou jogos, o valor percebido da tradução tem sido limitado devido à inconsistência histórica na qualidade das traduções. É essencial que os criadores de produtos saibam como maximizar o potencial da TA.

Ao contrário de hoje em dia, em que a maioria das ofertas de tradução está nos portais e sites de tradução, o valor máximo da tradução automática será o de um ingrediente básico e essencial para os cenários que tenham como alvo um público com diferenças linguísticas. Acreditamos que é importante fornecer os meios aos desenvolvedores, às comunidades e aos criadores de conteúdo, para que integrem a tradução em seus fluxos de trabalho e usem-na como um meio de aproveitar a força da comunidade.

O Translation Wiki do MSDN é um bom exemplo prático desses princípios. A comunidade é autorizada a colaborar para melhorar a qualidade da tradução e também a contribuir com conteúdo novo — uma combinação de tecnologia básica e força da comunidade.

A tradução automática é uma tecnologia "imperfeita" e, em vez de avaliar os resultados da pesquisa, transfere para o usuário o ônus de aplicar seu julgamento quanto à adequação dos resultados fornecidos. Além disso, da mesma forma que as pesquisas, ela às vezes pode ser surpreendentemente precisa e apresenta o escopo para um aperfeiçoamento contínuo com novos dados. A Microsoft está fazendo investimentos significativos para aumentar a qualidade das traduções.

Minha previsão é que este ano será importante para a tradução automática. Em conjunto com a força maciça que pode ser aproveitada na Web, que está se tornando cada vez mais social, a tradução automática está começando a realizar seu potencial. Nos próximos meses, preste atenção nos novos e empolgantes métodos de tradução automática que transporão as dificuldades de idiomas em todo o mundo.

Vikram Dendi é gerente sênior de produtos na equipe do Microsoft Translator. Ele é responsável pela estratégia comercial e pelo planejamento de produtos e está trabalhando para habilitar os desenvolvedores a criar uma Web sem muros. Ele mantém um blog em viks.org e participa em blogs.msdn.com/translation.