本文章是由機器翻譯。

{ End Bracket }

機器翻譯的出現

Vikram Dendi

打破語言界限進行溝通這一想法讓歷史學家和未來學家為之著迷。 科幻小說作家展開想像的翅膀,創造出了寶貝魚和萬能翻譯,而歷史學家則為我們講述了神秘的羅賽塔石碑,它能將一個文字翻譯為三種語言。 隨著全球化的趨勢愈發明顯,能夠讓資訊超越語言限制成為重中之重。

在過去的幾十年裡,為解決這一問題已採納了多種方案。 機器翻譯 (MT) 就是其中的一位元老,但即便是在研究領域中做了多年投入,它至今仍未普及。 早在二十世紀六十年代,就出現過一個縮寫詞,描繪了研究人員夢寐以求的翻譯目標:FAHQT—常用文字的全自動高品質翻譯。 事實證明,這一理想化的 MT 方式只是空中樓閣,隨後又誕生了一個可能更準確一些的縮寫詞:FAUT—全自動有用翻譯。 它的目標是不使用人工,創建一個系統,它能足夠準確地給出即時翻譯,為一般使用者提供説明。

在 Microsoft,研究人員已經為此做出了十餘年的努力。 研究人員採用的措施是將基於規則的邏輯與統計方法組合在一起,創建一個混合型統計造句系統。 對於我們可以利用實質語言資訊的語言對(原文和譯文),我們圍繞統計核心引擎在前期和後期處理中使用語法和句法知識。 如果沒有這類資訊,我們會轉為使用純統計模型,它能順利轉換為多種語言對。

我們開發的機器翻譯技術已在 Microsoft 內部彰顯出自己的出色價值,自 2003 年起,我們已使用這項技術將 140,000 余篇知識庫文章翻譯為九種主要語言。 公司內的許多其他團隊也在使用這項技術降低成本,並改良當地語系化的工作範疇。 2005 年,MT 團隊受命擴大其作用範圍,從那時起,我們的側重點就轉向在公司外部推廣使用這項技術。 我們的一般域翻譯 Web 服務已通過搜索(提供對搜索結果的翻譯)、Microsoft Office(提供段落和檔翻譯)、Windows Live Messenger(充當翻譯工具)等(請參閱microsofttranslator.com)加以公開。

目前正在向為 Web 提供一般域翻譯服務這一目標努力。 MT 的真正價值不僅僅在於翻譯引擎所提供的品質,如何在各種不同的環境中提供這些翻譯以及解決任何品質問題的措施也是其衡量標準。 由於翻譯品質的參差不一,使得對翻譯價值的認識受到限制,這一點與搜索、新聞、娛樂或遊戲不同。 產品的構建方非常有必要瞭解如何最大限度地發揮 MT 的潛能。

現在,大多數翻譯工具都是門戶網站或翻譯網站,但將來翻譯的最大價值是成為多語言受眾環境中的主角。 我們相信,十分有必要為開發人員、社區和內容創建者提供一種方式,説明他們將翻譯集成到工作流中,並用它加強社區的作用。

MSDN Translation Wiki 就是這些原則在實踐中的一個良好示例。 社區得以説明改進翻譯的品質並創造出了新的產物——核心技術與社區功能的組合體。

機器翻譯不是一項十全十美的技術,它與評估搜索結果不同,後者只需讓使用者根據結果的合適程度做出評價即可。 它與搜索的類似之處是:二者均能不時提供讓人驚訝的準確性,並通過顯示範圍不斷改良新資料。 Microsoft 在提高翻譯品質方面投入了鉅資。

我預計本年度對於機器翻譯而言至關重要。 伴隨著不斷普及的社交網站所帶來的強大功效,機器翻譯也開始發揮它的潛能。 在未來的幾個月裡,請密切關注機器翻譯的新奇表現,它會在全球各地填平語言的溝壑。

Vikram Dendi 是 Microsoft Translator 團隊的一名高級產品經理。 他負責業務策略和產品規劃,並致力於説明開發人員構建無障礙的 Web。 他的博客網址是viks.orgblogs.msdn.com/translation