專業(yè)翻譯領(lǐng)域的首選技術(shù) - 翻譯記憶
縱觀當(dāng)前國內(nèi)翻譯軟件市場,今天譯"星",明日譯"霸",群雄并起,競爭激烈。仔細(xì)分析這些產(chǎn)品之后,我們可以將其分為兩大類:電子辭典和機(jī)器翻譯。
電子辭典的優(yōu)點(diǎn)自不待言,對詞的翻譯準(zhǔn)確而且快速,但在專業(yè)翻譯領(lǐng)域,電子辭典所能做的畢竟十分有限。
機(jī)器機(jī)器翻譯又稱自動(dòng)化翻譯,其宗旨是在一定范圍或一定領(lǐng)域內(nèi)取代翻譯人員的勞動(dòng)。但語言是一套非常復(fù)雜的系統(tǒng),人的翻譯是十分復(fù)雜的高級(jí)智能,在現(xiàn)有語言學(xué)研究水平和計(jì)算機(jī)人工智能研究水平的基礎(chǔ)上,要開發(fā)出取代大部分人工翻譯的機(jī)器翻譯系統(tǒng),幾乎是不可能的。從目前世界上和國內(nèi)的各種機(jī)器翻譯的產(chǎn)品測試中可以看出,機(jī)器翻譯離工業(yè)化應(yīng)用的標(biāo)準(zhǔn)還相差甚遠(yuǎn)。
這兩這兩年對中國機(jī)器翻譯界來說,是高速發(fā)展的兩年。仿佛就在一夜間,各廠家便推出了各自的機(jī)器翻譯軟件產(chǎn)品。據(jù)稱譯文的可讀性最高達(dá)到70%以上(注意,是可讀性,而不是準(zhǔn)確性?。?。豐富多彩的軟件廣告,令人神往的應(yīng)用前景,形成了國內(nèi)軟件市場一道獨(dú)特的風(fēng)景。然而相對于這邊的熱鬧場面,在最需要翻譯軟件的專業(yè)翻譯領(lǐng)域,卻是波瀾不起,一切依舊。進(jìn)入國內(nèi)任何一家翻譯公司或是大公司的本地化,翻譯部門,所有翻譯工作仍然停留在手工作坊階段,要說現(xiàn)代化,最多也就是在電腦里安一本電子辭典,再就是利用電腦做文字錄入工作。是翻譯領(lǐng)域不需要翻譯軟件嗎?恰恰相反,專業(yè)翻譯人員最能體會(huì)到日復(fù)一日伏案翻譯的艱辛,對翻譯工具的需求也最為迫切。問題在于即使是70%的可讀性,對于視質(zhì)量為生命的專業(yè)翻譯來說,還是難以滿足要求。此外目前機(jī)器翻譯軟件對電子文檔的格式處理能力有限,這又將近年來迅速崛起的專業(yè)翻譯領(lǐng)域的重要分支--本地化行業(yè)的需求擋在門外。
翻譯記憶在世界
實(shí)際實(shí)際上國外的情況也很類似,機(jī)器翻譯的研究已經(jīng)進(jìn)行了幾十年,可真正成功的應(yīng)用案例卻少之又少。在這種情況下,一種新的思路產(chǎn)生了,那就是"翻譯記憶"(Translation Memory, TM)。其實(shí)這一思路早在50年代便有人提出,但限于當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算速度和存儲(chǔ)能力,翻譯記憶還只能停留在理論研究的階段。隨著80年代末以來計(jì)算機(jī)軟、硬件性能的飛速提高,翻譯記憶技術(shù)早已廣泛應(yīng)用到專業(yè)翻譯領(lǐng)域。
在一在一年一度的全球LISA大會(huì)(Localization Industry Standard Association,本地化工業(yè)標(biāo)準(zhǔn)協(xié)會(huì))上,機(jī)器翻譯和翻譯記憶是永恒的話題。
國內(nèi)國內(nèi)讀者可能還不太了解,其實(shí)目前翻譯記憶技術(shù)幾乎獨(dú)霸國外專業(yè)翻譯和本地化市場。企業(yè)一旦決定在工作流程中采用翻譯軟件,首先考慮的就是翻譯記憶,要決定的也就是選用哪種翻譯記憶產(chǎn)品。事實(shí)上,不僅IBM、Microsoft、Oracle、SAP等IT公司和Bowne Global(寶捷環(huán)球)、LionBridge、Berlize等本地化公司和翻譯公司在大量使用翻譯記憶產(chǎn)品,歐盟、國際貨幣基金組織、沃爾沃、大眾汽車等國際組織和企業(yè)也都是翻譯記憶的忠實(shí)用戶。
什么是翻譯記憶
翻譯翻譯記憶的原理其實(shí)非常簡單。由于專業(yè)翻譯領(lǐng)域所涉及的翻譯資料數(shù)量巨大,而范圍相對狹窄,集中于某個(gè)或某幾個(gè)專業(yè),如政治、經(jīng)濟(jì)、軍事、航天、計(jì)算機(jī)、通訊等專業(yè)都有自己的專業(yè)翻譯公司或部門。這就必然帶來翻譯資料的不同程度的重復(fù)。據(jù)統(tǒng)計(jì),在不同行業(yè)和部門,這種資料的重復(fù)率達(dá)到20%~70%不等。這就意味著譯者至少有20%以上的工作是無謂的重復(fù)勞動(dòng)。翻譯記憶技術(shù)就是從這里著手,首先致力于消除譯者的重復(fù)勞動(dòng),從而提高工作效率。
翻譯翻譯記憶的技術(shù)原理是用戶利用已有的原文和譯文,建立起一個(gè)或多個(gè)翻譯記憶庫,在翻譯過程中,系統(tǒng)將自動(dòng)搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落),給出參考譯文,使用戶避免無謂的重復(fù)勞動(dòng),只需專注于新內(nèi)容的翻譯。翻譯記憶庫同時(shí)在后臺(tái)不斷學(xué)習(xí)和自動(dòng)存儲(chǔ)新的譯文,變得越來越"聰明",效率越來越高。幾乎所有翻譯記憶廠家都會(huì)告訴用戶:有了翻譯記憶庫,永遠(yuǎn)不必對同一句話翻譯兩遍!
機(jī)器機(jī)器翻譯界一位著名專家曾經(jīng)說過,機(jī)器翻譯做了人愿意做的工作,卻沒有做好;翻譯記憶則做了人不愿做的工作!可不是嗎,有誰愿意把時(shí)間花在重復(fù)勞動(dòng)上,又有誰樂意讓一臺(tái)技術(shù)不成熟的機(jī)器來代替自己的工作呢?翻譯記憶技術(shù),實(shí)際起了輔助翻譯的作用,也就是"計(jì)算機(jī)輔助翻譯",簡稱CAT(Computer Aided Translation)。和機(jī)器翻譯相比,翻譯記憶技術(shù)最大的優(yōu)勢便來自于數(shù)據(jù)庫中存儲(chǔ)的高質(zhì)量的例句和完善的翻譯流程控制系統(tǒng)。可以說,翻譯記憶是目前惟一真正大規(guī)模實(shí)現(xiàn)產(chǎn)業(yè)化應(yīng)用的翻譯技術(shù)。
翻譯記憶可以實(shí)現(xiàn)的功能大體如下:
1.翻譯過程
翻譯翻譯記憶產(chǎn)品會(huì)自動(dòng)"記憶"住用戶翻譯的每一句翻譯,在翻譯新句子的時(shí)候,搜索翻譯記憶庫,對該句和記憶庫中翻譯單元進(jìn)行對比和匹配,挑出原文最接近的翻譯單元,給出參考譯文。用戶可以接受該譯文,也可以做一些修改,修改后的新譯文會(huì)自動(dòng)存入記憶庫,供以后使用。由于專業(yè)領(lǐng)域詞匯和句式相對固定,當(dāng)用戶積累了多個(gè)有一定規(guī)模的記憶庫后,遇到的重復(fù)句子會(huì)越來越多,翻譯工作也變得越來越輕松。
翻譯翻譯記憶產(chǎn)品還都支持網(wǎng)絡(luò)共享記憶庫功能。也就是說,當(dāng)多人同時(shí)進(jìn)行翻譯時(shí),可以通過局域網(wǎng)共享一個(gè)翻譯記憶庫,每個(gè)在線的翻譯人員都可以實(shí)時(shí)地調(diào)用他人的工作成果。
2.自動(dòng)建庫
對于對于在使用翻譯記憶產(chǎn)品前,已經(jīng)積累了大量翻譯資料的用戶,翻譯記憶產(chǎn)品會(huì)提供一個(gè)自動(dòng)建庫工具。該工具能自動(dòng)分析和匹配原文和譯文,以句子為單位將原文和譯文一一對應(yīng)。用戶做完一些調(diào)整和校對之后,該工具會(huì)自動(dòng)生成一個(gè)標(biāo)準(zhǔn)的翻譯記憶庫文件。用戶所有的資料都可以通過該工具得到回收,從而高效、快捷地建立起翻譯記憶庫。這些庫在不斷的使用過程中,又會(huì)得到進(jìn)一步補(bǔ)充和完善。
3.術(shù)語管理
翻譯翻譯記憶產(chǎn)品一般還提供一個(gè)非常重要的功能是術(shù)語管理。對于專業(yè)技術(shù)領(lǐng)域來說,幾乎每篇文檔都帶有大量的專業(yè)術(shù)語,術(shù)語譯文的前后一致,始終是校對的重要內(nèi)容之一。這項(xiàng)工作費(fèi)時(shí)費(fèi)力,還難保會(huì)有疏漏。翻譯記憶產(chǎn)品通過一個(gè)術(shù)語管理工具(一般是電子辭典),來規(guī)范所有的術(shù)語。用戶只需一次性建立一個(gè)或多個(gè)標(biāo)準(zhǔn)術(shù)語列表(表中包括術(shù)語原文和譯文),在使用翻譯記憶系統(tǒng)翻譯時(shí),打開術(shù)語管理工具中相應(yīng)的術(shù)語列表,會(huì)自動(dòng)識(shí)別出當(dāng)前句子中有哪些詞是已定義的術(shù)語,并給出標(biāo)準(zhǔn)的術(shù)語譯文。
4.多語種間雙向互譯
由于由于翻譯記憶實(shí)現(xiàn)的是原文和譯文的比較和匹配,帶來了翻譯記憶的一個(gè)先天優(yōu)勢--支持多語種之間的雙向互譯。以全球最著名的翻譯記憶軟件廠商德國塔多思(TRADOS)公司為例,該公司的產(chǎn)品基于Unicode,支持55種語言,覆蓋了幾乎所有語言版本的Windows 95/98/NT。換句話說,一套產(chǎn)品就可以實(shí)現(xiàn)各語種間的雙向互譯,這在機(jī)器翻譯中是難以想像的。
5.自動(dòng)排版
人不人不愿做的事情又豈止是重復(fù)勞動(dòng)。電子文檔的排版工作也是讓翻譯人員頭痛的工作。尤其本地化行業(yè),對譯文的格式要求極為嚴(yán)格,必須和原文檔的格式保持一致。在這方面,翻譯記憶產(chǎn)品又遠(yuǎn)遠(yuǎn)地走在了前頭。目前的翻譯記憶產(chǎn)品一般都提供各種格式處理工具,支持流行文檔格式,如DOC、RTF、HTML、SGML、PPT等等。譯文會(huì)自動(dòng)套用原文的格式,翻譯人員不必費(fèi)心排版,只要全神貫注從事翻譯就可以了。
統(tǒng)計(jì)統(tǒng)計(jì)數(shù)據(jù)表明,通過在翻譯流程中應(yīng)用翻譯記憶技術(shù),工作效率能提高30%~60%,效益十分可觀。
6.流程管理
由于由于翻譯記憶產(chǎn)品通過數(shù)據(jù)庫管理所有翻譯資源,一套基于數(shù)據(jù)庫的流程管理工具也應(yīng)運(yùn)而生。用戶使用翻譯記憶解決方案后,可以建立起一套標(biāo)準(zhǔn)的翻譯流程管理體系,包括從譯前的項(xiàng)目分析、批量翻譯到交互翻譯和實(shí)時(shí)的校對。所有這一切,都基于翻譯記憶產(chǎn)品來實(shí)現(xiàn)。
翻譯軟件市場,誰主沉浮
翻譯翻譯記憶的技術(shù)特點(diǎn)決定了它的用戶群主要是專業(yè)和行業(yè)用戶。對外語水平較差的個(gè)人用戶來說,機(jī)器翻譯的譯文盡管還"不太明白",但總比"一點(diǎn)都不明白"要好得多了。而翻譯記憶產(chǎn)品昂貴的價(jià)格、日復(fù)一日的翻譯記憶庫建立工作,都是非專業(yè)用戶所無法承受的。所以在現(xiàn)階段,翻譯記憶和機(jī)器翻譯各有所需,各得其所,倒也相安無事。
目前目前在全球翻譯記憶市場上,德國塔多思(TRADOS)處于絕對領(lǐng)先地位,其核心產(chǎn)品Translator's Workbench(翻譯工作平臺(tái))直接和Microsoft Word集成,界面友好,此外還有強(qiáng)大的網(wǎng)絡(luò)共享、術(shù)語管理、翻譯項(xiàng)目管理,以及格式轉(zhuǎn)換處理功能,為專業(yè)翻譯領(lǐng)域提供了一整套解決方案。遍及全球的跨國企業(yè)和國際組織,如Microsoft、歐盟等,都在大量應(yīng)用TRADOS的翻譯記憶產(chǎn)品和解決方案,從事著多語種文檔的翻譯和本地化工作。
對于對于專業(yè)翻譯領(lǐng)域來說,翻譯記憶是目前惟一的選擇。該領(lǐng)域特點(diǎn)決定了翻譯記憶技術(shù)有著廣闊的應(yīng)用前景!為了提供更為可靠和高速的網(wǎng)絡(luò)運(yùn)行環(huán)境,目前幾家頂尖的翻譯記憶廠商都在致力于下一代Client/Server架構(gòu)產(chǎn)品的開發(fā),預(yù)期將在不久的將來問世。如果機(jī)器翻譯技術(shù)能有較大突破,達(dá)到專業(yè)應(yīng)用水準(zhǔn),那么翻譯記憶產(chǎn)品開放的API接口將為機(jī)器翻譯和機(jī)器翻譯的統(tǒng)一創(chuàng)造條件,這將取決于機(jī)器翻譯的進(jìn)展情況。
Tags http://m.genron.com.cn/webpages/news/transmenmory.html