機器(qi)翻(fan)譯與計(ji)算(suan)機輔助(zhu)翻(fan)譯有明顯差異(yi),但在實際生活中,仍(reng)有很多人把(ba)二(er)者(zhe)混為一談,一聽到計(ji)算(suan)機輔助(zhu)翻(fan)譯,會有這樣的想法(fa):計(ji)算(suan)機輔助(zhu)翻(fan)譯是(shi)不(bu)是(shi)就(jiu)是(shi)機器(qi)翻(fan)譯?本(ben)文將對(dui)二(er)者(zhe)進行簡要介紹,一起來看(kan)看(kan)吧!
什么是機器翻譯
機器翻譯(Machine Translation, MT)就是運用機器實現人類自然語言的相互轉化。隨著計算機的發明和廣泛應用,機器翻譯也成了名副其實的計算機翻譯,即運用計算機將一種自然語言文本翻譯成另一種自然語言文本。
機器翻譯的研究歷史最早可以追溯到20世紀30年代。1933年,法國科學家 G.B. 阿爾楚尼提出了用機器來進行翻譯的想法。經過初期的發展與挫折,90年代機器翻譯進入了發展期。進入21世紀后,隨著計算機與互聯網的發展與普及,機器翻譯技術也得到了進一步的發展,機器翻譯得以真正走向實用。
什(shen)么(me)是計算機輔助翻(fan)譯
計算機輔助翻譯(Computer aided translation, CAT)有廣義與狹義之分,廣義指能夠輔助譯員進行翻譯的所有計算機工具,包括文字處理軟件、語法檢查工具和互聯網等。狹義指利用翻譯記憶技術,實現翻譯過程中的術語匹配、譯名統一、高度相似的句子再現等。翻譯工具在計算機輔助翻譯過程中起著至關重要的作用,直到20世紀90年代中期才開始進行商業開發,隨后國內外大量的計算機輔助翻譯軟件涌入市場,為越來越多的譯員所認識并使用,國內公司也相繼研發并推出了自己的CAT軟件。
機器翻譯VS計算機輔助翻譯
1 主體差異
機(ji)(ji)(ji)器翻(fan)譯(yi)(yi)(yi)和(he)計(ji)(ji)算(suan)機(ji)(ji)(ji)輔(fu)助(zhu)(zhu)翻(fan)譯(yi)(yi)(yi)的(de)重要區別在(zai)于(yu)翻(fan)譯(yi)(yi)(yi)主(zhu)體差異。機(ji)(ji)(ji)器翻(fan)譯(yi)(yi)(yi)的(de)主(zhu)體是計(ji)(ji)算(suan)機(ji)(ji)(ji),是通過(guo)計(ji)(ji)算(suan)機(ji)(ji)(ji)技術實現的(de)全自(zi)動(dong)翻(fan)譯(yi)(yi)(yi)。而計(ji)(ji)算(suan)機(ji)(ji)(ji)輔(fu)助(zhu)(zhu)翻(fan)譯(yi)(yi)(yi)是以(yi)翻(fan)譯(yi)(yi)(yi)人員(yuan)為(wei)主(zhu)體,計(ji)(ji)算(suan)機(ji)(ji)(ji)起(qi)輔(fu)助(zhu)(zhu)作用(yong),因此在(zai)計(ji)(ji)算(suan)機(ji)(ji)(ji)輔(fu)助(zhu)(zhu)翻(fan)譯(yi)(yi)(yi)中,應充分發揮譯(yi)(yi)(yi)者(zhe)的(de)主(zhu)體性。
2 方法差異
機器(qi)翻譯大致(zhi)可以分為基(ji)于(yu)規則、基(ji)于(yu)實例、基(ji)于(yu)統(tong)計、基(ji)于(yu)神經網絡的機器(qi)翻譯。
基于規則的機器翻譯
規則,主要指詞法、句法、短語規則等語言學知識。經典的基于規則的機器翻譯技術主要包括源語言的文本處理、詞典構成、文本分析,源語言到目標語言的詞典查詢翻譯,目標語言文本生成等技術。基于規則的機器翻譯主要有兩類翻譯方法:轉換法與基于中間語言的方法。
基于實例的機器翻譯
該方法需要對已知語料進行詞法、句法,甚至語義等分析,建立實例庫用以存放翻譯實例。系統在執行翻譯過程時,首先對翻譯句子進行適當的預處理,然后將其與實例庫中的翻譯實例進行相似性分析,最后,根據找到的相似實例的譯文得到翻譯句子的譯文。
基于統計的機器翻譯
最初的統計翻譯方法是基于噪聲信道模型建立起來的,該方法認為,一種語言的句子T(信道意義上的輸入)經過噪聲信道變形為另一種語言的句子S(信道意義上的輸出),翻譯問題實際上就是如何根據觀察到的句子S,恢復最有可能的輸入句子T。
基于神經網絡的機器翻譯
隨著深度學習熱潮的興起(qi),神(shen)經機器(qi)(qi)(qi)翻(fan)譯(yi)也(ye)得到了長足的發展。神(shen)經機器(qi)(qi)(qi)翻(fan)譯(yi)在翻(fan)譯(yi)建模上采用端到端模型及編(bian)碼器(qi)(qi)(qi)解碼器(qi)(qi)(qi)模型,不需要詞對齊、翻(fan)譯(yi)規(gui)則(ze)抽取等步驟(zou),即可實現完(wan)全采用神(shen)經網絡完(wan)成源(yuan)語言到目(mu)標語言的直接翻(fan)譯(yi)。
計算機輔助翻譯的核心技術是翻譯記憶,其基本原理是在翻譯的同時,將譯文保存在后臺建立的翻譯記憶庫中。當翻譯過程中遇到相似的語料時,系統通過檢索為翻譯人員提供參考譯文,翻譯人員可選用、編輯或棄用。目前,主流的計算機輔助翻譯的核心模塊大多包括翻譯記憶系統、對齊工具、術語管理系統、項目管理系統,各自發揮功能,集成完成計算機輔助翻譯。計算機輔助翻譯由機器翻譯發展而來,作為計算機輔助翻譯核心的翻譯記憶也可用于基于統計和實例的機器翻譯領域。
3 應用范圍差異
機器翻譯和計算機輔助翻譯的原理和性能的差異決定了其應用范圍的不同。如果需翻譯的文本過于龐大,比如龐大的互聯網網頁,人工翻譯的速度顯然不能適應要求,同時若對翻譯內容的精度要求不高,只要求大致了解內容,可選用機器翻譯。機器翻譯可應用于重復性較高的文本或基于專業語料庫的文本,如產品說明書等。在某些領域,機器翻譯可以獨立工作,如天氣預報系統(加拿大蒙特利爾大學和加拿大聯邦政府翻譯局聯合開發的METEO系統) 。法律文本術語多且敏感性高,措辭不準容易引發糾紛,一般情況下建議采用計算機輔助翻譯。文學作品翻譯不宜采用機器翻譯,多用計算機輔助翻譯。
近年隨著信息技術、人工智能、自然語言處理等的發展,CAT技術呈現新的發展趨勢,CAT+MT+PE的模式得到了廣泛應用,越來越多的CAT工具開始將機器翻譯引擎整合到計算機輔助翻譯工具中,在CAT系統中可以調用機翻引擎接口,讓翻譯更加高效。
說明:本文源于(yu)《海外英語(yu)(yu)》、《計算機學(xue)報(bao)》、《重(zhong)慶文理(li)學(xue)院學(xue)報(bao)》、《統計自然語(yu)(yu)言(yan)處(chu)理(li)》圖書、《翻譯概論》圖書及(ji)其(qi)他網絡(luo)資源,若有侵(qin)犯您的(de)合(he)法權(quan)益,請及(ji)時(shi)聯(lian)系我們。