——2018機器翻譯(成都)論壇側記


  2018年5月26-27日,2018年機器翻譯論壇首次線下活動(成都論壇)在成都召開,來自2018機器翻譯論壇在中國成都召開,5月26-27日為期兩天的線下交流活動吸引了來自國內翻譯語言行業的頂尖大學學者與公司代表們參與。


  東北大學、澳門大學、大連理工大學、蘇州大學、廣外、廈門大學、香港城市大學、西湖大學、阿里達摩院、科大訊飛、奇虎360、搜狗、騰訊、網易、云譯科技等機器翻譯技術研發機構以及四川語言橋、廈門精藝達等十余家國內著名的語言服務企業共計50多名代表出席,一起熱議機器翻譯的技術發展方向及應用落地場景。


語言橋翻譯,機器翻譯

  “機器翻譯論壇”由小牛翻譯團隊于2016年發起,旨在聚集國內機器翻譯研究學者、機器翻譯技術開發者、機器翻譯需求方等多個領域的代表,對機器翻譯技術發展與應用場景進行深入研討,迄今已經分別成功舉辦了2016年沈陽、2017年大連兩屆年度論壇,已發展成為國內最大的機器翻譯產學研交流平臺。

語言橋翻譯,機器翻譯

  此次機器翻譯(成都)論壇由小牛翻譯和語言橋聯合主辦,云譯科技提供了贊助支持,共有35家單位的42名代表出席,分為“技術與應用報告”與“自由研討”兩個部分,機器翻譯報告部分由大連理工大學黃德根教授主持,廣東外語外貿大學宋柔教授、阿里達摩院陳博興博士、新加坡技術與設計大學/西湖大學張岳博士、科大訊飛劉俊華博士、廈門大學蘇勁松博士、網易見外劉鵬博士、搜狗翟飛飛博士、廈門精藝達韋忠和董事長分別作了精彩的報告,為大家勾勒出如下有關機器翻譯技術發展方向與應用落地場景的新“畫像”:

 

  機器翻譯技術發展越來越快


  自神經機器翻譯技術在2013年被提出以來,機器翻譯已經從統計機器翻譯時代全面轉向神經機器翻譯時代,2016年起神經機器翻譯在產業界的應用開始爆發,神經機器翻譯模型結構進化、異步雙向解碼技術、數據增強技術、譯文后處理和外部知識干預等技術,以及基于graph的自然語言處理技術,讓機器譯文質量不斷提高,可用性越來越強。

 

  機器翻譯應用場景越來越豐富

 

  隨著跨語言海量信息快速交互需求的不斷增加,機器翻譯技術成為大數據翻譯唯一可行解決方案,各種機器翻譯應用層出不窮,目前全球每天機器翻譯服務提供的在線翻譯量已經達到了1萬億詞的規模。機器翻譯+行業、機器翻譯技術+圖像技術/語音技術,推動了語音同傳翻譯、視頻翻譯等產品一波又一波的發展,從亞馬遜到阿里等跨境電商,從Facebook到微信等在線社交平臺,從訊飛的語音翻譯機、搜狗的多語搜索、網易的視頻翻譯,甚至在語言服務業,也已經有超過50%的翻譯公司和個人在使用機器翻譯。


語言橋翻譯,機器翻譯

 

  人機結合,優勢互補

 

  雖然機器翻譯目前可以很好地滿足網頁瀏覽等“可讀性”翻譯需求,但離“優質”翻譯需求的距離還很遠。廣外的宋柔教授指出,從語法角度看,由于機器還無法識別復雜中文句子的內部邏輯關系,對于存在多個“小句復合體”的中文句子,機器明顯“心有余力不足”。為了得到高質量機器譯文,還需要做更多“譯前編輯”“譯后編輯”等工作。“2017年全球語言服務市場規模達到430億美元,近幾年一直以10%的速度在穩步增長”這一事實也說明,雖然采用機器翻譯提高效率、降低成本已經是大勢所趨,但是人機結合、優勢互補,仍將會是一個長期存在。


語言橋翻譯,機器翻譯

  報告結束之后的“自由研討”由小牛翻譯創始人朱靖波教授主持,討論中技術專家與技術愛好者唇槍舌劍,交流的主要話題涉及到:在機器翻譯引擎開發方面,機器翻譯開發者與用戶需要如何合作,實現通過用戶反饋來幫助改進機器譯文質量及友好功能;在機器譯文質量評價方面,傳統的BLEU/NIST等自動評價指標不足以滿足評價需求、人工評價存在著代價高、容易產生不一致評價結果的情況下,應該采用哪些方法?比如可以采用眾包評價的方式,而在電商機器翻譯評價上,可以采用用戶訪問率、用戶下單率是否提高等方式來做評價;在高質量訓練語料構建方面,除了基于正則表達式進行數據清洗之外,是否可以用神經網絡來自動生成清洗規則;在語言資源與技術共享方面,如何建立語言服務公司與機器翻譯公司互利共贏的行業生態。

語言橋翻譯,機器翻譯

  此外,大家還討論了在機器翻譯引擎構建方面,如何采用遷移學習技術、無監督及半監督的機器學習技術,進行資源稀缺性語言/垂直領域的機器翻譯引擎研發;在機器翻譯與高校翻譯教育方面,如何破解“機器翻譯與人工翻譯”的迷局?人工譯員真的需要擔心失業么?


  對于上述最后一個問題,阿里達摩院陳博興博士表示,“機器翻譯的量過去5年至少翻了兩翻,但人工翻譯的市場每年也保持了10%的增長速度。在不可逆轉的全球化進程中,機器翻譯和人工翻譯都有大量的機會。對于譯員而言,要不斷提高自身翻譯水平,也要學會利用機器翻譯提高工作效率,否則,淘汰你的不是機器,而是那些會利用機器的同行。”


  2018機器翻譯論壇在成都圓滿落幕,來自國內行業內的專家學者針對機器翻譯相關的多個問題進行總結匯報,取得了豐碩的成就。對機器翻譯如何與多產業結合,如何更好的落地服務有了更加直觀的答案,此次論壇也將對我國機器翻譯產業起到積極地推動作用。