從“人工翻譯”到“人機共譯”, 生成式AI時代百度如何為翻譯留下新注解?
智東西
作者 | 程茜
編輯 | 漠影
ChatGPT風靡,它展現出來的能力讓一些崗位面臨危機感,內容創作工作者首當其沖。這之中,翻譯人員作為典型的文字工作者,如何在大模型時代快速擁抱技術,變“恐懼”為動力?AI的颶風會顛覆翻譯行業嗎?
智東西4月3日報道,今天下午,在2023中國翻譯協會年會上,首屆全國翻譯技術大賽正式啟動。前沿技術突飛猛進的當下,翻譯工作者的工作模式發生了“翻天覆地”的變化。
“首屆全國翻譯技術大賽”正式啟動
大賽由中國外文局、全國翻譯專業學位研究生教育指導委員會指導,中國翻譯協會、中國外文局翻譯院、大連外國語大學主辦,百度翻譯作為承辦單位之一。
作為首個如此高規格的全國翻譯技術大賽,與此前的翻譯比賽不同,本次大賽聚焦譯后編輯能力考查。除了以選手的翻譯結果好壞作為評判標準外,本次比賽還會以百度智能文檔翻譯平臺相關技術和產品為工具,增加了對選手使用機器翻譯技術的評判。
當下誕生的文心一言、ChatGPT等生成式AI產品背后都是依靠深度學習技術和大模型技術的發展,這些技術和產品正在對各行各業產生各種各樣的深刻影響,翻譯行業同樣如此,前沿技術正在改變這一行業的工作范式, 科技賦能翻譯行業、賦能國家翻譯能力建設已是大勢所趨,“人機共譯”創新工作模式亦是中國超500萬譯者需要重點關注的趨勢。
一、AI技術+翻譯的平衡點,人機共譯成為趨勢
前有能聊天、能撰稿、能翻譯、輔助創作的先進生產力工具ChatGPT、文心一言,后有微軟、谷歌將大型語言模型集成至辦公全家桶,內容創作工作者的工作方式正在被重塑。這也讓很多打工人發出疑問,“未來,我的工作會不會被AI替代?”。
與此同時,機器翻譯技術的進步一直與翻譯人員是否會被取代如影隨形,毋庸置疑,隨著技術的進步,機器翻譯的效果會越來越趨向于專業人士翻譯的高質量內容,但與專業的翻譯人員相比,在短期內這種差距不會消失。
在這一背景下,一個關鍵問題擺在翻譯行業面前,機器翻譯和純人工翻譯的模式應該如何共存?回答這個問題,我們需要從目前這兩種翻譯模式的優缺點說起。
純人工翻譯的優勢在于翻譯的流暢度、還原度都有較高保障,但相比于“以秒為單位速出結果”的機器翻譯來說,人工翻譯的時間成本更高,再加上前沿技術的發展誕生了越來越多的各行各業專業名詞,翻譯人員的學習壓力也進一步加重。
因此,機器翻譯技術的極速發展給人工翻譯帶來了一定緊迫感。
另一方面,機器翻譯除耗時短外,還能通過模型自學習涵蓋不同行業的專業知識,對于新信息的接收速度更快。不過,人們對于機器翻譯的不信任感仍然存在,且有大量實際研究證明,機器翻譯對于語言中的情感理解、文字組織能力都有一定欠缺。
綜合來看,純人工翻譯與機器翻譯可以實現優勢互補,人機共譯的新翻譯模式應運而生。
這種翻譯模式的出現,不僅革新了翻譯人員的工作模式,也給翻譯行業提出了新的注解,其在機器翻譯與人工翻譯之間找到了一個更好的平衡點,合理運用前沿技術的基礎上保證翻譯的質量。
由此可見,諸如機器翻譯等前沿技術的發展并不是一定要顛覆整個翻譯行業,而是轉變成輔助人工的生產力工具,作為一種能有效提升人工效率的存在。
二、百度智能文檔翻譯平臺化身先進生產力工具
翻譯行業從業者工作模式的變革,必然伴隨著工具的進一步革新。
以此次大賽為例,百度翻譯為大賽提供翻譯技術和比賽平臺支持,參賽選手采用百度智能文檔翻譯平臺提供的技術和服務,這一平臺是以機器翻譯為核心的新一代智能自學習文檔翻譯平臺,可謂是人機共譯工作范式下的工具集大成者。
首屆全國翻譯技術大賽官網-百度智能文檔翻譯平臺
人機共譯模式下,翻譯人員做的工作更像是成為機器翻譯文本的編輯,因此,人機共譯模式不僅要考察機器翻譯能力,更為重要的是人與機器的協作是否流暢、便捷。
1、囊括4萬+個翻譯方向,能化身各行業“翻譯專家”
百度智能文檔翻譯平臺支持全球200多個語言互譯、超4萬個翻譯方向,并且擁有學術、新聞、生物醫藥、金融財經等多個專業領域翻譯模型,使得翻譯效率提升100% ,在專業領域該平臺的翻譯準確率超過90%。
當在翻譯平臺上傳關于學術期刊和機器人研究的相關文章時,百度智能文檔翻譯平臺的翻譯速度并沒有受到文章翻譯類型等影響。在描述“軟體機器人模擬毛蟲運動方式”時,其文字部分使用短句將英文中的長句分開,更符合中文的閱讀習慣。
上為“機器人”相關PDF文件,下為“學術論文”研究相關Word文件
2、支持多類型文檔上傳,支持實時編輯+格式一比一對應
該平臺對于上傳的文檔限制較小,支持Word、Excel、PPT、PDF等多種格式文檔。
進入翻譯工作臺后,該平臺會為用戶提供整頁預覽和逐句對照兩種模式,右上角會有編輯譯文與導出按鈕,方便翻譯人員對其中部分措詞進行修改、完善。
并且對于PDF版本的學術論文,其譯文界面還會完全對照原文的格式。
3、6大一級領域+40個二級領域,權威高效的專業術語
還有一點與其他翻譯工具不同的是,這一平臺內置了百度翻譯術語庫和全國名詞委術語庫。在提交文檔界面,該平臺會為用戶提供“術語提示”功能,其中包含工程科學、基礎科學、生物醫藥等6個一級領域及40個二級領域,基本覆蓋有翻譯需求的不同行業。
翻譯人員遇到更為前沿的學科內容或不熟悉的技術領域時,這一工具可以為翻譯人員提供相關參考,省去翻譯人員額外檢索查證的時間。
即使前期沒有選擇相應“術語參考”領域,智能文檔翻譯平臺也會根據用戶劃詞的內容去定位相應行業。
4、機翻+譯后+自學習,翻譯助手“專業性”漸趨人類
如一些專有名詞通常在論文中會有英語簡寫表述,但很多情況下這些專有名詞在不同行業中的意義完全不同。以GPT這個詞為例,在AI領域其意義是文本生成模型,而在醫藥領域GPT是谷丙轉氨酶。
比如,如果翻譯人員有特定研究領域,且相關專有名詞有一定的重復性,在編輯譯文的過程中,智能文檔翻譯平臺還會根據用戶修改的譯文進行自學習,并在之后的翻譯文件中優化翻譯結果,使得機器翻譯的結果與理想譯文不斷趨近。
綜上所述,百度智能文檔翻譯平臺將機器翻譯(MT)、譯后編輯(PE)、模型自學習納入其翻譯體系,能夠大幅提升人機共譯模式的工作效率及效果。
百度智能文檔翻譯平臺與人工翻譯、機器翻譯兩種模式的契合,使其成為人機共譯時代的“重量級”先進生產力工具。
三、十余年AI全棧技術布局,深度學習、大模型提升機翻流暢、準確度
從更宏觀的角度來看,機器翻譯概念誕生至今已經超過70個年頭,隨著深度學習及大模型技術的發展,這一技術的產業化格局正在被重塑。
此次2023中國翻譯協會年會4月4日的翻譯技術主題論壇上,百度翻譯還將聯合中國外文局翻譯院、中國翻譯協會翻譯技術委員會共同發布《2023機器翻譯技術及產業應用藍皮書》。
《2023機器翻譯技術及產業應用藍皮書》
技術的發展正在為翻譯行業注入新鮮血液,隨著機器翻譯技術的不斷變革,主流機器翻譯方法也在不斷迭代。在深度學習技術發展的背景下,能模擬人類翻譯過程的神經網絡機器翻譯出現,2015年百度發布全球首個互聯網神經網絡機器翻譯系統,使得翻譯效果在語言表示、語義理解和譯文生成等方面都有顯著提升。
面向未來,正如藍皮書所說,以ChatGPT、文心一言(ERNIE Bot)為代表的新一代預訓練模型技術在語言理解與生成,特別是低資源、長篇章以及多模態的場景應用中表現出強大能力和發展潛力,與人的互動性和反饋學習能力不斷增強。
因此,機器翻譯在當下已經呈現出強大的產業化生命力。該技術在企業智能化升級、行業數字化建設等場景中的應用正在不斷普及。以中石化全球戰略為例,百度企業級智能翻譯平臺可以支持其全球化戰略的龐大翻譯需求。
百度智能文檔翻譯平臺應用場景示意
這背后,離不開百度在深度學習與機器翻譯領域的前瞻布局。
追溯至2010年,彼時深度學習仍處于發展初期,百度就已經開始布局深度學習,并于3年后建立全世界首個深度學習研究院(IDL)。今年2月,全球市場調研機構IDC發布的數據顯示,2022年下半年,百度已經穩居中國深度學習平臺市場綜合份額第一。
在機器翻譯領域,百度十余年來在多語言機器翻譯、神經網絡機器翻譯、跨模態機器翻譯等方面持續突破。目前,百度翻譯已形成核心技術領先、產品矩陣豐富、產業應用廣泛的發展生態。
當下,大模型和生成式AI時代的到來,正在為機器翻譯留下新的注解。
與此同時,機器翻譯的技術變革帶來的應用擴展,也為翻譯人員提出了更高的要求。可以看出,前沿技術的突破是不可逆轉的發展趨勢,作為翻譯工作者如何在當下擁抱前沿技術,找到平衡點,是置身于行業中的工作人員與掌握前沿科技的科技大廠都需要關注的事情。
結語:機器翻譯技術、應用大飛躍,為翻譯行業開辟新賽道
人機共譯已經成為當下翻譯行業從業者的趨勢,隨著機器翻譯在翻譯質量、系統性能、實用性、規模化應用等方面均取得了較大飛躍,與人工翻譯的契合度越來越高。
與此同時,技術的發展與進階中,勢必會對各行各業產生影響,這一背景下,翻譯工作者更快擁抱前沿技術,并將其化身為真正的生產力工具才能在前沿技術發展的浪潮中站穩腳跟。
隨便看看:
- [數據]魅族20 “定勝青”配色,你喜歡嗎?#魅族20
- [數據]名片全能王推出極簡模式,讓名片回歸信息交換本質
- [數據]第二代驍龍 8 賦能 MEIZU 20 系列實現全方位“無界
- [數據]95分APP閑置交易引關注,熱衷分享省錢經驗貼
- [數據]英偉達將在即將到來的GTC大會上推出新一代人工智能芯片
- [數據]Poco推出首款平板電腦以擴大產品線 搭載高通驍龍8 Gen
- [數據]JBL推出Go 4超便攜式揚聲器 具有AURACAST和耐候
- [數據]摩托羅拉Edge 50 Fusion關鍵規格、顏色可選 可能
- [數據]羅永浩入抖三年后,直播帶貨也成了傳統行業
- [數據]醫藥營銷數字化背景下藥企需求層次分析
相關推薦:
網友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件