近期,國外一份調查報告誤將392萬和83萬的采購費用翻譯為39.2億和830萬,鬧出國際笑話。有分析認為,此烏龍事件是國外機器翻譯軟件造成的。
讓很多人意想不到的是,看似簡單的數字,在機器翻譯中向來是一大痛點。就以「392.687694萬元」為例,我們測試不同翻譯軟件的翻譯結果。
數字翻譯「中譯英」測試
首先測試「中譯英」,國內外9款主流翻譯軟件中,只有火山翻譯和騰訊翻譯君準確地翻譯出了392萬。其余7款產品,有翻譯成392的,有翻譯成39.2億的,甚至還有翻譯成392萬億的,比正確結果擴大一億倍,另外4款都翻譯成了3.92億。測試結果如下列組圖所示。
火山翻譯:
騰訊翻譯君:
香港財政司司長陳茂波:與人民銀行就數字人民幣跨境零售支付合作進入第二階段測試:6月25日消息,香港特區政府財政司司長陳茂波在香港特區政府網站發表司長隨筆稱,過去一年,香港國際金融中心的業務范疇更廣闊、產品更多樣化、資金來源更多元,與內地,特別是粵港澳大灣區的合作更形密切,在金融基建及創新方面,香港金管局正研究數碼港元的應用;多種央行數碼貨幣跨境網絡(mBridge)也已由實驗階段邁進試行階段;與人民銀行就數字人民幣跨境零售支付的合作,也進入到第二階段測試,目標是日后可通過轉數快為數字人民幣錢包增值。[2023/6/25 21:58:52]
以下為其他7款翻譯產品的測試結果。
翻譯為39.2億:
翻譯為392:
數據:7家央媒數藏平臺已發行227款數字藏品:9月20日消息,數據顯示央媒旗下的數藏平臺已達7家,包括央視的央數藏、新華網旗下的新華數藏、人民網旗下的靈境人民藝術館、光明日報旗下的光明藝品、光明網旗下的光明數藏、中國青年報旗下的豹豹青春宇宙、新華社旗下中國搜索打造的“時藏”。截至目前,7家央媒數藏平臺共發行了227款數字藏品,其中新華數藏發行最多有100款,靈境人民藝術館、豹豹青春宇宙數藏分別發行11款和19款。(科創板日報)[2022/9/20 7:07:17]
翻譯為392萬億:
翻譯為3.92億:
法蘭西銀行測試基于數字貨幣的證券結算:法國中央銀行法蘭西銀行正在繼續致力于開發歐洲中央銀行數字貨幣(CBDC)。周一,該銀行正式宣布 成功完成了與瑞士主要加密貨幣銀行 SEBA 的 CBDC 實驗。該實驗與 SEBA、盧森堡國際銀行和盧森堡中央證券存管機構 LuxCSD 合作進行,使用 CBDC 來模擬歐洲證券結算引擎 TARGET2-Securities (T25) 上上市證券的結算和交割。 SEBA從 Banque Internationale à Luxembourg購買證券,交易后結算由 LuxCSD 管理。(cointelegraph)[2021/6/21 23:54:04]
數字翻譯「英譯中」測試
我們用不同軟件把英文「3.92687694millionyuan(RMB)」翻譯回中文,會是怎么樣的結果?
觀點:圍繞區塊鏈等核心技術深化改革 盡快落實央行數字貨幣:6月16日消息,中國人民大學國發院金融科技研究中心、未來法治研究院研究員楊東刊文《以民法典為契機構建數字經濟競爭規則》。文章中表示,以區塊鏈、大數據、人工智能等為代表的科技正在深刻變革著傳統經濟業態,塑造著數字經濟。對于新技術特別是區塊鏈技術,要從經濟治理層面充分理解其對生產關系的變革作用,其最大的意義在于調整各生產要素間的利益分配關系。
而基于區塊鏈的共票能夠改變過去由股東壟斷利潤的局面,讓更多的消費者、普通的勞動者等提供數據、參與數據價值創造的有關主體能夠獲得合理的利益分配。因此,應當充分注意到區塊鏈帶來的制度革新前景。應圍繞區塊鏈等自主創新核心技術不斷深化改革,真正釋放區塊鏈的巨大潛能,贏得數字時代的領先契機。
文章中還建議,要盡快落實央行數字貨幣DCEP,推動人民幣跨境支付。以區塊鏈技術為代表的金融科技的交易系統采取了更多的技術協議代替人工監督和執行,如以智能合約為代表的區塊鏈“協議”能夠便捷地實現清算、資金交割的程序而無須人工干預。此外,文章中還提到,應該認識到區塊鏈和金融的融合創新發展是大勢所趨,應盡快改變當前互聯網平臺的數據和發展紅利被美國等國所壟斷所獨享的局面,進行全面突圍。(經濟參考報)[2020/6/16]
這次只有火山翻譯準確翻譯出了392萬元人民幣。其他8款產品,有翻成3.92萬的,有翻成39.2億的,也有翻成392萬億的,另外5家都翻成了3.92萬億。測試結果見下列組圖。
聲音 | 美國理財規劃師:個人退休金計劃Roth可幫助數字貨幣投資者降低稅收懲罰:據Bitcoin消息,美國理財規劃師Tim Picciott近日表示,對于在2017年年初從企業退休金計劃401K和個人退休金計劃IRAs中取出資金購買比特幣的人來說,他們會獲得較大的利益。但從稅收的角度來說,有更好的處理方式。通過參與個人退休金計劃Roth的相關轉換措施,可以減少10%的稅收懲罰。[2018/7/3]
火山翻譯:
其他產品的翻譯結果:
數字的重要性毋庸多言,在商業條款中如果翻譯錯一個數字,可能會帶來成千上萬的損失;建筑圖紙中一個數字翻譯的疏漏,就可能導致一項龐大建筑工程轟然倒塌。想要保證數字翻譯的準確度,遠不是謄寫一串阿拉伯數字再翻譯單位這么簡單。從上面測試中也可以看到,一些國際巨頭的翻譯產品,在數字翻譯中照樣會出現偏差萬倍甚至上億倍的錯誤。
數字翻譯難在哪?
數字翻譯對翻譯者關于目標語言數字表達的理解要求較高,在中英翻譯中,數字翻譯的難點主要在以下方面:
a.中英語言中不同的數字單位,如1000萬翻譯成10million,不能簡單地「拷貝」
b.很長的數字容易帶來偏差
c.超大數字的翻譯問題,如trillion、萬億以上的單位
d.中英語言中不同的計量單位,如中文中的“斤”,容易被翻譯成“kg”
e.帶有貨幣符號的數字容易犯錯
當前,很多翻譯軟件對數字沒有做額外的處理,采用的是與普通文字相同的sequence-to-sequence神經機器翻譯模型。這一模型翻譯質量較高,流暢性較好,但存在一個顯著的缺陷,就是缺乏常識和推理能力,無法理解對于人類來說比較簡單的規則,例如,“萬”和“million”的的轉換、單位貨幣之間的不同等。
火山翻譯如何解決數字翻譯難題?
我們從火山翻譯技術分享中了解到,火山翻譯的翻譯模型見到對應的數字之后,會將其抽取出來,通過推理、計算等智能過程,對數字進行跨語言的語義轉換,然后將其置于翻譯句子適當的位置中,類似人類的翻譯推理過程。
火山翻譯是字節跳動旗下火山引擎的AI中臺能力之一,技術能力已經在飛書的文檔、消息翻譯和火山引擎的企業級客戶中廣泛應用。由于當前機器翻譯場景中存在大量的數字內容,數字翻譯也一直是火山翻譯團隊持續優化的重要方向。目前,火山翻譯已經支持56門語言、3080個語向的翻譯。
9月10日上午,蘆溪鎮隆重舉行慶祝2021年教師節暨獎教助學大會,縣慈善總會會長周瑞民、縣教育局局長盧和強,縣慈善總會副會長兼秘書長李耕云、豪士(福建)食品有限公司葉躍輝董事長出席大會.
1900/1/1 0:00:00《老李黑話》--旨在記錄個人認知,及意識覺醒之路。為下一代留下當前時代背景下的思考。不知從何時起,“學會花錢,才會賺錢”這句話風靡全網,一時間被封為圭臬,原意是“學會花錢,不摳門,大膽花錢,才會.
1900/1/1 0:00:00央行發布白皮書,詳解數字人民幣研發進展。白皮書闡明了央行在數字人民幣研發上的基本立場,闡釋了數字人民幣體系的研發背景、目標愿景、設計框架及相關政策考慮.
1900/1/1 0:00:00北京商報訊從比特幣突破歷史新高再到崩盤腰斬,從機構入場站臺再到紛紛撤退,從挖礦產業供不應求再到四面圍剿,僅僅3個月,幣圈再次經歷一場行業大起大落.
1900/1/1 0:00:00新藥研發是人類發展中極具風險和復雜度、耗時最漫長的技術研究領域之ー。英國《自然》雜志有一組數據顯示,新藥的研發成本大約是26億美元,耗時約10年,成功率不到十分之一.
1900/1/1 0:00:00「本文來源:全國黨媒信息公共平臺」 來源:生命時報 哈爾濱醫科大學附屬第四醫院皮膚科主任醫師尤艷隨著年齡增長,皮膚中生成的黑色素越來越少,頭發變白是正常現象.
1900/1/1 0:00:00