根本吃了「翻譯蒟蒻」⋯這翻譯軟體超越Google、微軟,各國語言轉換流暢讓歐洲人驚呆了!

2018-12-17 14:14

? 人氣

權威的德國朗氏字典已經成為「老黃歷」?(圖/德國之聲)

權威的德國朗氏字典已經成為「老黃歷」?(圖/德國之聲)

一家德國初創企業推出的翻譯軟件DeepL在翻譯水平上讓不少用戶驚豔。與之相比,市場上其它通用翻譯軟件相形見絀。德國人做了什麼與眾不同的事?

[啟動LINE推播] 每日重大新聞通知

涉足翻譯軟件的IT巨頭如谷歌和微軟面對的這個競爭對手雖小,但實力不輸。與谷歌翻譯等相比,來自德國科隆的初創企業DeepL的軟件翻出的文字語句流暢自然得多。這家由一名前谷歌員工創建的公司與其它競爭對手比起來,有一個明顯的優勢。

這一產品運用了以人工神經網絡為基礎的所謂深度學習(Deep Learning)技術。為此,DeepL的研發者利用了一個現有的在線服務數據庫。

從字典到翻譯器

2009年,這家公司的在線雙語詞典Linguee.com上線。它的不同之處在於,除了列出詞匯的各種翻譯選項,還給用戶提供大量來自現有原文的雙語對照例句。

這些例句是由一種叫網絡爬蟲(Web-Crawler)的特殊網絡機器人從互聯網上搜集來的。許多例句來自歐盟等多邊國際機構的官方文件。

一種經人工訓練的學習算法對搜集來的文句的結構和含義進行分析計算,以期掌握特定的概念在外語中如何表達。此外用戶還可以在Linguee字典應用中留下自己的反饋,並對翻譯結果作評估。過去9年中,通過數量不斷增加的高質量翻譯文庫,Linguee應用一直在得到完善。這也逐漸成為新的翻譯工具DeepL的基礎。

DeepL--深度學習

DeepL是deep learning的縮寫,意思是深度學習。這是人工智能的一個方面,即模仿人類學習的方式。從前,編程員給每項任務編寫單獨的指令,由計算機去完成。現在,人們則打造一個人工神經網絡,通過輸入現有的範例可以對它進行訓練。範例越多,電腦就能學得越好。對大量數據進行處理的技術可能,讓這一機器學習的潛力得到進一步拓展。

從技術上看,深度學習是一種結合運用多個層面信息處理的算法。「深度」指的是數據穿越的層級的數量。這一技術如今已運用於無人駕駛汽車、虛擬實境視聽裝置和人臉識別系統。現在它也被運用到了自動翻譯中。

不光是學習

過去兩年中在這一領域中,DeepL不是唯一運用深度學習技術的企業。互聯網巨頭谷歌、微軟和Yandex也在嘗試。不過DeepL與它們有所不同。

首先,人工神經網絡的運行能力的基礎是訓練所使用的原始資料的質量。在此,DeepL得益於「大哥」Linguee,後者提供了數以十億計的高質量翻譯例句範文。

「Linguee的數據是高質量的訓練素材」,DeepL公司的發言人科達(Lee Turner Kodak)介紹說。他強調,DeepL成功的背後還不僅僅是數據的質量,「我們的研究人員熟悉這一領域的最新發展,開發了獨一無二的神經網絡架構。」

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章