祖克柏發表「台英口語互譯」開源系統!想讓父親「用自己的語言跟全世界溝通」,台灣工程師陳鵬仁打造黑科技

2022-10-20 13:53

? 人氣

Meta的AI工程師陳鵬仁。(翻攝臉書)

Meta的AI工程師陳鵬仁。(翻攝臉書)

Meta創辦人兼執行長祖克柏19日親自介紹「通用口語翻譯計畫」(Meta AI’s Universal Speech Translator project),並且與台籍工程師分別以英語跟台語進行對談,再由該公司研發的AI翻譯技術即時溝通,彷彿祖克柏也能跟你講台語。這項技術的幕後推手之一,就是與祖克柏共同進行展示的Meta工程師陳鵬仁。他說開發這套系統的初衷,就是能讓父親「只用台語就能跟所有人溝通」。

[啟動LINE推播] 每日重大新聞通知

在台北時間19日深夜發布的臉書影片中,祖克柏(Mark Zuckerberg)說英語,陳鵬仁則說台語,(影片中稱為Hokkien,即福建話)。祖克柏先宣布Meta有了這個新的技術,陳鵬仁再以台語說:「嗨,馬克(祖克柏的名字),你甘知影咱A團隊打造第一個支持口語語言的翻譯系統?」然後影片便出現這段話的口說英語翻譯:Hi, Mark. Do you know that our team created the first translation system to support a spoken language?

祖克柏以英語表示,有數以百萬的民眾說福建話,但因為它沒有標準的書寫系統,這使得打造翻譯系統變得很困難。這段話接著被譯成福建話唸出來。與他對話的陳鵬仁則說,他小時候學校並沒有教福建話,而是透過口說代代相傳。祖克柏強調,因為有了這個研發成果,「我們也都可以聽懂(福建話)了」。最重要的是,兩人的對話也都分別即時翻譯成對方的語言,展現AI翻譯的威力。

Meta發布新聞稿指出,在台灣長大、講中文的陳鵬仁深知語言障礙將影響溝通能力,他70歲的父親陳聖獎是退休的工廠技術主管,來自普遍使用台語的台灣南部。陳鵬仁表示:「我一直希望我的父親跟所有人溝通時,都能使用他最熟悉的台語」、「他聽得懂普通話,但若是討論比較複雜的主題時,他說話的速度會變得比較慢。」

Meta表示,AI翻譯過去著重於各種書寫語言,但全球超過7000種現存語言將近半數都沒有標準的書寫文字系統,因此Meta想為這類語言打造機器翻譯工具,讓AI翻譯技術也能應用在那些沒有書寫文字的語言上。這項採用開放原始碼的翻譯系統是Meta Universal Speech Translator(UST,通用語音翻譯工具)專案的一部分,Meta則選定在新加坡、印尼、馬來西亞、菲律賓和其他東南亞地區廣泛使用的「福建話」來作為研發對象,最終希望為所有現存語言進行即時語音翻譯。

Meta根據台語語音語料庫Taiwanese Across Taiwan,建立第一個福建話與英語雙向的語音翻譯基準資料集。Meta也將開放資料集原始碼、評估資料集和研究報告,鼓勵其他研究人員合作進行閩南語語音翻譯,一起推進相關技術。Meta表示,目前該計畫只能讓福建話跟英語者的使用者對話,而且每次只能翻譯一個完整句子,未來則希望推廣到各種語言的同步翻譯。

祖克柏與台籍臉書工程師陳鵬仁分別用英語跟台語對談,Meta軟體則居中翻譯。
祖克柏與台籍臉書工程師陳鵬仁分別用英語跟台語對談,Meta的AI翻譯系統則居中翻譯,直接說出對方的母語。

Meta打造福建話跟英語的翻譯系統時,由於沒有福建話的標準書寫系統,需要將福建話的語音轉譯成標準化的拼音符號。此外,也因為福建話沒有標準文字,若從零開始建立全新的翻譯資料內容將是一個十分辛苦的工作,也無法利用已經建好的各種語言資料庫。因此Meta將最接近福建話的中文資料庫作為中介,大幅改善建立人工智慧模型的效率。Meta認為,AI翻譯有助於打破在現實世界和元宇宙中的語言限制,未來所有語言都不再是人們相互理解的障礙,所有人都能進行順暢無阻的溝通。

陳鵬仁的高中同學、目前在康乃爾攻讀資訊科學博士班的侯宗佑在臉書上表示,陳鵬仁目前在Meta負責翻譯的演算法,雖然全家住在美國,仍用心尋找台語教材、讓小孩練習母語。侯宗佑指出,Meta翻譯技術是世界第一個直接「口語對口語」的翻譯系統,而且以開源方式供大家使用。也因為Meta先選了台語這個以口語為主的語言進行研發,往後即使不會寫台語書寫系統的人,也可以利用這個系統跟其他語言的人溝通,只要會講就可以了。

喜歡這篇文章嗎?

國際中心喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章