當ChatGPT「一本正經胡說八道」,如何破除「AI幻覺」?《經濟學人》的四種可能解方
在這個AI技術日益進步與普及的時代,許多人都有跟大型語言模型(LLM)對話的經驗。如果你也是其中一員,或許以下情境對你並不陌生:ChatGPT回答問題時自信、連貫,細看答案卻悖離事實、完全錯誤。這種生成式AI「一本正經胡說八道」的詭異現象,人工智慧業界將其稱為(AI)「幻覺」(hallucination)或者(AI)「妄想」(delusion),《經濟學人》則給出四種建議的解方。
《經濟學人》指出,生成式AI的「幻覺」問題使得人們很難在現實生活中依賴人工智慧系統。然而要解決此一問題並非易事,因為讓AI出現「幻覺」的根本因素、同時也是讓它們威力無窮的原因——大型語言模型是「生成式」(generative)人工智慧的一種形式,從字面上來看,這意味著它們透過編造東西來解決新問題。
各家生成式AI的研發者也清楚「幻覺」目前難以避免,因此官網經常可以看到警示標語,OpenAI也在使用說明中警告ChatGPT「可能會犯錯」;美國人工智慧公司Anthropic表示其大型語言模型Claude「可能會顯示不正確或有害的資訊」;Google的Gemini警告用戶「仔細檢查其回應」。這些警語都指向大型語言模型的同一個問題:無論AI生成的文字看起來多麼流暢和自信,我們仍不能百分之百相信它。
除了造成使用者的不便,生成式AI胡說八道更會造成法律爭端。加拿大航空官網的聊天機器人2022年11月就因為對消費者提供不實資訊,導致對方得到票價折扣的錯誤資訊,多付了483美元。加拿大男子莫法特(Jake Moffatt)為此將加航一狀告上法院,加拿大航空雖試圖推卸責任,宣稱「公司不應對聊天機器人提供的資訊負責」,但法院認定加航未能確保聊天機器人提供資訊的準確性,要求航空公司將溢收票價附加利息退還給消費者。
生成式AI如何生成?
大型語言模型之所以產生「幻覺」,《經濟學人》指出與其運作方式有關。大型語言模型生成回答的過程是基於預先訓練的模型,透過大量的文本資料進行訓練,從而能夠理解自然語言(也就是人類語言)的結構、語法和語意。當生成式AI接收到一個問題時,就會使用訓練好的模型來預測最有可能的答覆。換言之,生成式AI是利用上下文的語意和問題的特定細節,透過不同字詞接續生成的概率來推算出最有可能的答案。大型語言模型要求不同字詞都要有機會出現,這使得AI模型能夠靈活地學習新模式、不會給予一成不變的回覆,但同時也會產生錯誤的陳述。《經濟學人》指出,根本問題就在於,語言模型出現什麼答案是機率問題,但真理顯然不是。
(相關報導:
《美中科技合作協定》到期未見續簽,雙方脫鉤斷鍊更進一步?
|
更多文章
)
《經濟學人》進一步解釋,大型語言模型的建構並不像搜尋引擎或是百科全書那樣能夠完美檢索,由於模型的資料大小勢必遠遠不如於訓練資料庫的大小,因此AI必須透過「壓縮」來進行學習。導致大型語言模型只保留了資料的關鍵特徵,彷彿是解析度低了許多的模糊照片。儘管有些事實不容易搞錯,例如「巴黎」可能始終都是「法國的首都是⋯⋯」之後出現機率最高的回覆,但更多統計上不太明顯的事實,就可能會在模型進行資料壓縮的過程中被搞錯。
訓練AI時微調參數權重
此外,當預先訓練的大型語言模型遭到「微調」時,可能會進一步出現失真。這通常出現在AI的訓練後期,生成式AI會參考預測結果的對錯,持續微調參數的權重,目的是希望藉由一次次的微調可以使AI變得極為精確,達到每次都能產生正確的輸出值。然而根據對話紀錄進行微調的過程中,可能會增加AI模型出現幻覺的機會,因為AI可能會編造事實來增加趣味性。《經濟學人》認為,調整AI模型的參數權重有助減少「幻覺」,比方說刻意建立一個有缺陷的模型,並根據與提示相矛盾或有所缺漏的資料進行訓練,進而研究人員可以從原始模型的權重中找出修改方向,達到降低「幻覺」的目的。
調整「溫度值」
《經濟學人》還提出了其他三種有助消除「幻覺」的解方:包括改變ChatGPT的「溫度」(temperature,範圍是0到2)參數,這個參數可以改變AI產出的創意程度和連貫性,較低的溫度值使AI模型更加保守,但準確性和一致性會比較高;較高的溫度值則會增加選擇的隨機性,因此產生更有創意的回應,但答覆的內容也有可能離題。如果目標是減少幻覺,則溫度應該設定為零。此外,也可以限制模型只選擇機率較高、排名較前的選項進行答覆,這種做法降低了回應不佳、離題的可能性,同時也允許一定的隨機性,從而保留回應的多樣性。
巧妙引導AI
巧妙的提示也可以減少生成式AI產生幻覺。Google DeepMind的研究人員發現,告訴大型語言模型「慢慢來、一步一步處理這個問題」,可以減少錯誤回應、並且提高解決問題的能力,尤其是數學問題。《經濟學人》解釋,AI模型會學習範例和回覆模式,將問題拆解為更小、更單一、精確的問題,模型更有機會識別並應用正確的範例進行回應。不過愛丁堡大學的自然語言處理專家愛德華多・龐蒂(Edoardo Ponti)認為,這種做法只是「治標不治本」。
RAG:檢索增強生成
《經濟學人》也提到了RAG(Retrieval-Augmented Generation),也就是「檢索增強生成」技術。RAG將AI模型的工作分為兩部分:檢索和生成,前者負責從外部知識庫(例如報章雜誌等)中檢索相關的訊息、提取提示中相關的上下文資訊,生成訊息時再根據檢索到的資訊進一步處理。這種做法可以使大型語言模型發揮摘要與改寫的優勢,而非進行研究工作——進而減少幻覺的產生。包括計算機和搜尋引擎這樣的外部工具,也可以透過RAG的方式連接到大型語言模型上,有效地為其建立補強的支援系統。
(相關報導:
《美中科技合作協定》到期未見續簽,雙方脫鉤斷鍊更進一步?
|
更多文章
)
「幻覺」終究難以避免?
雖然《經濟學人》提出種種解方,但也承認大型語言模型產生幻覺終究難以避免。美國軟體公司Vectara一項追蹤調查顯示,ChatGPT 4.0的摘要仍有3%是錯誤的;Claude 2 為8.5%、Gemini Pro 為4.8%,這讓程式設計師集中心力在檢測而非預防「幻覺」的出現。在其檢測的過程中發現一項線索,在大型語言模型選擇回覆的字詞中,如果許多單字被AI挑中的可能性都相當接近,這意味著AI也不確定要選擇何者為是。這項線索表明大型語言模型就是在猜,而不是使用它所接受到的訊息去判斷並知道何者為真。
檢測幻覺的另一種方法是訓練另一個大型語言模型來進行事實查核。作為事實查核的模型可以得到「基本事實」以及被查核的模型的回覆,然後判斷它是否同意被查核模型的敘述。或者,可以向事實查核模型提供被查核模型對同一個問題的多種回覆,並判斷這些回應是否一致,如果不是的話,被查核模型的回覆就很有可能是幻覺。晶片製造商輝達(Nvidia)就開發了一個開源框架,用於建立圍繞大型語言模型的護欄、使其更加可靠,目的之一就是在需要時部署事實查核機制來防止幻覺。
微軟AI Frontier的負責人艾斯・卡瑪(Ece Kamar)表示,雖然這些方法可以降低幻覺發生的機率,但「目前還不清楚這些技術是否能夠完全消除幻覺」。她指出,在許多情況下,這類似於模型的自我破壞,舉例來說,如果大型語言模型被要求對一部奇幻小說提出想法,但僅限給予符合現實世界的回應,那麼其產出將會令人失望。Kamar表示,她的研究目的不是消除所有模型的幻覺,而是阻止模型在無異的情況下產生幻覺。
(相關報導:
《美中科技合作協定》到期未見續簽,雙方脫鉤斷鍊更進一步?
|
更多文章
)
許多研究人員相信,避免AI幻覺必須使用更多更好的數據來訓練大型語言模型;也有人認為,大型語言模型作為一個機率模型,永遠無法達到完全消除幻覺的境地。《經濟學人》指出,真正的問題恐怕不在AI模型本身、而是在於使用者。生成語言曾是人類獨有的能力,大型語言模型令人信服的文字輸出能力讓人們輕易將其擬人化,假設它們能像人類那樣操作語言、甚至進行推理和理解。但目前仍沒有證據顯示大型語言模型能辦到這些事,因為它們無法學習邏輯一貫的世界模型。即使語言模型不斷改進、輸出更符合人類期望的答案,我們依舊不清楚AI模型是否更為「人性化」。要讓AI模型在現實世界中獲得更好的運用,光是訓練AI是不夠的,更為重要的是,我們也該訓練人類如何使用和看待AI模型。
更多新聞請搜尋🔍風傳媒
因為你,我們得以前進,你的支持是我們的動力
更多文章
愛沙尼亞國會友台小組拜訪 民進黨:與全球民主夥伴推動價值外交愛沙尼亞國會友台小組於今(5)日到訪民進黨中央黨部,訪團成員為愛沙尼亞跨黨派國會議員,並由友台小組主席裴克多(KristoEnnVaga)所率團,此會議由民進黨副秘書長翁世豪、民進黨立委洪申翰、陳冠廷、張雅琳、青年發展部主任阮俊達、國際事務部主任李問、副主任邱雯莉共同接見。
海巡署密錄器為何不足?黃揚明揭原因:政策都只做一半金門漁船翻覆事件持續延燒,海巡署宣稱執法過程中未能全程錄影錄音,導致無法將關鍵事實完整呈現,國民黨立委陳玉珍日前則爆料,海巡署的密錄器其實數量是夠的,但因民進黨政府禁用中國通訊器材,導致部分中國製密錄器無法使用。對此,媒體人黃揚明於網路節目《阿姐反抗軍》表示,台灣政策僅做一半,禁止使用中國密錄器但沒有後續措施,應報廢一隻補一隻。
卦山法拍市集南投傳愛 吸引數百民眾樂尋寶法務部行政執行署彰化分署「卦山法拍市集」今(5)日首度移師南投位於中興新村的彰化分署南投行政執行官辦公室舉行,由法務部行政執行署署長黃玉垣主持,活動並結合小小書記官研習,實境體驗變賣過程,助益法治觀念向下扎根,吸引數百民眾前來尋寶,場面相當熱絡。
召開「動員、災防、戰綜」三合一會報 侯友宜:汛期超前部署、完善動員機制!新北市「全民防衛動員準備業務會報、災害防救會報、全民戰力綜合協調會報」113年第1次聯合會議今(5)日下午召開,由召集人市長侯友宜親自主持,包括行政院災害防救辦公室李永福主任、行政院動員會報沈威志處長、臺閩戰綜會報邸上校、北區戰綜會報陳上校、關渡地區指揮部張少將、市府各局處首長及各區區長皆出席與會。
主持道安大會 侯友宜:重大工程施工圍籬適當退縮,還路於民!新北市長侯友宜今(5)日主持3月份道安大會時指出,新北市污水下水道工程近幾年如火如荼進行中,而且還有捷運萬大線等許多捷運、大型道路工程建設也持續推動,施工圍籬勢必影響道路交通順暢,因此除務必落實交維管制之外,施工單位更應本著安全第一的原則與周邊住戶溝通並達成共識,以降低負面衝擊,讓市民成為推動重大工程建設的助力。
第14屆考試委員審薦作業啟動 蕭美琴:5月31日前提名第14屆考試委員提名審薦小組第1次會議今(5)日上午在總統府召開,由小組召集人準副總統蕭美琴主持。蕭美琴致詞時表示,本次考試委員提名作業,適逢總統交接期間,經520交接小組會商後獲致共識,決議仍採行審薦程序,襄助第16任總統賴清德以公開、公平、公正方式,於5月31日前提名考試委員人選。
竹市西門國小通學步道改善6月完工 高虹安:打造安心通學人本城市新竹市府全力打造孩子更安全、更友善的步行環境!市長高虹安今(5)日前往西門國小視察通學步道工程,高虹安表示,市府重視人本交通,極力打造行人友善的城市空間,為提供學童及民眾更舒適的通行環境,工程改善既有人行道鋪面,包含北大路、北新街及延平路一段範圍,總長約600公尺的人行步道,並將原有公共設施遷移、新設標線型人行道等,預計今年6月完工,達成交通暢行、行人友善施政藍圖。
竹縣敬老愛心卡、愛陪卡臨櫃製卡 長輩辦卡隨辦隨取免等待為減少長輩及持有身心障礙證明的縣民申領敬老卡、愛心卡及愛心陪伴卡的等待時間,新竹縣政府推出便民服務,自今(5)日起民眾可視自身需求,直接至縣府社會處老人及身障福利科臨櫃申請,備齊相關文件後可立即製作,最快3分鐘即可領卡。
天生受財神眷顧!3生肖越老越有錢,晚年存款最多、不怕沒錢花想要輕鬆度過晚年,除了年輕時要好好存錢之外,有人天生就福氣滿滿,先天好運加上後天努力讓她們輕鬆賺進晚年享福的錢財。搜狐網就整理了3個生肖的女性,她們命中帶福,靠著自己的努力和機運一步步累積財富,到了晚年存款豐厚,可以不用為了錢財煩惱,快來看看有沒有你的生肖吧!
王惠美率隊參加東京國際食品展 成功媒合簽署MOU訂單超過1億元為提升「彰化優鮮」品牌能見度,並為彰化縣優質農特產品拓展全球行銷通路,彰化縣長王惠美、彰化縣農會總幹事張建豐一行人,今(5)日參加為期4天的2024FOODEX東京國際食品展,成功媒合彰化通利水產有限公司與日本橫神株式會社及彰化打寶蛤水產有限公司與日本AZEN株式會社及彰化縣花壇鄉農會與日本HANAEMICHALLC等3家彰化優鮮廠商與日本商社共同簽署合作備忘錄,這次簽署為期3年合作,總金額達到新台幣1億3,300萬元,會展現場並由彰化縣農會、彰化縣各鄉鎮市農會、合作社、青農與彰化優鮮合格廠商共同設置的「彰化優鮮」展示攤位,讓世界看到最好的農漁特產在彰化優鮮。
何欣純邀共吃酸菜白肉鍋挺本土豬 陳建仁:總質詢結束後安排台中市政府農曆年前於台糖豬肉中檢出瘦肉精,不過後續針對其餘肉品進行檢測時卻均未檢出,引發外界討論。對此,民進黨籍台中市立委何欣純今(5)日針對瘦肉精及多項民生議題進行質詢,還邀請行政院長陳建仁邀請所有台中市立委「一起到台中市吃火鍋。」
謝靜華激吻友人變女上校 徐巧芯質疑國安局紙包不住火才改口:背後有靠山?已婚國安局特勤中心少將謝靜華上月因「當街激吻」,遭國安局記2大過處分、列為優先汰除人員,未料今(5)日又遭媒體爆料,該名女性並非「民間友人」,而是國防部作戰及計畫參謀次長室上校幕僚,更曾為台灣首位女艦長。對此,國民黨立委徐巧芯質疑,謝靜華過去就有幾起素行不良事件,讓人感覺背後一定有靠山,才敢如此為所欲為。
桃園驚傳擄小孩!老翁跟女童上電梯「一開門就強拉」監視器畫面曝 他到案喊冤:是因想念孫女…桃園疑似發生擄人案件!一名網友日前公開社區大樓的公告,只見公告中附上一張監視器畫面影片,並指出1日傍晚時分一名陌生男子和一名小女孩搭乘電梯抵達某一樓層時,男子竟罔顧小女孩的意願、將其強拉出電梯,所幸大樓主委及時解救小女孩、將其護送回家才沒釀成大事。不料,男子到案後卻「只是想邀請小女孩回家吃糖果」,一番說法並不被小女孩家長買單,其舉動也釣出大批網友怒轟。
台中軌道路網進度大躍進 盧秀燕盼任內捷運藍線開工龍年開春,台中市交通建設獲重大進展的好消息接二連三,今年1月,「捷運藍線綜合規劃」、「捷運綠線延伸大坑、彰化可行性研究」及交通部辦理之「台鐵海線雙軌化(談文至追分)可行性研究」等三案陸續獲行政院核定。市長盧秀燕今(5)日主持市政會議表示,市府積極推動捷運台中計畫,捷運綠線已完工,盼在她的任內藍線也能開工;針對其他路線,市府也積極推動中,期望縮短前置作業、盡快興建,建構台中市完整捷運路網。
中市力挺女性公共參與 273委員會性別比達成率近100%38婦女節即將到來,台中市長盧秀燕今(5)日在市政會議提前祝福所有女性朋友「女神節快樂!」她表示,3月8日是婦女節,她認為每一位女性都是女神,因此她也稱之為「女神節」;身為六都唯一女性市長,她特別重視女性議題,自她上任後5年間,台中273個委員會任一性別比例達三分之一的比率,從過去不到70%,至今已接近100%,透過具體方式展現台中市性平政策。
市政路第二標工程範圍建物陸續拆遷 中市府感謝地主理解支持台中市政府推動市政路延伸工程,打造中部工業及科技園區黃金走廊,台中市政府建設局辦理市政路延伸開闢工程第二標工程(安和路至環中路段),去年底順利決標,並於今年1月31日開工,在沿線地主的理解支持下,已陸續配合自行拆遷地上物,讓市府工程團隊能順利推動建設,為台中市民提供更便捷的交通環境。
東岸政治大戰延燒!基市府質疑林右昌賤價招租城際轉運站:市庫短收1.75億基隆東岸商場產權爭議延燒成前後任市長、藍綠政治大戰。基隆市政府發言人余治明今(5)日質疑,前市長林右昌任內將基隆城際轉運站「賤價招租」,得標廠商竟還是非相關產業的生技業者,簡直荒腔走板;他續指,城際轉運站斥資7.35億元全新打造,林右昌市府卻以頭2年每年50萬元的固定權利金委由招標廠商運營,相較東岸商場每年收取1500萬元的固定權利金,落差近30倍。
2024兩會》全國人大議程未納入人事案 劉建超真能當上中國外長?中國全國人民代表大會和人民政治協商會議全國委員會「兩會」5日登場,前者有權依據國家主席和國務院總理提名,決定部分高層人事,因此新外交部長人事成為這次兩會焦點之一,不過《彭博》4日報導指出,由於全國人大議程未納入討論人事案,推測要等其常務委員會4月召開時才會決定新外長。
台中旅遊環境持續升級 景點遊客量整體表現亮眼台中市政府致力優化旅遊環境,構築旅客友善且獨具特色的步道、自行車道及周邊旅遊服務設施,並結合主題活動與行銷宣傳,推展台中優質旅遊景點,吸引旅客到訪。根據交通部觀光署公布統計112年度台中主要觀光景點吸引逾5,933萬人次,較111年提升超過2成,再創新高;全國前10大最高人次主要遊憩據點,台中就囊括3處,表現亮眼。
川普確定能參選!美國聯邦最高法院推翻科羅拉多州最高法院判決美國聯邦最高法院的大法官們4日一致裁決,川普的名字將可留在科羅拉多州的選票上,這也代表聯邦最高法院推翻了科羅拉多州最高法院的判決,因為後者原先認為川普參與煽動了2021年1月6日國會山莊暴動,沒有資格列名在州選票上。這也代表川普在「超級星期二」的前一天,取得一場關鍵勝利。
文化部「文化體驗內容徵選補助計畫」 受理「藝術入校推廣類」線上申請文化部積極推動文化體驗教育計畫,期盼以藝文單位的專業導入,讓藝術文化從小扎根。113年度「文化部文化體驗內容徵選補助作業要點」之「藝術入校推廣類」自即日起開放申請,受理至3月31日止。歡迎藝文團隊和藝文工作者踴躍遞件,提出結合5所學校以上的推廣計畫,讓文化體驗成為學生校園生活的一部分。
嘉義縣強化山區醫療、食安整備 民眾來嘉賞花好安心2024阿里山櫻花季將於3月10日至4月10日正式展開,嘉義縣強化山區醫療整備於阿里山香林衛生室及石棹醫療站提供24小時醫療服務,另阿里山鄉衛生所提供門診與視訊診療,也提早做好餐飲衛生講習與稽查,確保民眾安心出遊、開心賞花。
為何越來越多韓團、大咖藝人到高雄開演唱會?場地大、交通方便…一探外國歌手來台開唱的眉角為了2009年「世界運動會」而打造的「高雄國家體育場」(原稱世運主場館)是一座開放式運動場,也是世界第1座有開口設計的體育場,場內可視情況增至55000席的座位,更是國際田徑總會(IAAF)及國際足球總會(FIFA)標準一級建造標準的場館,除了體育賽事,國家體育場如今也是海內外大咖歌手舉辦演唱會的選擇。究竟高雄國家體育場為何如此吸引巨星前去開唱?
嘉義縣專屬黃衣天使 照顧管理專員熱情召募中嘉義縣長期照顧管理中心「黃衣天使」照顧管理專員熱情召募中,起薪4萬起跳,免輪三班,週休2日,依年資及年度考核結果調薪,薪資最高上看5萬2千元,並享有公務人員國民旅遊卡福利;歡迎具有醫事專業、社工、老人照顧相關學系背景人員一同加入,報名時間3月4日起至3月15日下午5點止,招募訊息公告於縣府、衛生局及長期照顧管理中心網站。
高雄內門宋江陣的9日登場 看精彩藝陣、呷澎湃辦桌2024高雄內門宋江陣活動將於3月9日至3月24日在內門紫竹寺登場,今(5)日由觀光局長高閔琳與內門紫竹寺主委劉銀城一同主持記者會。開場由高雄在地、象徵內門傳統的祖孫三代中埔頭宋江獅陣、小烏山宋江獅陣、東勢埔宋江獅陣與創意宋江陣代表臺南大學尬陣交流,並由高閔琳局長、劉銀城主委、民政局林清益副局長及觀亭里許志芳里長共同為頭旗結綵,預告宋江陣系列活動開始。
翁章梁拿出秘密武器 搶先曝光亮點產品果乾烏魚子嘉義縣長翁章梁率團隊參加規模亞洲最大、世界第三大的日本東京國際食品展,活動將於5日至8日盛大開展,昨(4)日在東京皇宮酒店舉行「東京國際食品展—台灣館展前記者會」,翁章梁特別搶先在開展前曝光,嘉義縣的最新亮點產品「果乾烏魚子」,期望透過烏魚子、椪柑、鳳梨和芒果最具有台灣味的代表性農產品,讓更多人能夠品味到屬於台灣土地的獨特風味。
花蓮農產跨境行銷新里程 徐榛蔚攜10家產品登陸日本最大募資平台為推廣花蓮優質農特產品,花蓮縣政府與日本最大群眾募資平台マクアケ株式會社(Makuake)合作,輔導花蓮縣的農特產品及加工品上架於Makuake平台,昨(4)日於Makuake總部辦理宣傳記者會,由花蓮縣長徐榛蔚和Makuake社長中山亮太郎,以及花蓮縣各級農會總幹事與農友一同向日本消費者展示來自花蓮的純淨滋味。
臺東守護海洋環境 112年共清理超過1萬公斤海洋廢棄物「臺東縣淨海聯盟好棒棒」,臺東縣淨海聯盟包括環保艦隊、海洋巡守隊及潛海戰將,聯盟成員主動參與海洋環境保護、海岸清潔及海底垃圾清除等工作,根據統計,去(112)年淨海聯盟成員共計清理超過1萬公斤海洋廢棄物,臺東縣政府對於聯盟成員的付出表示感謝,每一位都是臺東縣海洋保護工作強力的後盾,同時也希望能有更多人關注及加入海洋保護行列,一起來守護我們的海洋環境。
東京食品展開展首日 多家知名企業至桃園館洽談世界前三大食品展之一的東京國際食品展(FOODEXJAPAN2024)於今日(3/5)在東京TokyoBigSight場館盛大開展,桃園市政府攜手12家優質業者參展,參展商品以食品加工、飲料飲品及休閒食品為主,嚴選多元商品,透過在地職人用心製作,推薦給國際買家,開展現場買家人潮絡繹不絕,而桃園館更是不遑多讓,首日即吸引多國買家前來洽談,後續效益值得期待。