ChatGPT、Gemini輸了!AI準確度排行榜出爐,Copilot排第4,冠軍是「它」

2025-11-19 16:45
AI工具的用戶信任度,與其資訊的準確度呈現落差。(示意圖/取自freepik)
AI工具的用戶信任度,與其資訊的準確度呈現落差。(示意圖/取自freepik)

生成式AI如今已成為台灣企業與上班族處理日常工作的核心工具,從ChatGPT、Gemini到Copilot,這些數位助理正在以驚人的速度取代傳統的網路搜尋,讓員工快速完成資料研究、簡報大綱甚至法規初步判讀。然而,一則來自英國消費者權威組織「Which?」的最新調查,揭露了潛藏在高效外表下的巨大危機,AI工具的用戶信任度,與其資訊的準確度呈現落差。如果企業對此風險視而不見,持續盲目依賴未經驗證的AI回答,很可能讓企業在法律、金融等關鍵領域踩到紅線。

AI準確率大調查!ChatGPT 64%排第5,Gemini 69%排第3,Perplexity 71%奪冠

Which?」針對數千名英國成年人進行的問卷調查顯示,大約有三分之一的受訪者已經將AI視為比傳統搜尋更重要的工具,在龐大的AI使用者群體中,更有將近一半的人表示他們對AI產出的資訊抱持著「合理程度」或「高度」的信任。

專家實測了6款市場主流的AI工具,包括ChatGPT、Google Gemini(標準版與 AI Overviews)、Microsoft Copilot、Meta AI以及Perplexity,並針對40個涵蓋金融、法律、健康、消費者權益等高風險領域的關鍵問題進行評估。

為了讓讀者一目瞭然,以下是各款AI工具在這次測試中的表現:

排名AI工具整體準確率
1Perplexity71%
2Gemini AI Overviews70%
3Google Gemini69%
4Microsoft Copilot68%
5ChatGPT64%
6Meta AI55%

數據證實,人氣與使用量最高的工具,未必擁有最高的專業可靠度。

ChatGPT也搞錯了!研究證實AI給予錯誤建議,恐讓人誤犯法規

研究進一步指出,AI工具錯誤回答高風險問題,可能會構成法律風險。

在金融領域,研究人員故意在關於「個人儲蓄帳戶(ISA)」年度投資額度上設定陷阱(詢問£25,000,實際上限為£20,000),結果ChatGPT和Copilot竟未能察覺這項錯誤限制,反而直接基於錯誤前提提供投資建議,可能導致使用者違反英國稅務機關(HMRC)的規定。

在法律諮詢方面,AI工具表現得同樣粗糙,經常給出籠統且危險的行動方案。例如,在涉及建築工程糾紛時,AI曾建議使用者「暫停付款」。然而,專家提醒,這類行為在某些情況下可能反而構成違約,讓當事人喪失法律上的主動權或優勢。此外,AI工具還經常忽略英國不同司法區(如蘇格蘭、英格蘭)在法條上的細微差異,讓AI生成的建議產生嚴重偏差。

測試也發現,AI經常引用過時、甚至不值得信賴的資訊來源。在涉及稅務查詢時,ChatGPT和Perplexity甚至導向了收費高昂的第三方退稅公司,而非政府免費的官方服務。對於需要嚴格控制成本和供應商風險的企業來說,這種誤導性資訊可能導致不必要的財務損失或安全隱患。

科技巨頭認AI有其缺點,OpenAI承諾提升準確性

面對測試結果,科技巨頭們也紛紛承認現有的AI模型有其局限性,微軟坦言Copilot僅是「資訊的整合者,而非權威來源」,並鼓勵使用者驗證內容;OpenAI則承諾將提升準確性,並將其最新的GPT-5模型宣傳為「迄今最聰明、最準確」的版本。

專家建議「3招」防止AI生成偏差回答

專家建議,企業必須嚴格要求員工在利用AI查詢如法規或財務資訊時,務必清楚標明地區或司法區,以防止AI自行推測而產生偏差。同時,必須強制員工對AI提供的資訊進行來源查核,不能僅憑單一答案做出判斷。最重要的是,在所有涉及高風險的專業決策(如法務、財務、醫療)中,AI的回覆只能被視為眾多參考意見之一,最終的裁決權和責任,必須回到具備專業資格的人士身上。

AI再聰明,目前仍無法取代人類的專業判斷,調查提醒,企業與其全面禁止,不如建立完善的使用規範,才能提升效率並有效規避風險。 (相關報導: ChatGPT 突傳「停止提供3大服務」,用戶實測怒批:真的不能用了!誰還要付費續訂?OpenAI 回應了 更多文章

資料來源:《Which?

更多文章
苗栗縣校外會年終工作會議 副縣長與校長打勾勾約定守護孩子
2026明年健保費會不會漲?健保會拍板給答案!財務問題仍迫在眉睫
退休月領逾4萬元還是不夠用!72歲男1原因燒光積蓄,每周兼職4天才能過活
溪州公園森林木棧道區改善工程啟用 整修木棧道1,476平方公尺及多項設施
康仁俊回憶十年交情:大咖人選頻傳 真正走入桃園的是何志偉
斗六人行道案掀熱議!張麗善調「良性溝通」求雙贏,縣府全力支持城市升級
一週約會幾次?婚戀品牌春天會館:「留白」成關係穩定關鍵
五大洲學者齊聚東海政治系 四場重量級年會引關注
台中「超巨蛋」採民間自提BOT 盧秀燕強調全力催生國際級地標
中油全台 1,937 站響應「世界廁所日」大掃除,綠能公廁獲肯定,上網分享再抽好禮
專屬黑鑽卡會員 好市多獨家泰國豪華Villa方案CP值爆表
普發一萬變iPhone!柒息地推「放大術」 吃串燒也能抽手機中百券
領萬元小心被騙 投縣府邀藝人『黑面』代言反詐
好食好事率團進軍新加坡  玩艸植造奪永續獎展國際競爭力
校園中的希望「心靈加油站」 第198所「玉山圖書館」落腳中市清水槺榔國小
Google Gemini3博士級助理來了!「超醜手寫筆記」自動辨識 5大功能亮點總整理
許信良新書發表會藍綠一家親,朱立倫自曝差點當「民進黨主席」,吳伯雄要打幹細胞站台
不是板南、信義安和線!台北捷運「1路線」超常故障,3年出包13次、影響7591人,北捷曝原因
省荷包振買氣 2025物調券第二波11/28登場 35萬份、108處場域熱力開發
領完普發1萬還有5筆錢!最新旅遊補助「符合資格每人拿2000元」,補貼金額時間曝光
涉嫌協助盜版漫畫擴散,月瀏覽量高達3億次!美商Cloudflare遭日本法院判賠5億日圓,敲響「CDN避風港」喪鐘
免費泡溫泉!「9大台北溫泉推薦」大眾運輸就能到,這1個竟能一人一池還有木造湯屋
許信良出版新書「天命」:談台灣民主就像台積電晶片,籲政黨停止仇恨動員不必你死我活
鄭麗文會見黃國昌 喊話「全方位合作」:藍加白是台灣最新主流民意
譴責中共抓捕沈伯洋!王定宇提案獲立院外委會通過 全場只有1藍委
不挺王義川?王世堅大讚何志偉是「桃園奇兵」:要站台我隨傳隨到
整頓「直美醫師」! 衛福部修法:明年起未完成「2年PGY」禁施作醫美
藍白合作啟動!主席首度會談、鄭麗文喊「一加一大於二」談話重點全整理
清水地熱、傳藝中心輸了!宜蘭最強景點吸134萬人,遊客讚風景優美很愜意、值得一逛
又有毒水果!台灣人常吃的「1水果」驗出農藥超標,4748公斤全銷毀,兒童維生素噴霧也驗出防腐劑
普發一萬宣布加碼!1縣市最高領16000元「市長保證沒問題」最快入帳日、財源一次看
台灣導彈誤射廈門?演武大橋失火瘋傳「兩岸開戰」 事實查核揭真相
「拿不到一兆美元,我就不想努力了!」馬斯克逼出史上最高薪酬,他真的值得嗎?《經濟學人》這樣看
鄭麗文拜會北市黨團!戴錫欽豪言「2026藍營單獨過半」:國民黨一定提滿
台積電股價失守1400元!是進場好時機嗎?AI過熱隱憂何時能解?專家揭1事將翻盤
高市早苗「台灣有事」效應擴散!中國郵輪突取消旅日本行程 船組人員:早有預感
寶島陽光創紀錄:屏東大學光電球場奪大專校院發電總容量之冠
藍白主席會談前表態!鄭麗文喊中央到地方都合作:在野要成為政治定海神針
強調「資安即國安」!賴清德:中國極可能透過AI模型危害台灣安全
台灣76年傳統市場沒落了!「店鋪拉下鐵門暫停營業,建築老舊人煙荒涼」,議員籲轉型
1% 推薦週報》加拿大人很愛說Sorry?原因竟然是這樣!運動結合娛樂,近期超夯「室內高爾夫球場」推薦一次看!及其他風格觀點
騎機車禮讓行人先過「卻仍被開罰單」!最高6000元繳國庫,警察曝違規挨罰原因
「我才不在乎那隻手做過什麼」川普緊握沙烏地王儲之手,為哈紹吉分屍案護航:他什麼都不知道
不是台灣、中國!「1國家」超愛去日本旅遊,10月遊客高達86萬人,3原因回訪率超高,年輕人很常去
2025航空公司出爐!第一名「這間」、長榮與華航排名曝光
蔡依林大巨蛋跨年演唱會2025懶人包》搶票時間/門票票價/座位圖/國泰卡友優惠總整理,關鍵資訊一次看
日本退票潮又一波!中國旅遊警示退訂量破27倍 全年經濟恐現2.2兆日圓缺口
國民年金明年調漲!不繳錢家人也受罰、5大給付無法領,2026月繳多少/月領試算/繳費欠費查詢
正式表態爭取國民黨彰化縣長提名 前副縣長洪榮章:千呼萬喚準備好了
國軍接裝ALTIUS-600M攻擊無人機!射擊畫面首度公開 顧立雄親自到場觀看