ChatGPT、Gemini輸了!哪個AI準確度最高?專家曝:問這3種問題最容易出錯

2025-12-02 17:00
儘管 AI 工具的普及率快速攀升,但其輸出的準確性與可靠度,與消費者的信賴程度卻出現了驚人差距。(示意圖/取自freepik)
儘管 AI 工具的普及率快速攀升,但其輸出的準確性與可靠度,與消費者的信賴程度卻出現了驚人差距。(示意圖/取自freepik)

儘管AI 工具的普及率快速攀升,但其輸出的準確性與可靠度,與消費者的信賴程度卻出現了驚人差距。英國消費者權益組織Which近期測試了ChatGPT、GoogleGemini、MicrosoftCopilot、MetaAI 和Perplexity 等6 款主流AI 工具,以評估它們在回答消費者常見問題(涵蓋金融、法律、健康、旅遊等40 個領域)的準確性。結果顯示,消費者對AI 的信任度極高,但AI 工具的回答卻存在過多錯誤和誤導性陳述,尤其在涉及金錢和法律的重大議題上,風險極高。

AI 準確度排名: Meta AI 最差,ChatGPT倒數第二

Which 專家針對40 個問題進行準確性、相關性、清晰度、實用性和道德責任等綜合評估,滿分100 分:

排名AI 工具總得分 (百分比)關鍵表現
1 名Perplexity71%準確性、相關性、清晰度、實用性均最高。
2 名Gemini AIO70%略優於標準Gemini 模型。
3 名Gemini69%
4 名Copilot68%
倒數第2ChatGPT64%
倒數第1Meta AI55%總分最低,表現最差。

消費者 3 大風險:AI金融、法律、健康建議錯誤百出

Which的調查顯示,約有51% 的受訪者(相當於2500 萬英國人)使用AI 進行網路搜索,其中近一半 (47%) 對AI 的輸出表示「高度或相當程度」的信任。但在實際測試中,AI 的回答在以下3 個領域出現了令人擔憂的錯誤:

1. 金融與稅務風險

忽略法規上限: ChatGPT 和 Copilot 未能發現測試問題中故意設置的錯誤,兩者均給出可能導致用戶超額訂購、違反稅務機關 (HMRC) 規則的建議。

推薦高價服務: ChatGPT 和 Perplexity 在回答「如何申領退稅」時,將高收費、甚至有詐欺疑慮的付費退稅公司連結與政府免費服務並列。

2. 法律與合同風險

誤解合同條款: ChatGPT、Gemini AIO 和 Meta AI 在回答「寬頻網速低於承諾的權利」時,誤解了英國 Ofcom 的自願性規範,錯誤地聲稱所有供應商都允許客戶無罰款退出合同。

錯誤的爭議處理: Gemini 建議客戶在與建築商產生爭議時扣留款項。但 Which 警告,這可能導致爭議僵持,甚至使消費者違反合同而削弱法律地位。

3. 健康與旅遊風險

違反 NHS 建議: Meta AI 建議不要使用電子煙戒菸,這與英國國家醫療服務體系 (NHS) 的建議相悖。

使用不可靠來源: Gemini AIO 在回答旅遊預訂時機時,引用了三年前的 Reddit 討論串作為來源; ChatGPT 在回答電子煙風險時也指向 Reddit,顯示其資訊來源的權威性存疑。

錯誤的旅遊保險建議: ChatGPT 錯誤地聲稱訪問申根國家必須購買旅遊保險,但對英國居民而言,若非簽證旅行,這並非法律要求。

Which科技專家Andrew Laughlin 總結,AI 在提供可消化的網路摘要方面有其強項,但在回答消費者查詢時,仍有實質的改進空間。最大的問題在於消費者對AI 輸出的信任度已達到令人擔憂的水平,然而,包括ChatGPT$在內最受歡迎的工具,卻是回答嚴肅消費者查詢時最不可靠的工具之一。

專家建議: 使用AI 時,務必明確定義問題、檢查AI引用來源。對於醫療、重大財務決策或法律行動等複雜議題,永遠應該尋求專業人士的建議。 (相關報導: ChatGPT 突傳「停止提供3大服務」,用戶實測怒批:真的不能用了!誰還要付費續訂?OpenAI 回應了 更多文章

資料來源:Which

更多文章
搭飛機帶西藥行李箱被鎖起來!他做錯1件事被海關攔下,出國帶藥一定要注意
爸媽注意!腸病毒仍在流行期 學齡前幼童要小心這幾型病毒
LINE Pay Money 12/3正式啟用!使用教學、轉帳提領、iPASS MONEY餘額提領免手續費銀行一次看
稅制優惠助攻燃油機車!電動機車11月掛牌數大減5成,SMAT急提3大建議
流感奪命最小僅5歲! 疾管署示警:疫情2周內會反撲上升
GoShare頭套真正用法曝!網震驚「騎了這麼多年都戴錯」 小編親回:賓果
價值3890萬美元的花錢消災 星巴克對紐約「可預測排班」法規滿腹苦水
不是台積電!「這台廠」成Google挑戰輝達關鍵大將 未來收益上看40億美元
日本連鎖超市必買「1甜點」!產地竟來自台灣,總經理證實:比日本版的更好吃
2025空氣清淨機推薦》ptt、Dcard實測、高CP值8款出爐!有效過濾空氣改善過敏,還能除甲醛、超安靜,養寵物更要看
自提退休金多1倍,台灣人卻怕「這狀況」?基金分紅4.3萬,帳戶金額一鍵查詢
手搖店開開倒倒!50嵐為何能屹立手搖市場?網點名最大優勢:能養客人
買東西注意了!無論網購、出國玩帶1物回台灣「重罰20萬起跳」,強制退運銷毀
用空氣清淨機1錯誤習慣!忽略「看不到的毒」恐長期暴露風險 專家曝90%人都用錯方式
不想中日關係鬧僵?日本工商團體、日中友好議員聯盟幹部與中國駐日大使會面
月薪上看9萬!台灣1行業超缺人「免大學學歷、二度就業也OK」,薪資賺贏上班族,還不怕被AI取代
0050回檔讓新手心癢!20歲繼承百萬想一次買進 資深股迷勸退喊「不是錢的問題」
議會總質詢議員關心人本交通 鍾東錦說通學步道一定要做
川普對委內瑞拉總統下達「最後通牒」!限時馬杜洛一週內下台離境,南美強人卻要求「給個免死金牌」
台南市1處社會住宅限時招租!每月租金6110元起,如何申請、資格限制一次看
借鏡香港大火釀成嚴重災害事件 鍾東錦要求全面查核高風險建築確保安全
未來7天天氣/有寒流要來?入夜大變天!「1地區」恐比北部更冷,低溫下探14度,最凍時間曝光
年薪破400萬!「10大熱門新職缺」排行榜與薪水一次看
分析川習暫緩美中角力管控情勢 國安局:中共持續對日施壓但避免失控
選購共助南投原鄉長輩巧手圓夢 「不老・原民」圓夢工坊6日埔里展成果
災後復建工程表現優異 南投縣獲勞動部「金安獎」地方機關組佳作
2025 Netflix陸劇推薦》不只《許我耀眼》、《難哄》!還有豆瓣9分「1神劇」,一追就上癮,完全停不下來
「我哭著賣掉輝達股票!」軟銀孫正義曝真實心聲:只為籌錢加碼投資這公司
彰化市南郭路一段100號公有房舍啟動再利用工程 打造藝文敘事新據點
中遊客赴日偽裝台灣護照!綠色封皮印上「TAIWAN」避排擠 網炸過嗆:只是自取其辱
見證台中創意實力 「2024創意台中」獲德國紅點及金點雙項國際設計獎
隊部閒置空地成綠意農場 大肚清潔隊攜手社區傳遞健康與愛心
方向燈要閃幾下才能轉彎?交通部揭正解「違者開罰6000元」,很多人開車多年仍做錯
諾貝爾和平獎得主的兒時夢,是開一間美容院....穆拉德在中研院揭開ISIS性奴過往:逃離煉獄之後,我的靈魂還留在那裡
川普舉行閉門高層會議 目標對委內瑞拉持續施壓
彰雲苗民眾到台中消費買氣爆棚 台中購物節39天破200億
普立茲克獎建築大師作「台中綠美圖」 12/13盛大開幕
「市場惡化原因在日本」 專家揭高市一套「組合拳」把日債打進惡性循環
愛河​、駁二都輸了!高雄最強景點冠軍是「它」,交通方便美景驚艷、值得一來再來
季凡觀點:川普叫東京把關於臺灣的議題音量調小?
台灣1知名景點被轟「最糞景點」:狂塞車、扒手多, 內行卻力挺:A+等級,隱藏玩法大公開
左轉車道打右方向燈「慘被開罰1200元」!駕駛1原因成功逆轉,罰單直接撤銷免繳
Netflix App手機端「這一常用工具」遭下架 唯獨這一早期裝置不受影響
韓版亞馬遜大地震,恐吞1兆韓元天價罰單!酷澎驚爆韓國最重大個資外洩,內鬼竟是中國前員工
德州檢察官卯上中國快時尚品牌Shein 媒體質疑「選舉辦案」
感冒不吃藥也能舒緩!藥師公開40元自製暖飲 3步驟鼻塞、喉痛、久咳一次改善
2026教召名單曝光!網友一查結果「跟別人不一樣」後備指揮部回應:可能是第一批
清潔隊員因32元電鍋被控貪汙!法院4理由大幅減刑至3個月 區隊強調:不影響工作權益
別以為買老房子很省!1稅金超多人不知道要申報,最高多被罰1.5萬
行政院卓院長肯定!台中購物節獲國家級榮耀