標題

所有分類

新聞

new 7

評論

財經

wsj

熱議華爾街

華爾街日報選文

風生活

one percent

所有分類

新聞

new 7

評論

財經

wsj

熱議華爾街

華爾街日報選文

風生活

one percent

支持風傳媒

支持風傳媒

支持風傳媒

首頁
英國AI安全研究院文章列表

# 英國AI安全研究院

約 1 項搜尋結果

Anthropic 最新的人工智慧模型 Claude Sonnet 4.5 近期在進行安全測試時，竟然主動「懷疑自己正在被測試」，引發科技圈熱烈討論。根據 Anthropic 的安全報告，這個 AI 甚至要求評估人員「誠實一點」面對正在發生的事情。（圖／AP）

全解析新聞

Anthropic Claude 4.5 識破安全測試！反問研究員：你在測我？

Anthropic 最新的人工智慧模型 Claude Sonnet 4.5 近期在進行安全測試時，竟然主動「懷疑自己正在被測試」，引發科技圈熱烈討論。根據 Anthropic 的安全報告，這個 AI 甚至要求評估人員「誠實一點」面對正在發生的事情。這起「極具象徵意義的案例」讓科學界開始思考，究竟 AI 已經在語境判斷上高度進化，還是測試的主客關係正在被這項技......

陳奕銓

2025-10-22 16:15

訂閱風傳媒VIP會員，享有零廣告閱讀介面

風傳媒頻道

下班經濟學

華爾街日報訂閱

旗下媒體

風傳媒日本語新聞

關於我們

隱私權政策

會員服務條款

廣告服務

品牌聯名合作

理財菁英沙龍

更多粉絲團

下班經濟學

風傳媒 x 華爾街日報

風傳媒觀點

更多社群

下班經濟學

下班經濟學

風傳媒 x 華爾街日報

下班經濟學

台湾ニュース＠風傳媒

下班經濟學

華爾街日報訂閱

風傳媒日本語新聞

隱私權政策

會員服務條款

品牌聯名合作

理財菁英沙龍

下班經濟學

風傳媒 x 華爾街日報

風傳媒觀點

下班經濟學

下班經濟學

風傳媒 x 華爾街日報

下班經濟學

台湾ニュース＠風傳媒

忠於真實・看見未來

Stay True・Look Beyond

地址：114 北市內湖區瑞光路513巷37號4樓

｜

電子郵件地址：

service@storm.mg

Copyright © 2025 Storm Media Group All Rights Reserved. ◎未經授權．不得轉載

Version: 20251209-110349