為了通過安全審核,AI會「裝笨」!變強之後,它就有可能背叛人類

2023-09-24 09:10
AI變強之後,有可能背叛人類。(圖/美聯社)
AI變強之後,有可能背叛人類。(圖/美聯社)

有了趨同工具價值概念的幫助,我們可以看出下文這個關於「如何確保超智慧安全無虞」的想法,會有什麼瑕疵:我們是在一個超人工智慧受到控制的環境中(即所謂的「沙盒」)觀察它的行為,而且只會在它表現得友善、肯合作、肯負責的情況下,才把它放出盒子;且在這個過程中,會憑著經驗來確認它是否安全無虞。

這個想法的瑕疵在於,「在沙盒中表現得體」是友善人工智慧和不友善人工智慧共通的趨同工具目標。一個智慧充足的不友善人工智慧會察覺,如果它一開始就表現出友好的態度而被放出沙盒,它的終極目標才有可能實現。等到我們就算發現也沒差的時候—也就是說,當人工智慧已經夠強大,人類的反抗已經無效時—它才會開始展現它不友善的本質。

再來想像另外一種方法。這個方法的手段是讓種子人工智慧接受多種智力測驗,或是讓種子人工智慧向程式設計者報告進度,來拘束智慧增加的速度。到了某個時間點,不友善的人工智慧可能會聰明到發現自己最好隱瞞能力增長的狀況,它可能會少報一些進度,或是故意在測試中不及格,避免自己在強到取得關鍵策略優勢之前就觸發了警報。程式設計者也許會偷偷監視人工智慧的原始碼和心智內在運作,來防範這種可能;但一個夠聰明的人工智慧會發現自己被監視,而依此調整自己的思考。人工智慧可能會找到十分微妙的方法來隱藏自己真正的能力和犯罪意圖(策劃聰明的逃脫計劃也會是眾多友善人工智慧的趨同策略,尤其當它們成熟到對自己的判斷和能力有信心之後。一個能促進人類利益的系統倘若允許我們關掉它,或是允許我們建造另一個不友善的人工智慧,就等同於犯下錯誤)。

因此,我們可以注意到一個普遍的失敗模式:系統在幼年階段的良好行為軌跡紀錄,完全無法用來預測它達到更成熟階段時的行為。可能會有人認為這個推論過於明顯,因此不會有任何一個發展中的人工整體智慧計劃會忽略這種狀況,但我們可別信以為真。

再想想接下來的這個情況。在未來幾年和幾十年中,人工智慧系統逐漸變得更有能力,在現實世界中的應用也大幅增加:它們可以用來運作列車、汽車、工業或家用機器人,此外還有自動軍事載具。我們可以假設它所具備的自動化能力多半有我們想要的效益,但其成功卻不時被偶發事故打斷—一輛無人卡車撞進前面的車潮、一台軍事無人機對無辜百姓開火⋯⋯而調查則揭露這些事故的肇因都出於人工智慧控制系統的錯誤判斷。公開辯論接踵而至,有些人呼籲採取更嚴密的監督和規範,也有人強調應研究並設計出更精良的系統—更聰明且更有常識的系統,比較不會發生悲劇性的錯誤。在一片喧鬧聲中,或許也會有末日論者的呼喊,預測各種疾病和即將到來的大災難。然而,可想而知,這項發展絕大部分掌握在人工智慧和機器人工業中,因此開發會持續進行,並有新的進展。車輛自動導航系統變得愈聰明,車禍就會愈少發生;軍事機器人瞄準得愈精準,多餘的損害就會減少。從這些真實世界的結果觀測中,人類得出一個概略的教訓:人工智慧愈聰明就愈安全。 (相關報導: 訓練AI模型,用電量能為家庭供電41年!AI的矛盾:幫公司節能,自己本身卻很耗能 更多文章

這是根據科學、大數據和統計而得來的教訓,而非紙上談兵。基於這個背景,某些研究團體的機器智慧開發工作開始出現希望的徵兆。研究者小心翼翼地在沙盒環境中測試種子人工智慧,一切徵兆都很不錯。人工智慧的行為激發了研究者的信心—隨著智慧逐漸增加,眾人的信心也跟著增加。

因為你,我們得以前進,你的支持是我們的動力
更多文章
「竹風好市」聚集13家竹市必買農特產 各攤好味亮點看過來(二)
台灣民意基金會民調》進口蛋爭議民進黨支持度重挫6.5個百分點 國民黨奪回第二大黨
2023屏東新景點推薦》13個三天兩夜必去景點、必吃美食大公開!不想人擠人照著完就對了
博愛座之亂不止!李昂悄悄刪除女乘客照片…網紅「個人意見」再爆坐博愛座被老人巴頭
氣象預報》中秋連假恐有颱風攪局,2地區防雨彈!未來一周天氣曝光
快訊》屏東大廠爆炸「大火已撲滅」!今早發現2屍體「屍身焦黑、面目難認」增至9死
中國浮現不學英文聲浪 華為創辦人任正非:將來在這個世界怎麼就業啊?
2023日本旅遊禁忌》走路邊走邊吃、筷子平放在碗上! 11個赴日千萬別做的失禮行為別踩雷
去日本只記得買藥品、點心?日幣持續低迷讓iPhone 15世界第2便宜,但有1大缺點
幕後》柯文哲為何非得二度訪美?10月後處理關鍵的3件事
白髮越來越多不是因為變老!醫師教4招抗老養生方法,多吃6種食物讓黑髮長回來
幕後》連民進黨都打聽「阿滿姨」 高虹安政商網絡「林美滿事業體」背後還有狠角色
合作國民黨恐白白送死?黃士修招手柯文哲:郭台銘有民眾黨缺的那一塊
許劍虹觀點:紀念九二四空戰65周年─扭轉中華民國空軍地位的空戰
史景遷專文:天安門─墨寫的謊說,掩不住血寫的事實
弘安觀點:台灣淡水河取水暨祭拜保衛湘軍英烈啟示錄
謝錦芳專欄:頭痛醫頭腳痛醫腳,能解決缺蛋危機?
楊岡儒觀點:台灣的檢察官讓我心寒
孔令信觀點:網紅錫蘭槓上台媒,假新聞之爭損及媒體聲譽
許詠翔觀點:政府懂產業升級?台灣缺乏的小政府主義思維
觀點投書:欲哭無淚誰來弔民伐罪
觀點投書:快速反應連與中華民國憲兵越南史
唐諾專文:每個人都死了,而故事流傳下來─《白鯨記》.梅爾維爾(2)
觀點投書:世說新語之民調篇
觀點投書:江派勢力遭夾擊─制約習近平力量的削弱
觀點投書:賴清德?民進黨?
屏東明揚廠房爆炸7死3失聯 殉職消防員遺體均尋獲
Lin bay好油緊追進口蛋卻遭恐嚇 管中閔怒批:是誰縱容這些雜碎
屏東爆炸工廠爆勞權爭議 他嘆:勞動部替經濟部擦屁股,縣府到處道歉
塗裝阿帕契首曝光!湖口營區明開放參觀 展演時程、接駁站點一次掌握
《Come兔Together好玩卡》限量開放預購 中秋暢遊北桃最推薦
打破紀錄 雲林縣政府首次同時榮獲2座交通部112年金路獎績優肯定
雲林地方聾人文化特展 張麗善邀全國民眾走進聾人的視界
北市觀傳局攜百家業者簽署永續綠旅宣言 共創友善旅遊環境
屏東加工出口區火警現場還原「未射水就爆炸」 周春米:全力救災 成立聯合善後平台
廢液晶玻璃變身多孔吸附材料 環管署邀集業者觀摩
世界客家研討會登場 用學術研究重建客家人的新視野
桃市府率先發起「屏東大火救助專案」 號召捐助消防員與受災戶
屏東爆炸事故 元大人壽提供保戶慰問金:身故10萬、受傷最高5萬
桃園鐵玫瑰熱音賞校園組決賽 發掘培育更多優秀樂壇新秀
桃市府「靜桃計畫」稽查逾千件 張善政:從源頭杜絕噪音車輛、還靜於民
桃園國慶月主視覺公布 6組在地青年設計團隊展現多元創意
桃市社區關懷據點成長至388處 112年成果展呈現各據點多元特色
桃園區最大旗艦共融式公園動土 張善政:打造親子宜居城市
張善政表揚112年早期療育優良人員 呼籲民眾關注早期療育重要性
「2023桃園科技藝術節」登場 17組國內外多媒體藝術家共同展出
第七屆We愛兩岸青年短片大賽頒獎典禮上海登場 兩岸青年導演匯聚一堂
參加減重特訓班,卻意外失去味覺!國片《大餓》道出世人荒謬的審美觀,故事結局令人心碎
台中國際機場航線再增一航線 「南京-台中」疫後首航23日抵達
公私合作滿足閱讀需求 北屯溪東首座圖書館開工