連輸3場後,李世乭如何贏AlphaGo一次?解密關鍵第78手:人類對決AI的唯一勝利

2023-01-21 11:00

? 人氣

連輸3場後,李世乭如何贏AlphaGo一次?(示意圖/顏麟宇攝)

連輸3場後,李世乭如何贏AlphaGo一次?(示意圖/顏麟宇攝)

「他主持 AlphaGo 就像奧本海默主持曼哈頓計畫一樣。」

谷歌收購深度心智幾週後,哈薩比斯與其他幾位深度心智研究人員搭機來到北加州,與他們母公司的領袖舉行會議,並向他們展示深度學習如何破解「打磚塊」。會議結束後,他們自然而然地分散成好幾小群,哈薩比斯發現自己和布林聊了起來。他們聊著聊著發現有一共同的興趣:圍棋。布林表示當初他和佩吉在史丹佛建立谷歌時,他沉迷在圍棋中,害得佩吉擔心他們根本無法成立公司。哈薩比斯表示,如果他和他的團隊想要的話,他們能夠建造一套系統來打敗世界冠軍。「我覺得這是不可能的。」布林說道。就在這一刻,哈薩比斯下定決心要做到。

[啟動LINE推播] 每日重大新聞通知

辛頓將哈薩比斯比作羅伯.奧本海默(Robert Oppenheimer),二戰期間做出第一顆原子彈的曼哈頓計畫主持人。奧本海默是世界級的物理學家:他懂得眼前重大任務的科學原理,不過他更深諳激勵之道,他結合手下不斷擴大的科學家,將他們的力量合而為一,並且接納他們的弱點,一起為計畫目標努力。他知道如何感動男人(以及女人,包括辛頓的堂姊瓊安.辛頓)。辛頓在哈薩比斯身上看到同樣的特質。「他主持 AlphaGo 就像奧本海默主持曼哈頓計畫,如果是別人來主持,他們可能就不會這麼快成功。」辛頓說。

深度心智的研究員大衛.席瓦爾早在劍橋時代就認識哈薩比斯,另一位研究員黃士傑其實早就開始在從事一項圍棋計畫,他們與蘇茨克維以及谷歌的一位實習生克里斯.麥迪生(Chris Maddison)一拍即合,後者也已在北加州展開他們自己的研究計畫。這 4 人在 2014 年中曾發表一篇關於他們初期研究的論文,之後他們的研究規模大為擴大,並在第二年擊敗歐洲圍棋冠軍樊麾。此一結果震驚了全球圍棋界與人工智慧研究圈,但是 AlphaGo 對戰李世乭所造成的聲勢更是轟動。IBM 的深藍超級電腦 1997 年在曼哈頓西城的一棟高樓裡擊敗世界頂尖的西洋棋高手加里.卡斯帕洛夫,為電腦科學建立了一座里程碑,受到全球新聞界的廣為報導。但是若是與首爾的這場人機大戰相比,卻是小巫見大巫。在韓國─更別提日本與中國─圍棋是民族性的消遣活動。有超過二億人會觀看 AlphaGo 與李世乭的對弈,觀眾比超級盃多上一倍。

在總共五局對戰前夕的記者會上,李世乭誇口他能輕鬆獲勝:四比一或五比零。大部分的圍棋棋手也都有同感。雖然 AlphaGo 徹底擊敗樊麾,顯示這部機器是真正的贏家,但是樊麾的棋力遠不及李世乭。根據用來評估遊戲對戰能力的 ELO 等級制度,李世乭完全是在不同的等級。但是哈薩比斯卻認為這場人機大戰會有截然不同的結果。第二天下午,在展開第一局對戰的兩小時前,他與幾名記者共進午餐,他拿著一份《韓國先驅報》(Korea Herald),這是用桃色紙張印刷的韓國英文日報。他和李世乭的照片都出現在報紙的頭版上半部。他沒有想到竟會受到如此重視。「我知道會受到關注,」這位像孩子般矮小,39 歲但已禿頂的英國人說道,「但是沒有想到會這麼多。」不過,在吃著餃子、韓式泡菜與烤肉─他並沒有吃烤肉─的午餐時,哈薩比斯表示他對這場棋賽「審慎樂觀」。他解釋,那些名嘴並不知道 AlphaGo 在十月的棋賽後仍在繼續苦練棋藝。他和他的團隊初始是將三千萬步棋路輸入深度神經網路來教導機器學習圍棋。自此之後,AlphaGo 就開始不斷與自己對弈,並且記錄哪些棋路是成功的,哪些又是失敗的─其運作與實驗室用來破解雅達利老遊戲的系統類似。自擊敗樊麾以來這幾個月,AlphaGo 已和自己對弈了數百萬局。AlphaGo 持續自學圍棋,學習速度之快遠超過所有人類。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章