人類從此成為多餘！最新一代「AlphaGo」40天自主學習打遍天下無敵手-風傳媒

近年人工智慧代表作「阿爾法圍棋」在多場舉世矚目的「人機大戰」之後登上圍棋界聖母峰，但更可怕的是，它持續以自主學習的方式自我超越，最新版本「阿爾法圍棋─零」顧名思義「從零開始」學習圍棋，只用40天時間就擊敗所有前輩版本（人類已經沒有挑戰資格），成為新一代圍旗王者。

[啟動LINE推播] 每日重大新聞通知

對此，世界排名第一的中國棋士、前一代阿爾法圍棋（AlphaGo）手下敗將柯潔在微博上表示：「一個純淨、純粹自我學習的AlphaGo是最強的...對於AlphaGo的自我進步來講...人類太多餘了。」

人工智慧軟體AlphaGo與中國棋王柯潔3盤對戰，AlphaGo大獲全勝（AP）

研發「阿爾法圍棋」的英國「深度思維」（DeepMind）公司在最新一期英國《自然》（Nature）期刊上發表論文〈不需要人類知識條件也能掌握圍棋遊戲〉（Mastering the game of Go without human knowledge），介紹最新版的「阿爾法圍棋─零」（AlphaGo Zero ）。

DeepMind將「AlphaGo」的發展分為4個階段：第一個版本是「阿爾法圍棋─樊」（AlphaGo Fan），在2015年戰勝華裔歐洲圍棋冠軍樊麾，是人工智慧首次擊敗人類職業棋士；第二個版本是「阿爾法圍棋─李」（AlphaGo Lee），在2016年戰勝曾多次奪得世界冠軍的南韓棋士李世乭；第三個版本是「阿爾法圍棋─大師」（AlphaGo Master），在今年讓柯潔俯首稱臣，並在與多位擁有世界冠軍頭銜的人類棋士「群戰」中完勝。

AlphaGo對五位人類棋手的團體戰棋譜。

這3個版本在剛開始學習圍棋時，都要依靠人類知識，學習人類摸索出的基本下法，然後再開始自己學習。然而第4版也是最新版的「AlphaGo Zero」擺脫了「需要人類知識」這個學習限制，研究人員只為它輸入棋盤以及黑子與白子，接下來它就以「從零開始」（tabula rasa）的方式自主學習，自己與自己對弈，而且突飛猛進。

AlphaGo Zero的學習曲線（DeepMind）

開始學習圍棋3天之後，「AlphaGo Zero」就以「100勝0敗」的成績徹底擊潰「AlphaGo Lee」。21天之後，「AlphaGo Zero」棋力達到「AlphaGo Master」的水平。40天之後，沒有任何一個舊版的「AlphaGo」能夠戰勝「AlphaGo Zero」。

研究人員認為，從需要預先輸入人類知識，到能完全依靠自己摸索，「AlphaGo」的進步代表人工智慧的巨大突破，意味人工智慧不但可以進入對它來說本是一片空白的領域，而且能夠自主取得卓越成就，自行創造知識。

AlphaGo Zero的學習歷程（DeepMind）

而且前幾代「AlphaGo」使用2套神經網路（neural network），「AlphaGo Zero」只需1套。前幾代「AlphaGo」利用快速隨機的「走子」（rollout）來預測棋局，但「AlphaGo Zero」完全只靠自家優異的神經網路。

當然，「AlphaGo」的本領絕不只下圍棋。DeepMind執行長哈薩比斯（Demis Hassabis）預期，未來10年「AlphaGo」將以科學、醫學專家的身分與人類合作，從事新藥與新材料研發、破解基本粒子物理學謎團等任務，拓展科學與醫學的新天地。

人類從此成為多餘！最新一代「AlphaGo」40天自主學習打遍天下無敵手

AlphaGo當電影主角啦！《AlphaGo世紀對決》重現人機大戰經典全紀錄

一敗難求、金盆洗手！人機大戰全勝之後，AlphaGo宣布退役

人機大戰最終章》AlphaGo完勝棋王柯潔馬雲：AlphaGo剝奪下棋樂趣

人類慘遭滅團！五位世界圍棋冠軍聯手還是輸給AlphaGo

棋聖聶衛平看人機大戰：柯潔跟AlphaGo檔次不同柯潔：AlphaGo越來越像上帝

阿爾法圍棋催生者：AlphaGo技術將應用在更多領域

DeepMind正式聲明：對弈網路快棋，是為了檢驗最新版本AlphaGo

獨孤求敗的謎樣棋士究竟是誰？Master認了：我是AlphaGo