圖1 韓國棋院授予AlphaGo名譽九段證書
1:4,人類負于機器。7天之中,人機對弈激戰五局,終于落下帷幕。
相比之前的四局,第五局顯得波瀾不驚。無論是演播室里的棋手,還是討論技術的專家,抑或屏幕前的觀眾都能以愉悅的心情觀賞比賽。
李世石九段在取得開局優勢后,顯得過于保守。雖然雙方各有失誤,但AlphaGo似乎有著更好的大局觀,終以微弱優勢勝出。賽后的新聞發布會上,李九段說自己感到遺憾,希望以后能給觀眾呈現更強的自己。事實上,他已經通過棋局,給世界呈現了超越勝負的意義(所謂偉大的棋手,即使是失敗,也能留給世界一些超越勝負的“遺產”)。比如,比賽剩余的獎金被捐贈給聯合國兒童基金會(UNICEF),STEM教育機構,以及圍棋慈善機構。
正如比賽解說邁克?雷蒙(九段)所言,AlphaGo團隊和李世石為圍棋界,乃至全世界送來了禮物。這場全新的圍棋比賽,不僅讓愛好圍棋的人們聚集到一起,而且讓全世界的人來關注這項運動,跨越障礙,彼此分享交流。
頒獎典禮上,韓國棋院的總裁樸治文也提到,他一開始驚訝于人工智能的表現,但在思考之后,他相信在未來人類社會中,人工智能可以為社會做出許多貢獻。事實也證明,由于這場比賽,歐洲和美國以及全世界有更多人的喜歡上了圍棋,圍棋也可以成為一項全球化的活動。東西方棋手之間的對決也會隨之到來。
不僅僅是西方人開始通過圍棋感受到東方文化的精髓,這項高水平的智力運動通過人工智能的解讀,也從此有了新的發現。“青少年可以有更好的圍棋訓練變得優秀,而國家也會隨之成為優秀的國家”。
那么這次比賽對我們來說又是個什么樣的禮物呢?請看專家點評。
張崢
上海紐約大學終身教授,紐約大學庫朗數學研究所兼職教授、CILVR實驗室成員,前微軟亞洲研究院副院長。
在戰前,我做過這么一個含金量為零的預測:AlphaGo必勝,只是不見得是這一次。隨后的一周,驚心動魄,也不斷被打臉。
隨著戰局的進展,各類科普文章不停涌現,其中不乏佳作。我來稍稍總結一下。“狗狗”是如何煉成的:先偷看3千萬棋譜,站在巨人肩膀,然后左右手互博漲棋力。“狗狗”下棋是一杯混雜的雞尾酒:花相對高的代價逐個敲開搜索圖譜,然后幾十條“狗狗”奪門而出,以勝率判斷為指南針,用蠻力一擊到底,閃電般地來回踩踏再凝聚一點——啪,落子。既復雜,也不復雜,它把工程和數學的結合達到了藝術品的高度;把高度的計算量壓縮到可以和人對局(甚至用時更少)。至少對我來說,它在尺度上的大騰挪不比引力波事件差。
然而它還是敗了一局。有個朋友笑說,這充分說明了狗咬人不是新聞,人咬狗才是。AlphaGo應對不正確的勝率估算嚴重滯后,休克期間昏招連連。很可能是勝率估算出了問題,導致“狗狗”們集體跑錯方向;但終極原因,還是因為站在不那么高的肩膀上。DeepMind的團隊說要清零,把棋譜扔掉,正本清源,重頭開始。這是昏招,更是偉業,希望他們成功!
自覺打臉最重的是,之前我對在棋局之外的人機交談本不報任何希望。但現在,我相信,“狗狗”和人類都互相學習了很多很多——棋界,學界,媒體,普羅大眾。表現最為出色的是棋界,不止李世石一人。以勝負說話,以棋藝為上,黑白之秤牢牢搞定方位,簡單,直接。至于學界和業界,我覺得應該先認清自己的站位:0 - 。為什么是“零減”?先留個伏筆,以后再慢慢道來。
朱文章
香港科技公司首席架構師、香港大學計算機博士、圍棋業余5段(弈城9段),前微軟及谷歌軟件工程師,iOS軟件“圍棋之眼”作者
第四盤比賽結束的時候,讓人類好像經歷外星人入侵,把人類英雄踩在腳下,然后血泊中的英雄,瞬間崩發出神之一手,反戈一擊成功。好萊塢的典型煽情故事。一瞬間,職業棋手都緩過來了,紛紛發賀電鄙視阿法哥。
但今天我想用輕松的心情細細品味最終一戰,立場是支持圍棋棋道,不論勝負,給雙方選手都加油。
李世石今天心態很放松,可以從開始的時間控制看出來,李世石的布局也相當簡明。到了40,黑棋空多無弱子。
但是我感覺,白棋像道策。看道策這盤,是不是幾分神似?
黑棋左邊31的靠,記得是吳清源大師提倡過的簡明手段。大道至簡,也許這是圍棋的最高境界。
阿法哥右下就讓人鄙視了。業余棋手都能看清的手段,硬是自己下死,花了代價學會了“大頭鬼”這個圍棋手段。我預感,如果阿法哥輸了,它會受到各方職業棋手的鄙視。“發力點根本不對啦,根本不會下棋”。
70手是阿法哥卓越的中腹感覺,黑棋下得有點保守,最后三目活。應該是心理出現波動,想贏怕輸。解說的麥克雷蒙這時冒出一句話:李世石估計在想,前三盤是怎么會輸給那么low的阿法哥啊。此時,局面已經很細微了,甚至白棋潛力巨大。
阿法哥下到第100手,第三局的大師風采又來了。黑棋得拼搏了。但是中間弱棋還沒治理,只能揮師左下。還好,阿法哥慈悲,放黑棋從二路爬回。轉而亮出136手的小阿飛刀。
還有一個看點,就是阿法哥今天也進入讀秒,但是發型沒亂。最終,如果要點目,是白勝2.5目,即1又1/4子。
整盤棋,李世石開局順利,但是沒有繃緊,下得過于放松。看來,人都是逼出來的。生于憂患 ,死于安樂。
順便總結下五盤棋。這五盤,基本上我都第一時間觀看。第一盤,李世石惜敗,本來有機會。第二盤,阿法哥下出很多好手,五路尖沖,還有中后盤碾壓式的計算能力,該它贏。第三盤,阿法哥玄妙莫測的棋風,酷似吳清源,前半盤50手就已經把李世石擊倒。但是后面有瑕疵,暴露了局部計算不能找到正解的弱點。第四盤,李世石心態好,布局策略正確,打散穩住,但中盤冒進轉換后落后,之后中腹在極度困難的情況下發出神之一手,阿法哥應對失誤,被人類KO。也是第一次看到阿法哥認輸的樣子。第五局,布局李世石簡明領先,布局策略對頭。中腹戰斗患得患失,最終失利。
這一次比賽,無論勝負,都是棋道的勝利。吳清源說過他200歲之后要在宇宙中下棋。冥冥之中,我覺得他真的來了。借此,致敬吳清源棋圣。
衛泓泰
知乎圍棋專欄主持人、圍棋業余5段
這五盤棋進行的時間是我不斷學習提高的過程,新事物的強烈沖擊果然是人學習的重要動力來源。
前四盤講完以后還有很多人問,棋牌上人工智能贏了不是很正常么,為什么要和舉重機比力氣和計算器比算數和人工智能比數據分析呢?
因為現在的計算機其實和人類一樣,并沒有辦法窮盡圍棋里復雜的變化。人學圍棋的方法是大量的積累棋譜庫和鍛煉計算力,比賽的時候根據經驗計算,在一定情緒氛圍內,用邏輯進行判斷之后做出決策。AlphaGo是什么樣呢,他的本質是大量的隨機落子,總結哪些勝率高,然后把局部特征總結出來備用最后與估值網絡的判斷結合分別評分之后落子。
本次比賽的看點之一是依靠勝率分析而沒有邏輯判斷的系統,和人的邏輯判斷為主的系統優劣如何。
五局比賽對于李九段來說,壓力顯然非比尋常。作為人類一方的代表,被關注的程度和比賽的意義或許超過了任何一次世界大賽。且不說激烈的關注程度,還有攝像頭無時無刻的追蹤拍攝,在這種情況下李世石九段頑強拼搏的斗志相信會被廣大棋迷銘記。
這次比賽完以后,很多棋手表示看到了圍棋更迷人的地方。而在圍棋技術上,AlphaGo帶來了更為廣闊清晰地思路,提供了更好的訓練方法和判斷參考。相信Google在圍棋上的探索只是小小一方面,這次比賽給人工智能賺足了眼球,期待Google之后的大招。
下面重點講講棋局,感覺這盤棋李九段已經基本回到正常狀態,最后一盤已經很放得開,十分精彩。AlphaGo經營全局的水平很高,像是打太極,從不起殺心,非常均衡。其看點在于控制與均衡。
之前的開局,Alphago喜歡使用一些古老的套路和自創的招法,這盤棋難得的使用了比較新的流行變化。第一次看到,覺得AlphaGo很有活力。
進行到這里是第一個分歧,如果“退”是平穩的下法,如果“點”或者“夾“擊則進入戰斗。
這里李九段稍作猶豫,馬上點入,這里是其典型風格。進行到下圖,黑棋右下實地很大,稍可滿意。
AlphaGo這步棋,利用右下氣緊,李九段反其道而行之,沖一個,非常有意思。實戰的結果來看,局部李九段獲利很大,這種局部計算AlphaGo還是有問題。不過從之后的運轉來看,損失卻有限。
初學的棋友要注意了,實戰AlphaGo被迫給大家演示了一下:被著名手筋大頭鬼吃掉是什么樣子。
最近幾盤AlphaGo總會走肩沖,李九段使出斗轉星移,以彼之道還施彼身。可惜被白棋反鎮一個,這局部最后落了下風。
進行到這里,黑棋上面只活了三目,所得甚少,相比之下右上白棋模樣有近五十目的潛力,白花花一片,這種控制全局的能力,還是AlphaGo強大。
托很有爭議,局后很多意見仍然傾向于走簡單的點三三。實戰結果一二路混合爬過,影響到了中央的厚薄,感覺并不好。
這盤進行到收官,AlphaGo又是大量如134送吃的棋,感覺很奇怪。
收官時最后的轉換,按照陳耀燁九段的說法,最后結果可能黑棋稍虧。之后黑棋官子稍有所得,但是微細的差距中AlphaGo最后沒有給李九段機會。
這一盤雙方都出錯了,相比之下,AlphaGo明顯的錯誤反而更多一些,很多時候我們都是這樣,贏了開心慶祝,總結勝招;輸了反躬自省,各種不對。對人的成長來說,勝利的甜頭固然重要,不過在大的趨勢面前,用長遠的視角去分析去看自己該站的位置更為重要。即使這次李世石九段贏了,總有一天我們會敗在不斷完善的算法上,對于圍棋界來說這一天可能來的比預想的早太多太多,但對于國際象棋等等棋類,十年前就在思考這樣的問題了。
勝固欣然,敗亦可喜。有些思考的價值始終超越于勝負之上,超越于變化本身,神經網絡幾十年前就有,到如今才初得大成。很多人喜歡簇擁在鮮花簇擁,富麗堂皇的場所之中追隨潮流和一個又一個熱點。越是這樣飛速發展,不斷變化的時代,越需要寧靜致遠,清晰冷靜的大局觀,不論是在棋盤上還是在人生中。