不管你是否準(zhǔn)備好,人工智能正以秋風(fēng)掃落葉之勢向人類發(fā)起各項(xiàng)挑戰(zhàn)。
2017年年初,人工智能“Master”用連勝60局的戰(zhàn)績橫掃了世界圍棋界各路頂尖高手,一周時間的最后,Alpha Go(阿爾法狗)脫下“Master”的馬甲,宣布暫時閉關(guān)。他的最后一個對手、世界冠軍古力留下兩個字:絕望。
在棋壇一騎絕塵之后,網(wǎng)友們依然不服輸:有本事就來跟我打麻將。而人工智能真的來了,雖然挑戰(zhàn)的項(xiàng)目不是麻將,而是和麻將有相通之處的德州撲克。
人工智能轉(zhuǎn)戰(zhàn)德州撲克
首次戰(zhàn)勝人類職業(yè)玩家
近日,加拿大和捷克幾位科學(xué)家的一篇題為《DeepStack:無限注德?lián)涞膶I(yè)級人工智能玩家》的論文中,介紹了一種能在一對一無限注(任何人在任何時候可下任何數(shù)目籌碼)德州撲克中擊敗人類玩家的新算法DeepStack。
該團(tuán)隊(duì)邀請了來自17個國家的33名專業(yè)撲克選手挑戰(zhàn)DeepStack,進(jìn)行了44852次較量。DeepStack成為了首個在一對一無限注德?lián)渲袘?zhàn)勝人類玩家的人工智能,并且平均勝率達(dá)到了492mbb/g(一般人類玩家到50 mbb/g就被認(rèn)為擁有較大優(yōu)勢,750mbb/g 就是對手每局都棄牌的贏率)。
圍棋被攻陷后,為何是德州撲克來承載人類應(yīng)戰(zhàn)的責(zé)任?
圍棋對弈,雙方的棋子都盡顯在一方棋盤中,也就是“完整信息游戲”。阿爾法狗的勝利,實(shí)質(zhì)上就是揭開了圍棋玄而又玄的神秘面紗,證實(shí)了其計算的本質(zhì)。
而德州撲克則是“非完整信息游戲”,信息不完全透明,玩家只看得到自己手中的牌,無法得知對手的牌,并在博弈過程中包含了欺騙、推測。簡單來說,這是一個“人心不可測”的游戲。
你不僅要思考別人要做什么,思考自己做什么,甚至要思考別人會認(rèn)為你做什么,進(jìn)而推理出自己的下一步。這些爾虞我詐的戰(zhàn)術(shù)更像是兵法。
在這篇論文中,多次出現(xiàn)一個詞:“直覺”,也就是我們常說的“牌感”。DeepStack注重培養(yǎng)人工智能出牌時的“直覺”。在運(yùn)用深度學(xué)習(xí),反復(fù)自我博弈之后,DeepStack學(xué)會了在每一個具體情境出現(xiàn)時進(jìn)行推理。
這非常接近人類玩家的“牌感”,即在當(dāng)前情境下對個人牌面大小的感覺,并作出相應(yīng)的決策。
那么,這次勝利能夠說明人工智能已經(jīng)擁有了人類的直覺和推理能力嗎,能說人工智能已經(jīng)讀懂人心了嗎?
德州撲克資深玩家:
震驚但表示懷疑
人工智能在德州撲克上戰(zhàn)勝人類的消息一出,幾位資深德州撲克玩家在震驚之余,也表示了懷疑。
曾在一檔德州撲克的電視真人秀節(jié)目中獲得冠軍的教小瘦認(rèn)為:“圍棋、國際象棋等游戲理論上是個純技術(shù)類游戲,因?yàn)闄C(jī)器在計算和統(tǒng)計上有著絕對的優(yōu)勢,所以在這個領(lǐng)域人工智能戰(zhàn)勝人類是完全沒問題的。但是德州撲克短期的對局中運(yùn)氣因素十分重要。除了運(yùn)氣之外,人類還存在著‘詐牌’這種獨(dú)有的欺騙性的打法,而這種打法是人類才會具備的技巧,是一種情緒的反應(yīng),這一點(diǎn)人工智能是無法具備的。”
不過對于人工智能是否能夠真的在德州撲克上戰(zhàn)勝人類,教小瘦表示在超過一定手牌數(shù)的時候,人類就完全不是對手了。
“我們?nèi)祟愅耆坑洃浻涗泴κ诌壿嬎季S順序,還有打牌的模式套路,而人工智能會直接存檔,把你每一手牌的牌和過程全部記錄下來,客觀上這一點(diǎn)人類就比較難做到。所以在一個較長手牌數(shù)的對局中,運(yùn)氣成分概率上被稀釋,人工智能對于人類對撲克理解的數(shù)據(jù)收集后,人類就完全無法對抗了。”
另一位長年混跡德州圈的“莫小胖”同樣也對人工智能所謂的“牌感”表示懷疑。他認(rèn)為機(jī)器在“感”這個字上不可能達(dá)到人的境界,就算能贏也只是基于它強(qiáng)大的數(shù)據(jù)收集和計算能力上,在加上人會受到外界因素的干擾,會不可避免地出現(xiàn)失誤。
莫小胖認(rèn)為,在打德州撲克的過程中需要不斷地對于場面變化進(jìn)行判斷和應(yīng)對,這其中摻雜了情緒、心理、氣勢等一系列主觀因素,人工智能的牌感是它對于比賽信息收集之后的一個數(shù)據(jù)化的結(jié)果。如果論文中所說的“牌感”真實(shí)存在,那么這個人工智能確實(shí)可以說是真的在這個領(lǐng)域打敗人類了。
浙江大學(xué)人工智能研究所所長:
DeepStack仍然是基于大數(shù)據(jù)
DeepStack戰(zhàn)勝人類職業(yè)玩家的消息登上各大媒體,浙江大學(xué)人工智能研究所所長、教授吳飛也第一時間下載了這篇論文。
“這次勝利肯定不是基于對對手表情心理的解讀和推理,本質(zhì)上還是基于大數(shù)據(jù)的學(xué)習(xí)與訓(xùn)練,是基于人類給它的一個樣本,并不能說它已經(jīng)具備了推理能力。”
李開復(fù)老師也是一位德州撲克玩家。他在知乎上關(guān)于“德州撲克有哪些技巧、經(jīng)驗(yàn)或者原則”的回答排名第一:“很多人認(rèn)為德州撲克要學(xué)好詐唬(高手慣用技巧)和讀懂對方,但就算想成為詐唬專家,也要先學(xué)好統(tǒng)計。”。
但就像對于戰(zhàn)勝國際象棋高手的超級計算機(jī)“深藍(lán)”、戰(zhàn)勝圍棋高手的阿爾法狗是一種飛躍一樣,戰(zhàn)勝德州撲克職業(yè)玩家的DeepStack也是一種飛躍。“它的研究方向肯定是對的,人工智能的目標(biāo)就是人類的直覺。”
愛因斯坦曾說過,人類真正有價值的東西就是直覺。吳飛教授解釋道:“直覺能夠產(chǎn)生創(chuàng)造力,而創(chuàng)造力是一種跳躍式思維,牛頓能從蘋果掉下來聯(lián)想到萬有引力。”
從一件事情想到另一件事情,這是一個離散空間的思維跳躍,是人工智能在連續(xù)空間中無法推理出來的。你能用一個數(shù)學(xué)公式來證明出牛頓是如何想出萬有引力的嗎?并不能。
而吳飛教授也明確表示人工智能是無法解決這一問題的。“因?yàn)槿祟愖约憾紵o法提供一個知識庫和常識規(guī)則來解釋。鳥會飛,鴕鳥是鳥,但由此推理出來的‘鴕鳥會飛’卻是錯的。”
正是因?yàn)橹R的不確定性,人類自己都無法窮盡推理的無窮可能,又如何能為人工智能提供一個數(shù)據(jù)庫來讓其學(xué)習(xí)呢?
所以,人工智能讀懂人心?不可能。
不管你有沒有準(zhǔn)備好
人工智能的戰(zhàn)書不會停止
其實(shí)在這篇論文幾天前,美國卡內(nèi)基梅隆大學(xué)已經(jīng)發(fā)出預(yù)告:該校教授領(lǐng)導(dǎo)研發(fā)出的Libratus人工智能系統(tǒng),將于當(dāng)?shù)貢r間1月11日,在賓夕法尼亞州匹茲堡的 Rivers 賭場,與四個頂級職業(yè)玩家玩12萬手的HUNL,并角逐20萬美元的獎金。
與DeepStack沒有公開對戰(zhàn)現(xiàn)場不同,卡內(nèi)基梅隆大學(xué)走的是當(dāng)年阿爾法狗的路線,在華麗的賭場搞一場秀,與人類頂尖玩家對戰(zhàn),還有20萬美金的噱頭。
不論這次公開的“秀”是否會讓人類再次“顏面掃地”,可以肯定的是,人工智能向人類下的戰(zhàn)書只會越來越多。
過去的20年間,我們見證了人類的不斷敗北,比如西洋雙陸棋、跳棋、國際象棋、Jeopardy 、Atari 電子游戲和圍棋。德州撲克之后,人工智能又會盯住什么呢?(記者 宗倩倩 張峰)
人工智能真能讀懂人心?專家:仍然是基于大數(shù)據(jù)
圖文簡介
在棋壇一騎絕塵之后,網(wǎng)友們依然不服輸:有本事就來跟我打麻將。而人工智能真的來了,雖然挑戰(zhàn)的項(xiàng)目不是麻將,而是和麻將有相通之處的德州撲克。
- 來源: 科普信息化建設(shè)2
- 上傳時間:2017-01-15