新華社北京1月11日電(記者彭茜)2017年新年開局,人工智能在與人類智慧對局上連下數(shù)城,先是升級版的“阿爾法圍棋”接連擊敗中韓等國頂尖高手,近日又橫空殺出名為“DeepStack”的人工智能新算法,在一對一無限注德州撲克中完美“碾壓”人類智商。

來自加拿大阿爾伯塔大學(xué)和捷克兩所高校的研究人員近日在阿奇夫論文預(yù)印本網(wǎng)站(arXiv)上提交論文,介紹其研發(fā)的新算法“DeepStack”首次在一對一無限注德州撲克中擊敗人類職業(yè)撲克玩家。

研究人員稱,這種人工智能算法是一種可用于撲克等不完整信息博弈的通用算法。在與33位來自國際撲克聯(lián)合會的職業(yè)撲克選手進(jìn)行的4.4萬手撲克比賽中,這種算法平均贏率超過450mbb/g。(mbb/g是衡量撲克玩家表現(xiàn)的指數(shù),一般50mbb/g就被認(rèn)為是較大的優(yōu)勢。)

德州撲克是人工智能的熱門挑戰(zhàn)領(lǐng)域。此前,被人工智能攻克的圍棋是一種完全信息公開的博弈,玩家可以看到棋盤上的棋子,并預(yù)測落子可能性;而德州撲克玩家手中的底牌是其它玩家看不到的,是不完整信息博弈,要求更復(fù)雜的推理能力,對人工智能更具挑戰(zhàn)。

一對一無限注德州撲克擁有超過10的160次方個決策點。研究人員稱,“DeepStack”在處理撲克中的信息不對稱性時用到了循環(huán)推理,并使用分解法將計算集中在相關(guān)決策上;它還運用深度學(xué)習(xí)技術(shù)從自我對戰(zhàn)中自動學(xué)習(xí)了一種關(guān)于任意牌的“直覺”。

這一研究成果無疑搶了卡耐基梅隆大學(xué)研究人員的風(fēng)頭。他們也設(shè)計了一場類似于“阿爾法圍棋”挑戰(zhàn)李世石的“人機對戰(zhàn)”,于當(dāng)?shù)貢r間11日在匹茲堡的賭場盛大啟幕。卡耐基梅隆大學(xué)的人工智能系統(tǒng)“Libratus”將在20天的時間內(nèi)與四位頂尖德州撲克選手玩12萬手一對一不限注的德州撲克,獎金高達(dá)20萬美元。據(jù)悉,“Libratus”與“DeepStack”采用了相似的計算方法。

不過,參與設(shè)計“Libratus”的卡耐基梅隆大學(xué)教授桑德霍爾姆在接受媒體采訪時就持有異議,他認(rèn)為“DeepStack”并未與最頂尖的人類選手比賽,所以暫時不能說是“超越”了人類。

 

更多精彩!歡迎關(guān)注“科普中國-科技前沿大師談”官方微信(kjqydst)。

本作品為“科普中國-科技前沿大師談”原創(chuàng),轉(zhuǎn)載時務(wù)請注明出處。

 

人工智能靠“直覺”戰(zhàn)勝撲克職業(yè)選手

圖文簡介

一對一無限注德州撲克擁有超過10的160次方個決策點。