圖文
AlphaGo采用了一種新穎的機器學習技術(shù),結(jié)合了監(jiān)督學習和強化學習的優(yōu)勢。通過訓練形成一個策略網(wǎng)絡,將棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成一個概率分布。
落子 Alph... alph...
來源:科普信息化建設1 2017-05-25 10:53:18