圖文
AlphaGo采用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網絡,將棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成一個概率分布。
落子 Alph... alph...
來源:科普信息化建設1 2017-05-25 10:53:18