AlphaGo與AlphaZero原理和未來應用研究

摘要:人工智能長期以來的目標就是創造機器的完全主導領域,在人類生活中發揮作用。AlphaGo成為首個在圍棋中戰勝人類世界冠軍的系統。AlphaGo神經網絡使用人類的棋盤數據進行學習訓練,同時也通過自我對弈進行強化學習。圍棋對于人工智能來說是最具有挑戰性的經典博弈比賽,它的巨大的搜索空間,棋局和落子地點讓機器學習難以應對。科學家創造了一種新的人工智能程序系統AlphaGo,使用估值網絡來評估局勢以及使用策略網絡來選擇如何落子。這些深度神經網絡被一種新的組合來訓練:使用了人類專業比賽數據的監督學習,以及自我對弈的強化學習。AlphaZero沒有使用任何預測搜索的方法,神經網絡搭配最先進的蒙特卡洛樹搜索算法讓程序達到了更加精確和智能的水準,這程序模擬了數以千計的自我對弈的隨機博弈。Alpha系列達到了99.8%的勝率,這是史上第一次計算機程序在全尺寸圍棋中擊敗人類職業棋手。通過對AlphaGo和AlphaZero原理學習,我們可以在掌握現有先進技術的基礎上,開拓創新,思考類似的人工智能在醫學,軍事等領域的未來應用可能性。

關鍵詞:
  • alphago  
  • alphazero  
  • 策略網絡與決策網絡  
  • 蒙特卡洛樹搜索  
作者:
陳銘禹
單位:
杭州師范大學附屬中學; 浙江杭州310030
刊名:
通訊世界

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

期刊名稱:通訊世界

通訊世界雜志緊跟學術前沿,緊貼讀者,國內刊號為:11-3850/TN。堅持指導性與實用性相結合的原則,創辦于1994年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 麻豆视频免费观看| 特级毛片www| a级毛片在线免费| 亚洲av本道一区二区三区四区| 国产一区精品视频| 国自产精品手机在线观看视频| 日韩人妻一区二区三区免费| 痴汉の电梯在线播放| 黄色一级大片儿| 99精品视频在线观看免费播放 | 在线观看亚洲一区| 无翼乌全彩本子lovelive摄影| 波多野结衣被绝伦强在线观看| 一级特黄aaa大片| 久草网在线视频| 亚洲精品无码专区在线| 四虎影院一级片| 国产手机在线αⅴ片无码观看| 大炕上各取所需| 成人精品一区二区三区电影| 曰韩无码二三区中文字幕| 污污成人一区二区三区四区| 美女又黄又免费的视频| 香蕉视频在线观看www| 4四虎44虎www在线影院麻豆| zooslook欧美另类dogs| 久久99精品久久久久久久久久| 亚洲人jizz| 亚洲国产精品福利片在线观看| 伊人久久大香线蕉av色婷婷色| 国产ts人妖系列视频网站| 国产成人无码av在线播放不卡| 国产精品成人va在线播放| 在线观看www日本免费网站| 好男人在线社区www| 成人免费一级片| 成人毛片在线观看| 成年免费a级毛片| 成人欧美一区二区三区小说| 日本伊人色综合网| 日本免费的一级v一片|