谷歌人工智能獲得重大突破 MuZero算法無需告知規(guī)則自學成“棋”才
據最新一期《自然》雜志報道,DeepMind公司開發(fā)的一種人工智能(AI)算法MuZero,可以在不告知其游戲規(guī)則的情況下掌握圍棋、國際象棋、日本將棋和視頻游戲,這是谷歌人工智能部門獲得的又一重大突破。
DeepMind公司表示,研究人員多年來一直在尋找一種方法,既可以學習建立用于解釋當前環(huán)境的模型,也能夠利用這個模型來進行最好的決策。到目前為止,大多數方法都難以在Atari這種游戲中進行有效規(guī)劃。
MuZero最初在2019年推出,通過只關注環(huán)境中最重要的一個方面,來學習建立模型并解決問題。通過將這種方法與“阿爾法狗”強大的搜索樹技術相結合,MuZero的能力實現了重大飛躍。此外,MuZero還利用了前瞻搜索、基于模型的規(guī)劃來解決問題。
MuZero不會使用規(guī)則來找到最佳情況(因為事先不被告知),而是學習考慮游戲環(huán)境的各個方面,自己觀察它是否重要。在數百萬場比賽中,它不僅學習規(guī)則,而且學習位置的通用價值、成功的通用策略以及事后評估自己行為的方式。后一種功能可幫助其從自身的錯誤中學習、回憶和重做游戲,以嘗試各種不同方法來進一步優(yōu)化位置和策略價值。
MuZero不僅在國際象棋、圍棋和日本將棋上達到了與提供完善規(guī)則的“阿爾法狗”一樣的超人水平,在Atari游戲這樣的雜亂感知輸入環(huán)境中,也創(chuàng)造了新紀錄。研究人員將MuZero描述為“在追求通用算法方面邁出的重要一步”。
責任編輯:hnmd003
相關閱讀
-
黑龍江邊境發(fā)現野生東北虎腳印 專家鑒定為雌性東北幼虎足跡
黑龍江省虎林市邊防委護邊員、慶豐農場派出所民警于20日在邊境巡邏時,發(fā)現野生動物從俄方延伸至中方的...
2021-01-25 -
“中國天眼”運行穩(wěn)定可靠 “慧眼”能刺穿“光年之外”?
經歷了調試、試運行和正式開放運行后近6000個機時的觀測服務積累,目前中國天眼運行穩(wěn)定可靠,靈敏度穩(wěn)...
2021-01-22 -
信息通信業(yè)布局 網絡“下鄉(xiāng)” 彌合城鄉(xiāng)數字鴻溝
信息通信業(yè)持續(xù)向農村布局 網絡下鄉(xiāng)彌合城鄉(xiāng)數字鴻溝自2015年以來,信息通信行業(yè)扎實推進電信普遍服務...
2021-01-05