最新AI:無需被告知規(guī)則就能自己玩轉(zhuǎn)游戲?
2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領(lǐng)先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學(xué)會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。這些AI的共同特點是,它
原創(chuàng)
2020-12-25 08:00:24
來源:釘科技??

2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領(lǐng)先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學(xué)會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。

image.png

這些AI的共同特點是,它們必須掌握游戲規(guī)則然后再進(jìn)行培訓(xùn)。DeepMind的最新AI MuZero不需要游戲的規(guī)則即可掌握游戲。與DeepMind之前的AI算法一樣,MuZero具有相同甚至更好的能力。  

MuZero沒有嘗試對所有模型進(jìn)行建模,而只是嘗試考慮那些對決策至關(guān)重要的因素。正如DeepMind所指出的,這是作為人類所做的事情。當(dāng)大多數(shù)人看著窗外,看到地平線上形成烏云時,他們通常不會陷入烏云是如何形成之類的問題。相反,它們思考的是如果出門應(yīng)該穿什么以防止被淋濕。MuZero就是做類似這樣的事情。

MuZero在做決定時會考慮三件事。首先,它會考慮上一次行動的結(jié)果、當(dāng)前所處的位置以及下一次行動的最佳方案。這種看似簡單的方法使MuZero成為迄今為止DeepMind最有效的算法。在測試中DeepMind發(fā)現(xiàn),MuZero與之前的AI算法表現(xiàn)都一樣好。而且,給它的時間越多,它提供的解決方案就越好。即使加入了時間限制,比如在行動前限制吃豆人女士的模擬次數(shù),MuZero也取得了不錯的效果。

該公司表示,MuZero的學(xué)習(xí)能力有一天可以幫助解決沒有簡單規(guī)則領(lǐng)域的復(fù)雜問題。(釘科技根據(jù)《engadget》消息編譯)

原創(chuàng)文章
最新文章
1
1-2nm 水分子革命:華帝如何用技術(shù)重構(gòu)沐浴邏輯
2
2025年“灣區(qū)杯”網(wǎng)絡(luò)安全大賽啟航 面向全國開放報名 ——守護智慧安全未來城市
3
華潤入主康佳,半導(dǎo)體和消費電子起飛在即?
4
快手集中整治“虛假回收”類違規(guī)行為,保護用戶權(quán)益免遭損失
5
快手直播大舞臺遍地開花,打造現(xiàn)象級文旅新爆款
6
科技副總裁宋婷婷:數(shù)字技術(shù)賦能女性發(fā)展,繁榮生態(tài)綻放“她力量”
7
第三屆北京網(wǎng)絡(luò)視聽藝術(shù)大會成功舉辦,“新大眾文藝”主題研討引熱議
8
美的格力海爾都布局的廚房空調(diào),雞肋還是剛需?
9
電商行業(yè)破局重構(gòu),"618"大促展現(xiàn)六大新趨勢
10
5G-A時代,“大上行”的含金量還在上升
11
新型儲能海外訂單爆增400%,專家提示潛在風(fēng)險
12
蘋果Mac全家桶下半年登場:首發(fā)M5芯片
13
業(yè)界唯一!榮耀Magic V5免費送內(nèi)屏寶
14
618中國電視市場“量額”齊增,品質(zhì)提升成未來主旋律
15
關(guān)稅沖擊下 家電出口的短期承壓與長期破局
16
美越貿(mào)易協(xié)議落地,中國企業(yè)供應(yīng)鏈面臨重塑挑戰(zhàn)
17
vivo X Fold5亮點總結(jié):做蘋果最好搭子?
18
618智能手機市場:蘋果、小米、華為位列前三,價格戰(zhàn)致市場下行
19
鎖定暑期檔“上頭”時刻,快手內(nèi)容消費系列沖量指南來襲
20
第九屆平遙國際電影展產(chǎn)業(yè)板塊新設(shè)“快手聚光短劇計劃”
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512