人類被 AI “毀滅”,一定是從教它玩《我的世界》開始的
上周,幾乎是前后腳,英偉達和國內幾家科研機構分別發布了兩份內容相似的論文。
首先是英偉達宣布開發出了一個全新的游戲 AI 智能體 "VOYAGER",將 AI 大模型 GPT-4 接入了《我的世界》(Minecraft)游戲。基于 GPT-4,VOYAGER 能夠在《我的世界》里擴充著自己的物品和裝備,完成諸如建造房屋、挖礦、收集仙人掌和狩獵等基本生存技能;也能獨立進行開放式探索,去到不同的城市和地點,甚至是自己搭建傳送門。
【資料圖】
接著就是商湯科技聯合清華大學、上海人工智能實驗室等機構發布了通才 AI 智能體 "Ghost in the Minecraft(GITM)"。
同樣是將大語言模型(LLM)整合進《我的世界》,GITM 在《我的世界》內主世界的所有技術挑戰上實現了 100% 的任務覆蓋率(成功通關解鎖了完整的科技樹),而此前所有智能體的總和只能覆蓋 30%;另外在 " 獲取鉆石 " 任務上,GITM 成功率達 67.5%,同樣相比于此前的最佳成績—— OpenAI 的 VPT 方法大幅提高了 47.5%。
GITM 在《我的世界》的任務覆蓋率遠高于現有 AI 智能體直白點說,他們都選擇了《我的世界》這款游戲來訓練 AI,并且 AI 都實現了真人玩家能夠完成的幾乎所有游戲任務,堪比是能以假亂真的效果(這放在幾個月前還是不可能的事)。
我們先拋開看起來艱澀的技術細節不談,為啥他們不約而同都迷上了拿《我的世界》做實驗?
《我的世界》就是個大型 AI 試驗場
要說起在《我的世界》里訓練過的 AI,那可就太多了。
著名的莫拉維克悖論是這么說的:一些任務對于人類而言很困難,例如下棋,但對 AI 來說很簡單;而像《我的世界》這樣開放世界中與環境交互、進行規劃和決策等對人類來說較為簡單的事情,對 AI 來說卻是巨大挑戰。
正因為這種情況的存在,在 AI 還不像現在這么發達的早幾年,科學家們最初只是在《我的世界》里用 AI 完成一些簡單的指令。
比如在 2019 年,Facebook 研發過一款《我的世界》AI 助手 "craftassist bot",這是一個智能協作式的助理機器人,可以執行人類玩家指定的各種任務,如馴服馬匹、建造城市、與村民會面及交易等。也是在 2019 年,卡內基 · 梅隆大學、微軟、DeepMind 和 OpenAI,聯合機器學習頂級會議 NeurIPS 共同舉辦了一個叫做 "MineRL" 的專門針對《我的世界》游戲的 AI 比賽,到 2022 年一共舉辦了四屆。
這個比賽同樣見證了 AI 在《我的世界》中的應用由簡單到復雜的過程。
比如第一屆 MineRL 比的東西還很簡單:看哪個研究團員能夠創造出可以在《我的世界》中成功開采鉆石的 AI。不過很慘,最后參加的 900 多個全球頂尖團隊沒有一個能完成挑戰,一些 AI 擼掉木材卻不會合成,一些 AI 造出了熔爐卻不會冶煉,一些 AI 知道去地下挖礦,但卻選擇了垂直挖……
后來到了第三屆,比賽內容就變成了看誰能訓練出樣本高效的《我的世界》AI 智能體。這一屆的冠軍是以 76.970 分的絕對優勢奪冠的騰訊 AI Lab" 絕悟 "。
各種公司、機構密集開始在《我的世界》中訓練 AI 其實也是最近五年的事。
美國國防高級研究計劃局(DARPA)在 2020 年 8 月啟動了自適應分布式概率任務分配(ADAPT)項目,以期在戰場空間中利用 AI 協助指揮官進行決策,該項目的承包商 Aptima 公司用到的就是《我的世界》來訓練 AI 與人類的互動能力。
2021 年哥本哈根信息技術大學、紐約大學和上海大學的研究者也創建過一個使用 3D 神經元胞自動機(Neural Cellular Automata,NCA)的系統,并將該系統部署在了《我的世界》里,這個時候的 NCA 已經可以建造毛毛蟲、城堡、公寓樓和樹等復雜的實體。
比較出圈的一次實驗是在去年。
OpenAI 去年宣布由他們訓練的 AI 已經做到了熟練游玩《我的世界》。通過引入一種新穎且便捷的 AI 訓練法 " 視頻預訓練(Video PreTraining)",在向 AI" 投喂 " 了 7 萬小時從相關合作方處獲取的《我的世界》演示視頻以及與視頻配套的鍵盤鼠標操作記錄后,OpenAI 旗下的 AI 的操作已經相當傳神,掌握了只有人類才能領悟的高階玩法。
OpenAI 在《我的世界》中的實操演示此外,DeepMind 也在今年年初開發出了能夠媲美 OpenAI 成果的名叫 "DreamerV3" 的 AI 智能體。DreamerV3 在沒有任何人工數據輔助的情況下,被丟進《我的世界》里摸爬滾打了 17 天,驚人地學會了如何從 0 開始挖鉆石,成了世界上第一個純靠自己摸索,就能在《我的世界》里速挖鉆石的 AI 智能體。
當時 MineRL 比賽的發起人之一 William Guss 都忍不住第一時間發來賀電:4 年了," 鉆石挑戰 " 終于被攻克了!
沒有誰比《我的世界》更合適了
《我的世界》面世 12 年,已經成為世界上最受歡迎的一款游戲,被許多玩家形容為電子版的樂高。早在 2019 年,《我的世界》就超過《俄羅斯方塊》成為全球銷量最高的游戲。
《我的世界》" 開放世界 " 的游戲屬性讓它成了科學家們訓練 AI 的絕佳場所。
不同于 LOL 和王者榮耀等單一的戰略對戰游戲,《我的世界》并不預先設定目標,僅有的兩個模式是 " 生存 " 和 " 創造 "。" 生存 " 模式中,玩家要造好房子并收集東西,保證活下來,即使是用來擊退僵尸和蜘蛛的劍也需要玩家用木材和鐵礦來鍛造;" 創造 " 模式則更加自由,玩家使用各種功能的立方體,自由構建建筑物和物體,而且游戲永遠不會結束。
如果說 LOL、王者榮耀或是很多棋類游戲因為簡單的規則和游戲機制,可以讓 AI 以極快的速度學習并超越戰勝人類,《我的世界》游戲過程的復雜程度就幾乎是在挑戰 AI 的極限。
極度多樣的環境、完全靠隨機種子生成的地圖、長決策序列與復雜的技能學習、高自由度玩法帶來的海量策略偏好,都增加了《我的世界》AI 研究的難度。
比如,為了讓 AI 在 15 分鐘內找到鉆石,AI 需要經歷徒手采集原木、合成木板、木棍與木鎬,采集到鐵礦,經過一系列加工才能合成鉆石,看似只是一件小事,但對于 AI 來說,卻需要掌握其中復雜的邏輯關系——這還只是《我的世界》游戲的一部分,除了制造工具,AI 還需要給自己制定目標,學著在游戲世界里探索,直到解鎖所有的游戲任務。
《我的世界》中找鉆石的步驟而如果只是學下棋或是打 LOL,AI 只用知道怎么贏就行了。
是不是覺得,《我的世界》訓練出來的 AI,要比靠下棋、玩 LOL 訓練出來的 AI 高級多了(雖然學習速度可能慢了點)?
事實上在當前的 AI 研究中,科學家們會越來越追求通用人工智能(AGI)的研究,追求打造更通用的 AI 智能體,也就是發展 AI 智能體能夠掌握廣泛的技能,適應各種環境變化,更深入地模擬和應對人類在復雜問題上的能力,像人一樣的進行感知、理解和交互(而不是只會回答簡單問題、下棋能贏人類那種 " 小打小鬧 " 的 AI)。
這就意味著要訓練通用 AI,《我的世界》模擬的環境是非常合適的。
不過,開放世界游戲那么多,為什么又偏偏是《我的世界》呢?
有網友在推特向參與開發了 VOYAGER 的英偉達首席科學家 Jim Fan 發問說,既然 VOYAGER 是為開放世界而生,那為什么沒有選擇在《塞爾達》或者是《艾爾登法環》這樣看上去更加宏大的開放世界游戲中作 AI 訓練?
Jim Fan 的回答是,這中間的主要難點其實并不是算法,而是因為《塞爾達》和《艾爾登法環》這樣的游戲運用了 " 緩慢且難以以編程方式控制高端控制臺 ",并且 " 需要一個好的編碼 API 來控制角色 "。相較之下,《我的世界》的技術門檻要更低,在目標和玩法類似的情況下,《我的世界》實際也為 AI 訓練降低了難度。
另外,《我的世界》對開發者也很友好。許多用于構建《我的世界》的代碼庫都是開源的,所以人們可以很容易修改。并且該游戲也允許研究人員記錄和學習人們是如何一起完成任務的,然后觀察他們將如何與 AI 智能體一起工作。從這些意義上說,沒有誰比《我的世界》來訓練 AI 更合適的了。
這次《我的世界》里的 AI 有什么特別?
此次英偉達開發的 VOYAGER,和商湯科技聯合清華大學、上海人工智能實驗室等機構開發的 GITM,與過去基于《我的世界》訓練的 AI 智能體最大的不同在于,引入了大語言模型(LLM)作為 AI 訓練的核心方法。
以往在《我的世界》中訓練 AI 用到的主流方法則是,模仿學習和強化學習。
即便是此前 OpenAI 和 DeepMind 開發出的最先進的《我的世界》AI 智能體,用到的訓練方法也是模仿學習和強化學習。
打個比方,如果想讓 AI 在《我的世界》里學會挖礦,模擬學習要做的就是先喂給 AI 上萬個游戲視頻,讓它分析學習為什么要擼樹,如何利用工作臺進行分解合成,如何做出第一把鎬子,如何冶煉鐵錠,制作鐵鎬,獲取鉆石,如何避免落入巖漿,如何戰斗等等挖礦的必要步驟。
等到投喂學習結束,AI 接下來就要接受強化學習,也就是把 AI 小人扔進《我的世界》,讓它去 " 真正 " 執行挖礦的任務,通過反復實驗來發現和解決問題,從而真正學會挖礦這一技能。
但在大語言模型的訓練方法下,AI 的學習邏輯是被完全重構的。
依然拿挖礦來說,AI 智能體自身會首先根據 " 盡可能多發現不同的東西來幫助挖礦 " 的總體目標去提問、自動生成許多小任務,通過去存儲有助于成功解決某個任務的行動程序(比如擼掉樹木再去進行合成被驗證是正確的,造出了熔爐就要去冶煉也是正確的),AI 就會逐漸建立起一個如何正確挖礦的技能庫。而往后如果再遇到挖礦任務,AI 就可以根據其描述的嵌入在技能庫中進行檢索。
大語言模型訓練方法下的 GITM也就是說,大語言模型的訓練方法下,AI 是可以自主驅動探索并掌握廣泛技能的,這就使得大語言模型方法更能幫助 AI 成為一個終身學習者,能在較長的時間跨度內逐步獲得、更新、積累和遷移知識,同時緩解了其他持續學習方法中的 " 災難性遺忘 "。
VOYAGER 探索物品量高于其他許多 AI 智能體有點像是一直讓 AI 呆在學校里讀書實習,還是讓 AI 一開始就在社會里摸爬滾打的區別。
總而言之,用大語言模型方法在《我的世界》訓練出來的 AI 更像一個真實的人了。
我們知道,一個理想的 AI 應該具有與人類類似的能力。《我的世界》里的 AI 不管是根據其當前的技能水平和世界狀態提出合適的任務(如果發現自己處于沙漠而不是森林,就會在打鐵前學會獲取沙子和仙人掌),根據環境反饋完善技能并將掌握的技能存入記憶(比如打僵尸和打蜘蛛的技能類似),還是不斷探索世界,以自驅動的方式尋找新任務,其實都已經和現實世界中人類的決策過程和行為方式非常相近。
說《我的世界》已經是一個縮小版的現實世界也許一點也不夸張。
而讓人細思極恐的是,隨著 VOYAGER 和 GITM 的研究成果發布,AI 現在已經能通關《我的世界》了。
這不禁讓人猜想,AI 是不是很快就能在現實世界里如魚得水,它能像人一樣生活,會做飯、會用手機、知道怎么穿衣服、怎么養寵物、怎么坐公交地鐵……更不可思議的是,它還能像人一樣有自己的想法,知道穿哪件衣服好看,怎么做飯能更好吃,電話應該打給誰……沒準在不久的將來,我們在生活中遇到到的 " 人 ",都無法分辨它是不是 AI。
既然都能通關《我的世界》了,AI 過上人的生活從技術上來講也不是不能實現。
人類又會如何選擇呢?
責任編輯:hnmd003
相關閱讀
-
-
-
環球今頭條!“車內打傘”名場面再現,汽車全景天窗是一個“美麗的錯誤”?
1932年,一家偉大的車企,在一輛汽車的腦門上鑿了個洞,人們第一次從通過車頂獲取到了陽光。那一輛由Austin
2023-06-03 -
微軟、谷歌、英偉達領軍,紅得發紫的生成式 AI 在醫療已有哪些進展?-全球頭條
生成式AI(GenerativeAI)的市場空間究竟有多大,這個數字隨著新興機會如雨后春筍般冒出正在不斷被改寫。但
2023-06-03 -
英偉達推出新 AI 模型 Neuralangelo 可將視頻轉換為高精 3D 模型
品玩6月2日訊,據科創板日報報道,英偉達宣布推出一款名為Neuralangelo的AI模型,該模型能夠將視頻片段轉化
2023-06-03 -
滾動:中國科幻大會元宇宙產業峰會順利落幕 當紅齊天發布九大業態及四大平臺
文 VR陀螺萬里當時我第一次用OculusDK2,整個人一下子就陷進去了。懷揣著這一個VR夢,齊笑及其創辦的北京當
2023-06-03
相關閱讀
-
人類被 AI “毀滅”,一定是從教它玩《我的世界》開始的
上周,幾乎是前后腳,英偉達和國內幾家科研機構分別發布了兩份內容相似的論文。首先是英偉達宣布開發出了一
-
眾泰董事長請辭:復制別人一時爽,但不能一直爽 全球實時
在很長時間里都沒有消息的眾泰汽車,于近日發布了公告,稱眾泰董事會收到公司董事長黃繼宏的辭職報告,申請
-
環球今頭條!“車內打傘”名場面再現,汽車全景天窗是一個“美麗的錯誤”?
1932年,一家偉大的車企,在一輛汽車的腦門上鑿了個洞,人們第一次從通過車頂獲取到了陽光。那一輛由Austin
-
機器人如何擔任私募基金經理? 今日快訊
作者|唐婧編輯丨周鵬峰一家小型私募連續兩日公告,行業或迎首個AI機器人基金經理——賽博坦。1日,私募...
-
當前熱議!被指參與監控俄羅斯 iPhone 用戶 蘋果公司回應:從未植入后門
財聯社6月2日訊(編輯夏軍雄)當地時間周四(6月1日),俄羅斯安全局表示,他們發現蘋果與美國情報機構合作
-
原行長辭職后被認定“不稱職”,這家銀行經歷了什么?
作者丨唐婧編輯丨周鵬峰圖源丨圖蟲5月31日,青島農村商業銀行股份有限公司(下稱青農商行)披露了即將召開
-
環球關注:羅永浩“三嫁”,京東直播任重道遠
文|雷達財經,作者|孟帥,編輯|深海5月31日,2023年的618大促正式拉開帷幕。與以往不同的是,作為618大促的
-
外媒:美財政部高官會見中國大使,稱雙方進行“坦誠、建設性溝通” 全球時快訊
美國財政部發表聲明稱,美財政部負責國際事務的副部長杰伊·香博當天會見了中國新任駐美國大使謝鋒,雙...
-
全球熱文:咸安統計局:開展經濟普查“兩員”培訓
6月2日,區普查專班人員來到普查試點單位溫泉辦事處肖橋村對選聘的普查指導員,調查員開展經濟普查試點工作
-
福滿滿養老年金險好不好?收益高違規嗎?
福滿滿養老年金險是一款不錯的養老產品。 1 保險金領取豐富 福滿滿養老年金有“三金”,除了基礎的養老...
-
光大永明福運連年(B款)年金保險怎么樣?怎么買?_焦點簡訊
光大永明福運連年(B款)年金保險是一款以穩健理財為主題,提供長期收益和保障的年金保險。該產品的主要特點
-
年金保險屬于壽險嗎?適合什么人買?
是的。 年金險理財屬性突顯,以被保人生存為給付條件,屬于人壽險的一種,但是不僅保生還可以保死,也就是
-
環球消息!逸享人生年金保險怎樣查詢?怎樣領取?
1、中國保險萬事通:客戶可以在微信中搜索關注“中國保險萬事通”微信公眾號,在菜單欄“保單查詢”中登...
-
高庫存壓頂,lululemon欲瓜分耐克們生意,門店狂開到二三線城市
在中國瘋狂開店的lululemon正瓜分Adidas、Nike們的生意。6月1日,加拿大運動服裝品牌lululemon(LULU US)發
-
歲歲盈盈年金保險條款是什么?到期沒取會怎樣? 天天聚看點
歲歲盈盈年金保險條款包括: 1、投保年齡:30天-60歲。 2、保障責任:15年或20年的滿期生存金和豁免保險費
-
【播資訊】“新包頭 新青年”作品展播|那位默默努力的快遞小哥
(點擊圖片查看征文啟事)著名作家果戈里說過:“青春之所以幸福,是因為擁有未來。”青年是冉冉升起的...
-
“最嚴”嬰幼兒配方奶粉國標倒逼市場轉向品質競爭
嬰幼兒配方奶粉新國標于今年2月22日開始實施,按照規定,只有通過新國標配方注冊的奶粉產品才能在中國境內
-
微軟、谷歌、英偉達領軍,紅得發紫的生成式 AI 在醫療已有哪些進展?-全球頭條
生成式AI(GenerativeAI)的市場空間究竟有多大,這個數字隨著新興機會如雨后春筍般冒出正在不斷被改寫。但
-
華為余承東:要用完美主義精神做產品|世界快資訊
5月27日,華為和賽力斯合作推出的汽車品牌問界下線第10萬輛汽車。這個成績,蔚來用了3年,理想汽車用了2年
-
“應戰” 618,小紅書派出“有故事的女同學”
圖片來源@視覺中國文|文娛價值官,作者|劉娜娜,編輯|美圻第一次參加618的小紅書,雖然不是電商小白,卻屬
-
悅安新材:6月2日融資買入459.05萬元,融資融券余額1.52億元
6月2日,悅安新材(688786)融資買入459 05萬元,融資償還564 08萬元,融資凈賣出105 03萬元,融資余額1 23億元。
-
眾安保險退保的錢能要回來嗎?退保怎么操作? 天天報資訊
可以要回來。不過,眾安保險的產品種類繁多,不同的產品可能有不同的退保政策和要求。因此,在考慮退保之前
-
平安少兒保險是什么?一年需要多少錢?
平安少兒保險是由平安保險公司推出的一款專為未成年人設計的保險產品。該產品主要分為兩類:教育形少兒保險
-
聚焦:國壽瑞鑫兩全保險怎么樣?提供什么保障?
國壽瑞鑫兩全保險既能夠為被保險人提供定期壽險保障,又可以實現長期儲蓄的功能。該保險產品提供了多種選擇
-
六十歲以上的老人買什么保險?買保險要注意什么?|世界今亮點
醫療保險是老年人最需要的保險之一,因為他們可能會面臨更高的醫療費用和更多的健康問題。醫療保險可以幫助
-
百萬醫療保到多少歲?一年需要多少錢?|每日頭條
百萬醫療險通常提供長達100歲的保障期限,只需符合續保條件即可。百萬醫療險的投保年齡一般可以達到65周歲
-
售價220萬!賈躍亭宣布FF 91第一位車主已簽合同|最資訊
FF創始人兼首席產品和用戶運營官賈躍亭在微博上宣布,設計界的”顛覆者”Rem成為FF首位車主,目前雙方已...
-
迪士尼樂園有望落戶武漢?官方:正在洽談 今日聚焦
據“湖北發布”微信公眾號消息,近日有網友詢問武漢市相關部門,能否引進迪士尼樂園?武漢市蔡甸區回復...
-
E周新勢力 | 理想2.8萬輛創新高;售價30.9萬美元,首輛FF91進入交付階段;小鵬G6將6月9日開啟預售_最資訊
E周新勢力|理想2 8萬輛創新高;售價30 9萬美元,首輛FF91進入交付階段;小鵬G6將6月9日開啟預售1 5月新勢力
-
我市舉辦“才聚兩都”首場人才懇談會 全球球精選
6月2日,我市“才聚兩都”首場人才懇談會在市黨群服務中心人才會客廳舉辦。市委常委、組織部部長董欣悅...
精彩推薦
閱讀排行
精彩推送
- 沈洋:在平凡崗位上守護群眾平安
- 最新消息:《蒙古馬》奏響大劇院
- 多彩活動 慶“六一”
- 英偉達推出新 AI 模型 Neural...
- 加油卡充值開具普通發票可以報銷嗎
- 15 個簽署國,全面實施
- 張雪峰宣布:公司每周“上四休三...
- 華貴保險回應罰單:已完成全部處...
- 直播或成 B 站新的救命稻草?
- 一聲嘆息!股價僅剩 4 毛 3,...
- 熱點聚焦:西藏雪山下的綠草地電...
- 【新視野】信美相互宜脈相連年金...
- 新資訊:合眾福享金生年金保險怎...
- 太平福滿e生年金保險怎么樣?值...
- 富贏金生年金保險產品介紹有什么...
- 環球要聞:信泰如意鑫享養老年金...
- 全球速訊:我國大氣環境質量繼續...
- 綠水青山環水田 夏種插秧正當時
- 焦點播報:為學子撐起“保護傘”...
- 滾動:中國科幻大會元宇宙產業峰...
- moto razr 40 ultra,小折疊...
- 比亞迪這次,很可能沒問題。
- 最新出手!撤銷文件,緊急致歉
- 每日精選:這些賬號禁止變現!新...
- 馬斯克剛走,黃仁勛要來,科技大...
- 建設銀行怎樣轉賬到工商銀行_當...
- 30 天,不開會:一家公司的提效...
- 歐洲央行加息炮火暫難停-全球快資訊
- 老年人發病率處于較高數位,如何...
- 不報事故、貽誤搶救!“券業一哥...