數(shù)學論證 GPT-4 不是隨機鸚鵡:真如此的話整個宇宙都會坍縮 世界報道
對于 ChatGPT 的工作原理,一個常見的解釋是根據(jù)統(tǒng)計學規(guī)律預測下一個詞。
(相關資料圖)
但最近一位叫 Jacob Bayless 的工程師用數(shù)學方法得出驚人結(jié)論:
若是如此,所需的信息量足以讓整個宇宙都坍塌成黑洞。
這一數(shù)據(jù)量是500008000,根據(jù)貝肯斯坦上限( Bekenstein bound ) 原理,如果把這些信息分配到空間當中,所需要的信息密度已經(jīng)遠超宇宙能承受的最大值。
而這僅僅是把數(shù)據(jù)存儲起來的消耗,更不必說還要進行運算了。
而 ChatGPT 與單純統(tǒng)計預測的區(qū)別,可以做這樣的類比:如果天文學家通過歷史觀測記錄推算出月食的周期,這可以算是統(tǒng)計學。
但當他們總結(jié)出牛頓萬有引力定律的時候,就已經(jīng)超越了統(tǒng)計學。
什么是 " 隨機鸚鵡 "
一個流傳很廣的說法,所謂大語言模型實際上相當于一個 " 隨機鸚鵡 " ——
與我們觀察其輸出時的情況相反,語言模型只是將其在龐大的訓練數(shù)據(jù)中觀察到的語素胡亂拼接在一起,根據(jù)概率生成文本,但不清楚文字背后的任何含義,就像一個隨機的鸚鵡。
出自論文 On The Dangers of Stochastic Parrots: Can Language Models Be Too Big
這對過去的語言模型,或許確實成立。比如曾經(jīng)流行的 n-gram 算法。
比如當我們在搜索引擎中進行搜索時,出現(xiàn)的聯(lián)想詞就能用此方法實現(xiàn)。
具體來說,下面的三行文本中,第一行純粹是隨機生成,第二行考慮了單詞在英語中整體的出現(xiàn)概率,第三行則考慮了單詞在前一個詞后面出現(xiàn)的概率。n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT …
n = 1: REPRESENTING AND SPEEDILY IS AN GOOD …
n = 2: THE CHARACTER OF THIS POINT IS THEREFORE …
不難看出,隨著 n 值的升高,文本越來越接近人類語言。
而 n-gram 模型根本不需要掌握其中的語義或理解其中的抽象概念,就能生成像模像樣的句子。
據(jù)此有人猜想,GPT-4 會不會也只是一種高級的 n-gram 呢?
Bayless 提出,GPT 必須學會抽象才能有如今的效果,至少 GPT-4 肯定如此。
GPT-4 不只是 " 隨機鸚鵡 "
要證明這一點,可以先看下棋機器人的例子。
如果有一種下棋機器人,存儲了巨量棋譜數(shù)據(jù),對于每個棋局都能推薦下一步。
那它就能通過 " 背譜法 " 模仿其他任何棋手或程序的下法。
比如 Stockfish 是最先進的國際象棋程序,如果僅通過對戰(zhàn)而不看源碼,是無法確定 Stockfish 是否在背譜。
但實際上,包含所有情形和步驟的棋譜數(shù)據(jù)量可能超到 2154。
而 Stockfish 的程序只占用了不到 50MB 的空間,根本不可能存下需要的所有棋譜。
所以 Stockfish 肯定是通過更高級的方法來實現(xiàn)下棋的。
人類語言的復雜度遠超過棋類游戲,因此 GPT 的數(shù)據(jù)量更是同理。
僅在是上一代的 GPT-3 的 token 字典中就有超過 5 萬 token。如果對每個詞都逐一建立統(tǒng)計信息,n-gram 模型中 n 值將高達 8000。
屆時,需要存儲的情景數(shù)量將達到 500008000。
正如文章開頭所提到,這簡直是天文數(shù)字,足以讓整個宇宙坍縮。
因此,GPT 是 " 隨機鸚鵡 " 的猜測在理論上得到了一定程度的批駁。
" 隨機鸚鵡 " 達不到的高度
僅在理論上進行說明是不充分的,因此研究人員還進行了兩個實驗,意圖證明大模型在學習過程中已經(jīng)抽象出了算法。
第一個實驗關于一道經(jīng)典的農(nóng)夫過河問題。
一個農(nóng)夫有一條船,和狼、羊、菜,農(nóng)夫要把這 3 樣東西運到河到另一邊,農(nóng)夫每次最多只能通過這個船運一樣東西,要防止狼吃羊、羊吃白菜(即不能在沒有農(nóng)夫在的情況下同時在同一岸邊),該怎么過?
研究人員將這個問題中的農(nóng)夫、船、河分別替換成地球人、蟲洞和銀河系。
狼、羊和菜則分別換成火星人、金星人和月球人。
替換的目的是因為互聯(lián)網(wǎng)上不太可能出現(xiàn)類似語料,可以判斷大語言模型是不是真的掌握了通用方法。如果 GPT 不是 " 隨機鸚鵡 ",那么它至少不會犯下只有 " 隨機鸚鵡 " 才會犯的錯誤。
GPT-4 針對替換后的問題給出了正確的回答,GPT-3.5 則沒有。
但它們并沒有犯研究人員預想的 " 鸚鵡 " 錯誤——即在回答中出現(xiàn)狼、船、河等已被替換掉的詞語。回答中使用的句子,也無法在互聯(lián)網(wǎng)中被檢索到。
這些現(xiàn)象都證明了現(xiàn)在的大語言模型的生成方式已經(jīng)超越了 " 概率預測 "。第二個實驗則是數(shù)字排序。
如果讓 GPT 學習數(shù)字排序,它們究竟是只會記住給出過的數(shù)字順序,還是真的研究出排序算法呢?
其實只要從 GPT 的輸出當中就可以看出來了。假如從 1-100 中隨機選擇 10 個數(shù)字,并將其順序打亂,將一共有這么多種情形:
如果再考慮數(shù)字的重復出現(xiàn),又或者數(shù)字的數(shù)量發(fā)生變化,根本不可能存儲如此之多的情形。因此,只要 GPT 能夠針對未知的排序問題給出正確的回答,便可以說明它們是真的研究出了排序算法。
研究人員訓練了一款特斯拉前 AI 總監(jiān) Andrej Kaparthy 發(fā)明的語言模型 nanoGPT,專門讓它做數(shù)字排序。
結(jié)果顯示,隨著訓練步數(shù)的增加,模型給出的數(shù)字順序越來越完美。
雖然在訓練步數(shù)達到 16 萬左右時突然出現(xiàn)了大量錯誤,但也很快得到了糾正。
這說明這款模型并不是僅僅根據(jù)學習的素材對未知的數(shù)字進行排序,而是已經(jīng)掌握了背后的方法。
這個測試只是在一臺筆記本電腦、算力非常有限的 GPU 上進行的。更不必說 GPT-4 了。
參考鏈接:
https://jbconsulting.substack.com/p/its-not-just-statistics-gpt-4-does
責任編輯:hnmd003
相關閱讀
-
數(shù)學論證 GPT-4 不是隨機鸚鵡:真如此的話整個宇宙都會坍縮 世界報道
對于ChatGPT的工作原理,一個常見的解釋是根據(jù)統(tǒng)計學規(guī)律預測下一個詞。但最近一位叫JacobBayless的工程師
2023-05-27 -
超越歷史最佳紀錄 15 倍!華為分布式存儲產(chǎn)品性能全球第一,受益上市公司一覽
財聯(lián)社5月27日訊(編輯劉越)國際最權(quán)威的存儲性能排行榜——IO500最新榜單近日正式公布,華為OceanStorPac
2023-05-27 -
數(shù)實相融,終端筑路:華為擎云點亮 2023 數(shù)博會|當前報道
文 柳華芳云貴高原,山川秀美,不止有宜人氣候,還有云上貴州,有溫暖陽光,也有高科技的天下英雄會。5月26
2023-05-27 -
當前快報:小鵬、深藍都往車里“加床”,車載大床是偽需求嗎?
蘋果高級運營副總裁JeffWilliams曾表示,汽車是移動設備的終極形態(tài)。進入新能源時代后,汽車行業(yè)競爭更加激
2023-05-27 -
全球關注:余承東:華為不是不造車,我們是和合作伙伴一起造車
品玩5月27日訊,余承東在賽力斯AITO問界十萬輛量產(chǎn)車下線的慶祝儀式上,對華為不造車的說法給出最新回應:
2023-05-27
相關閱讀
-
數(shù)學論證 GPT-4 不是隨機鸚鵡:真如此的話整個宇宙都會坍縮 世界報道
對于ChatGPT的工作原理,一個常見的解釋是根據(jù)統(tǒng)計學規(guī)律預測下一個詞。但最近一位叫JacobBayless的工程師
-
今年9月,91.8%的幼兒園將開設托班!網(wǎng)上預報名開始啦 環(huán)球通訊
托班網(wǎng)上預報名開始啦為實現(xiàn)“幼有善育”的目標,閔行區(qū)積極挖掘潛力,鼓勵有條件的公辦幼兒園和民辦幼...
-
外媒:特斯拉100GB數(shù)據(jù)泄露,涉及馬斯克社保號碼和員工工資_天天短訊
據(jù)財聯(lián)社援引外媒消息,一名舉報者向德國《商報》泄露了100GB的特斯拉數(shù)據(jù),除了首席執(zhí)行官馬斯克的社保
-
超越歷史最佳紀錄 15 倍!華為分布式存儲產(chǎn)品性能全球第一,受益上市公司一覽
財聯(lián)社5月27日訊(編輯劉越)國際最權(quán)威的存儲性能排行榜——IO500最新榜單近日正式公布,華為OceanStorPac
-
無線快充取消“ MFi ”認證,蘋果在下一盤大棋
「獨樂樂」和「眾樂樂」之間,蘋果一直是傾向于前者,這一點,從它對認證配件的嚴格程度就能看出來。但想要
-
數(shù)實相融,終端筑路:華為擎云點亮 2023 數(shù)博會|當前報道
文 柳華芳云貴高原,山川秀美,不止有宜人氣候,還有云上貴州,有溫暖陽光,也有高科技的天下英雄會。5月26
-
當前快報:小鵬、深藍都往車里“加床”,車載大床是偽需求嗎?
蘋果高級運營副總裁JeffWilliams曾表示,汽車是移動設備的終極形態(tài)。進入新能源時代后,汽車行業(yè)競爭更加激
-
全球關注:余承東:華為不是不造車,我們是和合作伙伴一起造車
品玩5月27日訊,余承東在賽力斯AITO問界十萬輛量產(chǎn)車下線的慶祝儀式上,對華為不造車的說法給出最新回應:
-
1 克黃金,便宜 100 元?!黃金“代購”,火了!|實時焦點
一般來說,五六月是婚慶市場的旺季,也帶動了黃金飾品熱銷。在被稱為黃金市場晴雨表的深圳水貝市場,近期持
-
【環(huán)球熱聞】阿里巴巴最新回應!
25日晚,阿里巴巴官方微博發(fā)布消息,近日,關于淘寶天貓、阿里云、菜鳥、本地生活各個業(yè)務裁員謠言傳得很厲
-
“貴到離譜!” 300 元一個,沖上熱搜第一!
榴蓮又上熱搜了,還是因為價格,昨天 榴蓮,貴 話題沖上微博熱搜第一,短短幾個字,擊碎一眾榴蓮價格敏感型
-
注意!油價最新消息
漲了,本輪計價周期國內(nèi)油價終究還是沒有抗住最后的幾天,又是由跌轉(zhuǎn)漲。截至5月25日,累計上調(diào)75元 噸,沖
-
今日聚焦!國家統(tǒng)計局:1-4 月份全國規(guī)模以上工業(yè)企業(yè)利潤下降 20.6%
1—4月份,全國規(guī)模以上工業(yè)企業(yè)實現(xiàn)利潤總額20328 8億元,同比下降20 6%(按可比口徑計算,詳見附注二)。
-
青農(nóng)商行與青島前首富決裂?多次減持,“巴龍系”持有上億元該行股權(quán)將拍賣
青農(nóng)商行(002958 SZ)股權(quán)再被拍賣!5月24日,青農(nóng)商行公告稱,因債務問題,青島市黃島區(qū)人民法院將于6月28
-
中國汽車產(chǎn)業(yè)鏈全景圖:243家汽車供應商誰在吃肉,誰在喝湯?|天天熱聞
一場油箱的爭論,讓人們開始關注汽車上游供應商和零配件。近幾年,中國新能源車蓬勃發(fā)展,大家的關注力更多
-
小米新周期交出第一份答卷,高端進展加速帶動盈利大幅回升_快看
日前,小米交出了高端化轉(zhuǎn)型第四年的首份答卷。據(jù)小米集團5月24日發(fā)布的財報,今年前三個月,集團整體毛利
-
廣東省周末天氣炎熱并伴有雷雨|環(huán)球頭條
近日,全省氣溫不斷上升,隨著副熱帶高壓和臺風外圍下沉氣流的持續(xù)影響,未來多天廣東將處于高溫炎熱天氣,
-
新華財經(jīng)|渤海灣首個千億方大氣田中心平臺建造完成
根據(jù)中國海油提供的信息,渤中19-6凝析氣田位于渤海中部海域,是大型、整裝、高產(chǎn)、特高含凝析油的千億立方
-
李彥宏:大模型即將改變世界|焦點速看
李彥宏意氣風發(fā)。做為中國人工智能技術(shù)積累最深的公司之一,在今年3月文心一言正式對外測試后,百度已經(jīng)迅
-
馬斯克一重要試驗,獲批準|世界熱門
當?shù)貢r間5月25日,馬斯克旗下腦機接口公司Neuralink宣布,該公司已獲得美國食品和藥物管理局(FDA)的批準,
-
當前視訊!GOTC 2023 嘉賓暢談:開源助推云原生、汽車軟件發(fā)展
大家期待已久的GOTC2023召開在即,組委會廣邀各個論壇嘉賓講師暢談開源與各技術(shù)領域的發(fā)展趨勢,讓小伙伴們
-
【世界快播報】13 層網(wǎng)絡拿下 83% 精度,華為諾亞新型神經(jīng)網(wǎng)絡架構(gòu) VanillaNet「簡約」到極致
機器之心專欄機器之心編輯部深度學習模型架構(gòu)越復雜越好嗎?自過去的幾十年里,人工神經(jīng)網(wǎng)絡取得了顯著的進
-
蘋果 7 月關閉“我的照片流”服務
鈦媒體App5月27日消息,蘋果宣布將于7月26日關閉我的照片流(MyPhotoStream)服務,建議現(xiàn)有用戶盡快遷移到
-
基辛格 100 歲了,但現(xiàn)在的美國似乎不再需要他
5月27日,當今世界最具傳奇色彩的外交家基辛格,迎來了自己100歲的生日。撇開政治立場,看他100年的人生經(jīng)
-
網(wǎng)信辦“清朗”專項行動:處置違規(guī)賬號92.76萬余個_當前快報
據(jù)“網(wǎng)信中國”消息,按照“清朗·從嚴整治‘自媒體’亂象”專項行動要求,3月10日以來,各級網(wǎng)信部門積...
-
巨星傳奇上市,周杰倫賣咖啡三年賺7個億
據(jù)北京商報報道,周杰倫巡演火熱開唱期間,與其深度綁定的巨星傳奇集團有限公司通過港交所上市聆訊,在
-
天天消息!Faraday Future 宣布 FF 91 成功通過 FMVSS 碰撞測試 第一階段交付將于 5 月 31 日開始
品玩5月26日訊,據(jù)法拉第未來官方消息,F(xiàn)F91電動汽車成功通過了美國聯(lián)邦機動車安全標準(FMVSS)的碰撞測試
-
【新要聞】Great Wall Motor Accuses Rival BYD of Failing on Hybrid Emissions
GreatWallMotorAccusesRivalBYDofFailingonHybridEmissions,with,sold,wall,share,sales,motor
-
天天消息!A16z 精心整理的最全 AI 學習資料(全文中譯 + 鏈接)
硅谷以善于研究和喜愛分享著稱的投資機構(gòu)A16z(AndreessenHorowitz)最近發(fā)布了一份經(jīng)過詳細篩選并配有簡介
-
我過上了“二手人生”,真是一言難盡!一言難盡! 全球訊息
本周六我們的心理學入門小學堂將進入第一章——精神分析流派,這次直播主講弗洛伊德的人生故事。弗洛伊...
精彩推薦
閱讀排行
精彩推送
- 環(huán)球熱推薦:AI+ 廣告營銷望成...
- 西藏林芝森林消防開展30公里徒步...
- 日喀則博物館開館 頭條
- 【世界新視野】西藏今年計劃實施...
- 世界微頭條丨非標業(yè)務估值核算 ...
- 142億全歸女方,A股又現(xiàn)天價離婚...
- *ST龐大被證監(jiān)會立案調(diào)查 全球微動態(tài)
- 百果園被曝不收顧客一元紙幣,店...
- 2023年全國“奔跑吧·少年”兒童...
- 熱門:我市全力做好青年就業(yè)創(chuàng)業(yè)...
- 愛心送考專項服務啟動
- 全國首個家校社協(xié)同育人研究與實...
- 包頭市全民健身發(fā)展研究中心在包...
- 全球百事通!我國科研團隊揭示人...
- 西藏啟動電力便民服務體系示范點...
- 走向珠峰丨行動——走向那座湖|...
- 世界動態(tài):2023年珠峰科考登頂隊員凱旋
- 環(huán)球速看:哈鐵開行今年首趟“龍...
- 全球超高海拔單機容量最大風電機...
- 滾動:全球首艘,正式交付!
- 讓夢想觸手可及 全新一代中高端...
- 網(wǎng)紅何丹彤稱在巴黎被搶劫:劫匪...
- 全區(qū)推進縣域?qū)W前教育普及普惠督...
- “高精尖”科技成果扎堆亮相2023...
- 特斯拉:Model Y 成為第一季度...
- FF:首款量產(chǎn)車 FF 91 已通過碰撞測試
- 通信網(wǎng)如何隨 AI 之需而變?
- C919 機票開售,上海虹橋飛成都...
- 所有人免費!著名景區(qū)官宣 環(huán)球訊息
- 法院判了!特斯拉車頂維權(quán)女車主...