GPT-4 是 8x2200 億參數的混合模型?這個小道消息今天傳瘋了|重點聚焦
機器之心報道
編輯:吳昕
(資料圖片)
George Hotz:除了蘋果之外,大部分公司保密的原因都不是在隱藏什么黑科技,而是在隱藏一些「不那么酷」的東西。
「GPT-4 的參數量高達 100 萬億。」相信很多人還記得這個年初刷屏的「重磅」消息和一張被病毒式傳播的圖表。
不過很快,OpenAI 的 CEO Sam Altman 就出來辟謠,證實這是一條假消息,并表示,「關于 GPT-4 的謠言都很荒謬。我甚至不知道這從何而起。」實際上,許多人相信并傳播這樣的謠言是因為近年來 AI 社區(qū)不斷在增加 AI 模型的參數規(guī)模。谷歌在 2021 年 1 月發(fā)布的 Switch Transformer 就把 AI 大模型參數量拉高到了 1.6 萬億。在此之后,很多機構也陸續(xù)推出了自己的萬億參數大模型。據此,人們有充分的理由相信,GPT-4 將是一個萬億參數的巨量模型,100 萬億參數也不是不可能。
雖然 Sam Altman 的辟謠幫我們去掉了一個錯誤答案,但他背后的 OpenAI 團隊一直對 GPT-4 的真實參數量守口如瓶,就連 GPT-4 的官方技術報告也沒透露任何信息。
直到最近,這個謎團疑似被「天才黑客」喬治霍茲(George Hotz)捅破了。
喬治霍茲因 17 歲破解 iPhone、21 歲攻陷索尼 PS3 而聞名,目前是一家研發(fā)自動駕駛輔助系統(tǒng)的公司(comma.ai)的老板。
最近,他接受了一家名為 Latent Space 的 AI 技術播客的采訪。在采訪中,他談到了 GPT-4,稱 GPT-4 其實是一個混合模型。具體來說,它采用了由 8 個專家模型組成的集成系統(tǒng),每個專家模型都有 2200 億個參數(比 GPT-3 的 1750 億參數量略多一些),并且這些模型經過了針對不同數據和任務分布的訓練。
在這段播客播出之后,PyTorch 創(chuàng)建者 Soumith Chintala 表示自己似乎聽過同樣的「傳聞」,很多人可能也聽過,但只有 George Hotz 在公開場合將其說了出來。「混合模型是你在無計可施的時候才會考慮的選項,」George Hotz 調侃說,「混合模型的出現是因為無法讓模型的參數規(guī)模超過 2200 億。他們希望模型變得更好,但如果僅僅是訓練時間更長,效果已經遞減。因此,他們采用了八個專家模型來提高性能。」至于這個混合模型是以什么形式工作的,George Hotz 并沒有詳細說明。為什么 OpenAI 對此諱莫如深呢?George Hotz 認為,除了蘋果之外,大部分公司保密的原因都不是在隱藏什么黑科技,而是在隱藏一些「不那么酷」的東西,不想讓別人知道「只要花 8 倍的錢你也能得到這個模型」。對于未來的趨勢,他認為,人們會訓練規(guī)模較小的模型,并通過長時間的微調和發(fā)現各種技巧來提升性能。他提到,與過去相比,訓練效果已經明顯提升,盡管計算資源沒有變化,這表明訓練方法的改進起到了很大作用。
目前,George Hotz 關于 GPT-4 的「爆料」已經在推特上得到了廣泛傳播。
有人從中得到了靈感,聲稱要訓練一個 LLaMA 集合來對抗 GPT-4。還有人說,如果真的像 George Hotz 說的那樣,GPT-4 是一個由 8 個 2200 億參數的專家模型組合的混合模型,那很難想象背后的推理成本有多高。需要指出的是,由于 George Hotz 并未提及消息來源,我們目前無法判斷以上論斷是否正確。有更多線索的讀者歡迎在評論區(qū)留言。George Hotz 采訪內容。GPT-4 相關內容在 49:00 前后。視頻來源:https://www.youtube.com/watch?v=K5iDUZPx60E&t=3030s
參考鏈接:https://twitter.com/soumithchintala/status/1671267150101721090
THE END
轉載請聯系本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com
責任編輯:hnmd003
相關閱讀
相關閱讀
-
GPT-4 是 8x2200 億參數的混合模型?這個小道消息今天傳瘋了|重點聚焦
機器之心報道編輯:吳昕GeorgeHotz:除了蘋果之外,大部分公司保密的原
-
分析師爆料有新動向,iPhone 16 或將支持 Wi-Fi 7
雖然iPhone15系列尚未發(fā)布,但一點都不耽誤iPhone16系列的爆料。一直以
-
理想吹響城市 NOA 號角:激光雷達車型又火了
圖片來源@視覺中國文|HiEV大蒜粒車研所,作者|德新,編輯|王博2023下半
-
200 萬粉絲大 V 稱車“爛”、“差”,還說買車用戶“有病”!知名車企“怒懟”:永久刪除并道歉-全球快看點
在視頻中稱汽車爛、差、罵爆,并且稱買車的用戶有病 近日,一名在微
-
賈躍亭發(fā)文致歉!|全球時快訊
6月21日,賈躍亭在微博發(fā)長文就法拉第未來首款車型第二階段交付推遲致
-
火鍋店老板在上海置換千萬級房產,用火鍋券抵了 10 萬元中介費
這樣的現金券一共有1000張。李小憶是上海21世紀不動產某門店店東,6月2
-
【速看料】鐵原子結構示意圖怎么寫_鐵原子結構示意圖
1、原子結構示意圖:;核外電子排布式:1s2s22p63s23p63d64s2;Fe2+結
-
全球速訊:霸氣十足 凱迪拉克凱雷德IQ純電版發(fā)布
霸氣十足凱迪拉克凱雷德IQ純電版發(fā)布近日,凱迪拉克全新電動SUV凱雷德I
-
細節(jié)有變化 福特蒙迪歐1.5T版將6月26日亮相
細節(jié)有變化福特蒙迪歐1 5T版將6月26日亮相日前,車質網從相關渠道獲悉
-
奧迪A5 Sportback推出致臻幻彩限量版
奧迪A5Sportback推出致臻幻彩限量版近日,我們從奧迪汽車官方獲悉,旗
-
首宗個人破產案執(zhí)行完畢 法院免除當事人未清償債務
今年37歲的梁某某2018年選擇藍牙耳機市場創(chuàng)業(yè)。由于經營不善,他的債務
-
兩巨頭戰(zhàn)火蔓延!谷歌指控微軟 Azure 云部門存在反競爭行為
如今在AI領域最火的兩家美國大公司谷歌和微軟,把戰(zhàn)火燒到了云業(yè)務上。
-
全球滾動:行政強制執(zhí)行方式是_行政強制執(zhí)行方式
1、行政強制執(zhí)行的方式:(一)代履行代履行,又叫代執(zhí)行,是指義務人不
-
對不起了知乎,這次我也想噴噴匿名用戶們。
知乎又被炮轟了。億歐網創(chuàng)始人黃淵普寫了篇《寫給知乎創(chuàng)始人周源的公開
-
新能源免購置稅又延了四年,但這次就不是大家都能爽了。 全球關注
想買新能源車的差友們,應該都看到購置稅減免延期的消息了吧。就在昨天
-
高通裁員 415 人,試圖降低因智能手機需求下滑而造成的損失
IT之家6月21日消息,盡管2023年已經過了一半,但全球經濟趨勢似乎仍沒
-
熱點評!美光推出其首個 UFS 4.0 模塊,可使智能手機速度達到 4300MB/s
IT之家6月21日消息,當地時間周三,美光宣布推出了其首款符合UFS4 0規(guī)
-
“市場實在太小”!微軟游戲工作室明確表示“不會涉足 VR ”|播資訊
微軟旗下游戲工作室XboxGameStudios的負責人MattBooty認為,虛擬現實(
-
焦點熱門:燃點是什么_燃點是什么意思
1、通常意義的燃燒,指的是物質的劇烈氧化反應,只有大量原子或分子同
-
世界新消息丨金色cmyk色值為多少_金色cmyk色值
1、金色的“CMYK”值是(049990)CMYK也稱作印刷色彩模式,顧名思義就
-
亞香股份:2303.62萬股限售股將于6月27日起解禁上市,占公司總股本的28.51%|環(huán)球精選
亞香股份6月21日公告,本次申請解除股份限售的股東數量為15戶,其中首
-
三千元 HiFi 真無線!HIFIMAN SVANAR Wireless 天鵝真無線藍牙耳機試聽
點擊上方播放視頻來自ZEALERApp創(chuàng)作者【數玩工場】,本期視頻主要是HIF
-
干掉煩人的密碼!蘋果 iOS 17 邁出了重要一步
天下苦密碼久矣,太簡單的不安全,太復雜的記不住。針對這一煩惱,許多
-
試駕阿維塔 11 這智駕水平你給幾分?
阿維塔11的智駕水平,你給幾分?搭載華為HI全棧智能解決方案的阿維塔11
-
OpenAI 被曝游說歐盟放寬對 AI 的監(jiān)管,取消高風險分類
品玩6月21日訊,據財聯社消息,ChatGPT開發(fā)公司OpenAI對歐盟官員進行了
-
“極兔”攪局,快遞行業(yè)洗牌開始了!
號外號外有一只兔子把順豐的兒子豐網給吃干抹凈,還赴港交所上市了!我
-
界隈歌詞個人翻譯 - 6_今日報
夢見(夢見)原作者:全て此の世の所為です。(全都是這世道的所作所為
-
歐盟就對俄實施第11輪制裁達成一致
當地時間21日,歐盟各成員國常駐歐盟代表在布魯塞爾就對俄羅斯實施第11
-
非議聲中蔚來首款手機已正式入網、或 8 月上市 車企跨界之風依然盛行-天天即時看
財聯社6月21日訊(記者徐昊)在博世中國高管關于汽車企業(yè)做手機是吃飽
-
曝 Galaxy S23 FE 是首款預裝 OneUI 6.0 的三星智能手機
在2020年9月,三星推出了全新的產品GalaxyS20FE,作為S系列第一款以FE
精彩推薦
閱讀排行
精彩推送
- 全球消息!蘋果 MR 現世,VR ...
- 市場消息:谷歌因音頻播放專利被...
- 美股 AI 概念明星股普遍下跌|熱議
- 星巴克等被約談,涉誘導索取手機...
- 海爾訴小米等侵害發(fā)明專利權|天...
- 蔚來 CEO 李斌:新能源購置稅...
- FF 首款車型第二階段交付推遲,...
- 賈躍亭:正全力推進 FF 中國落地項目
- 熱推薦:金針菇怎么炒好吃做法_...
- 年金險可以買嗎?一年多少錢?-...
- 全球短訊!百折不撓,杭州物業(yè)公...
- 環(huán)球熱頭條丨百萬醫(yī)療既往病怎么...
- 做人流百萬醫(yī)療報銷不?怎么報銷?
- 泰康百萬醫(yī)療人工客服電話是多少...
- 全球信息:北京將推1700余場文旅...
- 每日快報!北京消防部門加大對酒...
- 即時看!插件滿足不了 OpenAI,...
- 泓禧科技擬使用閑置自有資金購買...
- 每日熱點:FF 首款車型第二階段...
- 躍動鹿城——中國二冶包馬賽道巡...
- 二冶筑造 躍動鹿城|當前通訊
- 今日看點:中國二冶獲批承擔重大...
- 百萬醫(yī)療和社保的報銷順序是什么...
- 超級瑪麗8號重疾險怎么樣?靠譜嗎?
- 百萬醫(yī)療40歲多少錢?40歲買合適嗎?
- “藥茅”片仔癀多事之秋,分拆上...
- a1零食研究所聯合創(chuàng)始人何正仁:...
- 公司團體意外險買哪個好?怎么買...
- 【全球新視野】百萬醫(yī)療不交了有...
- 焦點熱訊:國家馬鈴薯產業(yè)體系科...