中國大模型到底什么水平? 世界觀焦點
文 | 白馬商評
" 都快成紅海了。" 當我和一個創業者聊起大模型的時候,他直接甩了這句話給我。
(資料圖)
去年 11 月,OpenAI 發布基于 GPT-3.5 的 ChatGPT,瞬間引爆大模型的熱潮。半年多的時間,中國出現了 " 百模大戰 " 的局面,BAT 等頭部互聯網公司和人工智能公司基本都對外宣布了自己的大模型。
5 月初,360 掌門人周鴻祎對外稱," 如果不經過兩年的模仿和抄襲,上來就說自己能超越,那才叫吹牛呢。" 僅僅一個月后,周鴻祎就表示," 我原來說國內大模型跟國外差距兩年,我收回這句話,今天已經接近國際水平。"
有人感慨,半年就追上 ChatGPT 了,大模型似乎也不難。那么,大模型的核心壁壘是什么?中國大模型到底什么水平?大模型在應用層面最先突圍的方向是什么?
沈為(化名)是某知名 985 高校教授,多年從事機器學習研究,還曾擔任過某頭部券商首席分析師,我們和他聊了聊,試圖揭開大模型的迷霧。
GPT 路徑跑通了,所以有了 " 百模大戰 "
白馬商評:能不能用最通俗簡單的語言解釋一下大模型,大模型是什么?和以往的 AI 模型有什么區別?
沈為:所謂大模型就是指模型的參數量大,但學術界并沒有一個清晰明確的定義界定到底多大參數叫 " 大 ",還在快速研究發展階段,一般來講大模型的參數量達到 1 億以上。
其實深度學習的發展大致經歷了三個階段。第一個階段是 2012-2017 年,以圖像分割 yolo、圖像分類 ResNet 這種特定領域的小模型為代表,參數量占內存最多也就幾百 MB。
2017 年,Transformer 的問世讓深度學習可以并行化計算,效率更高,意味著可以做大模型的運算,隨后產生了 OpenAI GPT 和谷歌 Bert 這類自然語言大模型。這一階段誕生的是特定任務的大模型,模型參數突破了 1 億。
到了 2020 年前后,深度學習進入通用模型階段,它的輸入就是一句帶空格的話,模型的作用就是 " 填空 ",以前是模型適配下游應用,現在是下游應用適配模型。這一階段的模型代表包括自然語言領域的 GPT 3.5、GPT 4 以及圖像領域的 Clip、DALLE、Stable Diffusion、Midjourney 等等。這一階段模型參數可以達到百億、千億級別。
白馬商評:你了解到最早研究大模型是哪家企業或機構?有哪些成果?
沈為:最早是高校和科研機構做相關的研究,我了解比較早的是北京智源人工智能研究院的悟道、鵬程實驗室的腦海,現在產業界的研究也很同步了。學術界的研究有一些成果,但性能沒有 ChatGPT 那么驚艷。
白馬商評:短短幾個月的時間,國內出現了 " 百模大戰 " 的局面,推出大模型的公司已經數不過來了,你怎么看待這種現象?
沈為:大模型肯定是趨勢,也一直有人在研究。之前很多公司可能會小范圍投入,做一些淺嘗輒止的研究;現在突然出現了 ChatGPT 這樣一個好產品,大家看到了明確的商業方向,于是都開始加大投入。
另一方面,很多公司面臨商業競爭的壓力,不做大模型可能就掉隊了,所以必須上馬大模型項目。
白馬商評:周鴻祎最近說他收回 " 國內大模型跟國外差距兩年 " 這句話,他認為今天已經接近國際水平。這才過去幾個月的時間,大模型好像也不難嘛。你覺得差距有多少?
沈為:差距看跟誰對標吧,我目前沒有體驗過 360 智腦的產品,不太好評價。但是國內有些生成式 AI 產品,我體驗以后感覺跟 ChatGPT 還是有差距的,國內的大模型還需要努力。
重資本投入下,只有頭部公司有機會?
白馬商評:研發大模型的核心壁壘是什么?
沈為:大模型的核心壁壘包括數據、算力、算法。
從算力上看,訓練 ChatGPT 這樣的生成式 AI 需要至少 1 萬張英偉達 A100 顯卡,單張顯卡的價格目前是六七萬,性能更優的 V100 單價 8 萬元人民幣,也就是說光算力投入至少就要達到六七個億以上,只有少數頭部公司和機構能承擔得起。對于商業機構而言,花幾個億買一堆顯卡,還不一定能產出成果,這是必須要思考的問題。
接下來是數據和算法,算法比較好理解,比如框架開發、算法優化。數據方面,中國不缺數據,甚至互聯網數據比美國還要多,但是選擇哪些數據去訓練、采用什么樣的方式處理,這些都是核心的壁壘。
白馬商評:你平時會跟企業交流嗎?非營利性的研究機構和企業在研究上有什么區別?
沈為:我們會跟企業的研究部門有一些交流。跟企業交流我們會更加了解實際的業務需求,有時候我們做的學術研究會更關注技術前瞻性,對落地性要求不那么高;但企業一般更強調落地性。
白馬商評:你有沒有研究過國內的大模型?最看好哪家?
沈為:可能還是頭部公司能跑出來吧。一是重資本的投入,只有頭部公司有實力;二是幾家頭部公司手里的數據更豐富;三是在人工智能領域已經有了一段時間的技術積累。
白馬商評:你最看好的大模型應用是什么?
沈為:從技術角度看,最先應用的應該是自然語言處理和圖像領域,語音識別可能要晚一些。
大家看到比較多的用 ChatGPT 來寫文案,這類內容創作的應用越來越多,其他我覺得像智能客服這種應用應該也會比較快。現在的一些智能客服很多時候理解不了用戶的需求,解決不了實際問題,如果讓用戶區分不出到底是人還是機器人,體驗就會改善很多;包括游戲中的 NPC,以前的對話是 " 寫死 " 的,現在漸漸可以互動了,玩家體驗也會更好。
白馬商評:你原來做過頭部券商的首席分析師,從投資角度看,你覺得大模型有哪些機會?
沈為:資金炒作的邏輯是從應用到算法、模型,再到算力;產業的邏輯反而是相反的,算力是有明確的增長預期的,所以英偉達最近上漲很快、很多。投資者現在也明白了,誰家的大模型能跑出來、能變現還需要驗證,但是增加的資本投入大部分都投到了算力。經過反復炒作,普漲行情應該已經告一段落,后面需要邏輯驗證和業績兌現。
我原來主要看傳媒互聯網行業,比如前段時間比較強勢的游戲板塊,資本的邏輯一是應用大模型提升研發效率、降低成本;二是大模型帶來更好的體驗,NPC 角色更智能,最后用戶的粘性提升、UP 值提升。當然,最終可能還需要業績驗證。
人類無法左右 AI,甚至無法左右自己的命運?
白馬商評:我們看到包括奧特曼、馬斯克都對人工智能的安全性問題提出過擔憂,現在我們只知道通過大模型訓練出現了智能化的結果,但訓練過程像一個黑箱,其實挺可怕的。你怎么看待安全問題?
沈為:在安全方面,首先我觀察到幾個反常的現象。第一個是今年 3 月包括馬斯克、蘋果公司聯合創始人史蒂夫 · 沃茲尼亞克在內的 1000 多人簽署了一份公開信,呼吁暫停訓練比 GPT-4 更強大的 AI 系統。
第二個是,今年 5 月谷歌首席科學家、已經 75 歲的 "AI 教父 " 杰弗里 · 辛頓辭職,他離開谷歌的直接原因是擔憂人工智能的危險,甚至對自己一生從事的工作感到后悔。
第三個是近兩年學術領域訓練大模型新增了倫理討論。
目前來看,我覺得大模型還是可控的,沒有大的問題;但是技術發展太快了,出圈以來短短幾個月的時間,GPT 就又經歷了幾次迭代,發展速度太快,越來越智能,會不會產生自主意識,不再聽人類的 " 使喚 ",走向失控?這個問題是大家擔心的。
白馬商評:你覺得 AI 會不會造成大量失業?在 AI 面前,普通人怎么保住工作?
沈為:從宏觀上看我不覺得 AI 會造成大量的失業,人類總會有工作的,只是說人的工作內容會發生轉變。當然,從個體角度看肯定會出現結構性的失業,我們只能不斷學習。
白馬商評:之前很多人說機器沒有感情、缺乏想象力,取代不了人類;現在既然人類大腦可以通過 AI 模擬出來,那人類的情欲、性欲是不是未來也可以模擬,荷爾蒙、多巴胺這些不過是一種生物學的獎勵機制嘛。
沈為:機器沒有感情是當前的假設,人工智能越來越接近人的思考模式,那是不是就會產生類似于人類的 " 感情 "?只是他們和人類生活在不同的空間維度,就像《流浪地球》里圖恒宇的女兒。人工智能可能會產生自己世界類似于人類的生物學意義上獎勵機制。
白馬商評:如果一切都可以計算、規劃、設置,是不是有點無趣?
沈為:AI 的行為并不是人類預測和規劃的,而是他自我強化、自我訓練的結果,《流浪地球》里 MOSS 的決策是自己做的,而不是服從人類給的指令。
白馬商評:硅基文明取代碳基文明是不是確定性的方向?
沈為:這個問題超綱了。按照目前的發展趨勢可能是這樣的,就像《流浪地球》里真正主宰人類命運的是 MOSS,而不是人類;但現實中也有可能技術會停滯在某個階段,跨不過去,畢竟技術發展不是線性的。
責任編輯:hnmd003
相關閱讀
相關閱讀
-
中國大模型到底什么水平? 世界觀焦點
圖片來源@視覺中國文|白馬商評都快成紅海了。當我和一個創業者聊起大模
-
全球焦點!掃地機器人市場回暖,科沃斯卻難突破?
「核心要點」經過今年5月以及618促銷期,掃地機器人市場終于迎來了銷量
-
【天天速看料】佛山南海區里水鎮小學轉學插班報名對象2023
佛山南海區里水鎮公辦小學插班生將實行網上報名,2023年7月4日早上7:00
-
小孩子可以買百萬醫療嗎?要多少錢?_全球新要聞
可以, 給孩子買百萬醫療險是可以的, 根據自身家庭情況來決定是否需要
-
腦起搏器百萬醫療報銷嗎?報銷多少?
如果使用腦起搏器所發生的醫療費用是合理且必要的,那么通常是可以進行
-
今日熱聞!百萬醫療險可以申請墊付嗎?需要什么材料?
百萬醫療險通常是在事后報銷醫療費用,即投保人先自行支付醫療費用,然
-
33歲買百萬醫療多少錢?劃算嗎?
年繳費用大約在1000元至3000元之間。 百萬醫療保險的價格因保險公司、
-
百萬醫療險可以報銷icu嗎?能報銷多少?
可以, 首先,我們需要明確百萬醫療險的保險范圍。 百萬醫療險是一種針
-
時代IPO快訊:天極科技申請獲受理,蘇環院首獲問詢,惠柏新材提交注冊|環球精選
來源|時代商學院作者|雷小艷孫佳雯黃銳陳麗娜畢肖磊編輯|陳佳鑫一、受
-
世界要聞:極狐阿爾法S先行版OTA再升級,AVP功能驚喜上線
極狐阿爾法S先行版OTA再升級,AVP功能驚喜上線車位找不到?車多停車難
-
做好創新創業教育這篇大文章|世界播資訊
創新是社會進步的靈魂,創業是推動經濟社會發展、改善民生的重要途徑。
-
地平線與四維圖新:圍繞智駕系統等多領域加深合作-天天速看料
地平線與四維圖新:圍繞智駕系統等多領域加深合作簡介:7月4日,蓋世汽
-
宇通客車:6月汽車銷量同比增長111.55%
宇通客車公告,6月汽車銷量4726輛,同比增長111 55%。本年累計銷量1513
-
湯臣倍健發布2023年H1業績預告:凈利潤同比增長30%-50%-當前快訊
7月3日,湯臣倍健發布2023年半年度業績預告。報告期內,公司預計實現歸
-
方程豹汽車首款車型定名豹5,將于年內開啟交付|熱門
7月4日,比亞迪方程豹汽車首款車型定名“豹5”,價格將在40-60萬元之間
-
馬斯克硬剛 OpenAI,用戶慘遭池魚之殃
只聽說過社交媒體想方設法讓用戶多停留的,沒聽說過主動給人加個上限的
-
MIUI15 來了!小米下半年最大重頭戲:多款新機已在測試!|全球快報
在去年底發布的小米13系列上,除了在核心硬件上的全新升級外,我們也見
-
菜鳥京東化,順豐怎么辦?
圖片來源@視覺中國文|解碼Decode每年,國家郵政局都會按季度公布一份快
-
傳阿里有意將優酷和土豆注入阿里影業?阿里大文娛公關回應稱,不屬實
36氪獲悉,有市場消息傳出,阿里巴巴據悉考慮視頻平臺優酷和土豆的戰略
-
中端手機暴打旗艦!上半年重磅新機扎堆,太卷了!
隨著6月份的結束,熱鬧了整整半年的手機市場總算是迎來了「冷靜期」。
-
集度汽車緘默,百度造車到哪一步了? 環球快訊
作者:孫志富來源:貓頭鷹車志(ID:owlauto)2021年,李彥宏首次明確了
-
即時:新型硅了解下?性能全面升級自帶新特性 適用于量子計算機等領域
財聯社7月4日訊(編輯黃君芝)近一個世紀以來,硅在電子領域一直占據著
-
合資變外資?smart 電動化轉型國內市場承壓
隨著A00級別小車市場規模下降,行業電動化轉型趨勢加快等因素影響,sma
-
鎵鍺出口管制!概念股應聲大漲,業內:半導體產業或受影響
利好消息助攻,今日鍺、鎵概念股開盤大漲。個股中,國內兩大鍺生產企業
-
“陳思誠模式”為何叫座? 焦點速遞
燃次元(ID:chaintruth)原創作者|陶淘編輯|曹楊電影《消失的她》爆
-
萬控智造: 公司在定期報告披露相應報告期末的股東人數 今熱點
萬控智造(603070)07月04日在投資者關系平臺上答復了投資者關心的問題。
-
重疾險和百萬醫療哪個好?區別是什么?
都好。重疾險和百萬醫療都有各自的優勢,取決于您的需求和偏好。重疾險
-
焦點!畢馬威中國發布金融科技企業首席洞察報告
6月30日,由青島市地方金融監督管理局、中國人民銀行青島市中心支行指
-
生孩子能用百萬醫療保險么?一年要交多少保費?|每日觀點
不能。百萬醫療保險一般并不包括生育相關的費用。百萬醫療保險主要針對
-
全球觀察:顧家家居被投訴,拒絕為保修期內產品保修,官網8大承諾成一紙空話?
近日,有消費者向《消費者報道》投訴稱對顧家家居的售后運營感到不滿,
精彩推薦
閱讀排行
精彩推送
- 環球時訊:大麥稱被罰系項目批文...
- 工傷報完百萬醫療可以報嗎?多久...
- 元宇宙|WAIC 2023 阿里元境元...
- 眾安惠醫保百萬醫療險保什么?可...
- 每日短訊:元宇宙 | 上海市多...
- 環球觀熱點:網上說的百萬醫療是...
- 全球簡訊:叉車龍頭安徽合力業績...
- 網傳阿里或將重新整合視頻資產,...
- 中國駐日大使館:國際原子能機構...
- 全球今熱點:突發!中國電子競技...
- 微軟內部信流出,雄心規劃曝光,...
- 每日快播:集度汽車緘默,百度造...
- 美媒:Meta 想進入中國市場賣產...
- 700 億游戲巨頭終被立案,“莆...
- 天天日報丨堅持異質主機形態,任...
- 世界快看:車企最看好的激光雷達...
- 曾被安徽前首富“掏空”,700 ...
- 燕京啤酒的蔡徐坤隱喻 滾動
- 世界快資訊丨上汽的痛,誰懂?
- 半年排名躍升近30位 中建智地...
- 途昂鎖車喇叭怎么開啟視頻(途昂...
- 【全球新視野】華夏喜盈門年金保...
- 世界新動態:惠添寶年金保險條款...
- 環球關注:平安年金保險富贏金生...
- 天天通訊!華東醫藥(000963.SZ)...
- 天天亮點!農銀人壽養老年金保險...
- 平安有增額終身壽險嗎?值得購買...
- 報道:菜鳥京東化,順豐怎么辦?
- 高德地圖宣布王鶴棣為新代言人
- 每日快報!騰勢N7,宣戰BBA