世界快報:大模型掀起諸神之戰,我們更需要人人可用的“普惠模型”
百模大戰
AI 的門檻一下變高了
跟當年的 AI 創業以及互聯網創業生態不同,大模型成為 " 頭號玩家 " 的游戲,活躍的玩家要么是大廠,要么是有資金加持的 " 有背景 " 創業者," 草根創業者 " 尚未出現。
(資料圖片)
大模型具有 " 巨量數據、巨量算法、巨量算力 " 三大 " 巨量 " 特征,對任何企業包括巨頭來說,打造一個大模型都不是一件容易的事情,需要收集海量數據、需要采買海量算力、需要進行大量研發,金錢、時間、人力投入同樣 " 巨量 "。ChatGPT 是創業公司 OpenAI 做的,這家公司在 2015 年成立后低調耕耘 8 年,且有微軟等巨頭 / 大佬支持,底層硬件投入高達 10 億美元以上,每次訓練消耗的電力足夠 3000 輛特斯拉汽車每輛跑 20 萬英里。
" 巨量 " 特征讓大模型研發門檻極高,但任何技術生態要走向繁榮都離不開社會化創新。移動互聯網的崛起源自于 iOS 和安卓的出現,但也離不開應用市場數百萬開發者的創新。同理,大模型上 " 長出 " 的應用也都得靠開發者來定義,讓 AI 大模型為所有開發者(技術服務商、企業、組織、個體開發者等)所用,是加速大模型產業發展的關鍵。截至目前,大模型還處在 " 只聽其聲不聞其人 " 的階段,大廠的大模型已在開放,但需要使用者有較高的人才、算力等資源配置,當下市面上急缺一款讓開發者乃至大學生等群體 " 人人可用 " 的大模型。
62 億參數規格
大模型也能 " 小而美 "
最近我在朋友圈看到有人分享了一個輕量級開源大模型:中英雙語對話模型 ChatGLM-6B,它的最大特點是輕量化,支持在單張消費級顯卡上進行部署推理使用,這讓它具備人人可用的基礎——千億規格的大模型往往需要成百上千張顯卡才能部署。
ChatGLM-6B 來自智譜 AI 這家公司,它由清華技術成果轉化而來。2022 年 8 月,智譜 AI 旗下的千億級參數模型 GLM-130B 中英雙語稠密模型正式向研究界和工業界開放—— "130B" 是 130 billion 的縮寫,即 1300 億參數。據官網介紹稱,GLM-130B 與 BERT、GPT-3 和 T5 有著不同的架構,是一個包含多目標函數的自回歸預訓練模型,具有雙語支持、高精度和快速推理等特性。
2022 年 11 月,斯坦福大學大模型中心對全球 30 個主流大模型進行了全方位的評測,GLM-130B 是亞洲唯一入選的大模型。在與 OpenAI、谷歌大腦、微軟、英偉達、臉書的各大模型對比中,評測報告顯示 GLM-130B 在準確性和惡意性指標上與 GPT-3 175B ( davinci ) 接近或持平,魯棒性和校準誤差在所有千億規模的基座大模型(作為公平對比,只對比無指令提示微調模型)中表現不錯。2023 年 3 月 14 日,智譜 AI 基于 GLM-130B 推出的千億對話模型 ChatGLM 開始內測,ChatGLM 對標 ChatGPT,具備問答和對話功能且針對中文進行了優化,第三方評測顯示其具備 ChatGPT3.5 至少 70% 的能力水平。同一天,智譜 AI 還開源了 62 億參數 的 ChatGLM-6B 模型。根據官方 Blog 顯示,ChatGLM-6B 采取跟 GLM-130B 一樣的架構與技術,其將參數規格從千億精簡到 62 億,具有如下特征:第一,輕量級。結合模型量化技術,ChatGLM-6B 參數大幅精簡,INT4 量化級別下最低只需 6GB 顯存,支持在單張消費級顯卡上進行本地部署,部署門檻與推理成本大幅降低。
第二,中英雙語對話。進行了充分的中英雙語預訓練,經過約 1T 標識符的中英雙語訓練,輔以監督微調、 反饋自助、人類反饋強化學習等訓練方式,它更能對齊人類意圖,進而擁有不錯的智能表現。
第三,國產自主。GLM-130B 對國產信控生態有較好的支持,可在國產的海光 DCU、華為昇騰 910 和申威處理器及美國的英偉達芯片上進行訓練與推理。ChatGLM-6B 作為國產自主的輕量級大模型也支持信控平臺,可助力我國 AI 技術特別是大模型自主化。
截至目前 ChatGPT、文心一言、通義千問的體驗門檻都很高,而 ChatGLM-6B 支持公眾體驗(http://open.bigmodel.ai/trialcenter),簡單注冊后,我體驗了一下它的能力。對近期 AI 型圈沸沸揚揚的口水戰,它回答得很得體:
我打算做一個華為最新折疊屏手機 Mate X3 的評測,讓 ChatGLM-6B 幫忙寫一個提綱,結果中規中矩,思路沒問題:寫詩這樣的常規任務不在話下:商業文案創作比如取名、想廣告詞都可以做," 喝蜜雪,不舔蓋 ",很有創意了:體驗中大部分時候 ChatGLM-6B 的表現相比 ChatGPT、文心一言、通義千問并不遜色,考慮到它是一個只有 62 億參數的 " 輕量版 " 大模型,哪怕 " 遜色 " 也都可以原諒了。特別值得一提的是,智譜 AI 針對取標題、寫文章等不同場景進行了調優,讓它在滿足對應 AIGC 需求時有更出色的表現:ChatGLM-6B 的參數規格只有 62 億,因此也存在一些不容回避的問題,比如在面對許多事實性知識任務時可能會生成不正確的信息,不擅長邏輯類問題(如數學、編程)的解答,對多輪對話的支持很一般。要真正擁有人的智商,AI 大模型依然任重道遠。AI 大模型的完整稱呼是 "AI 預訓練大模型 "," 預訓練 " 的字面意思很容易理解:預先訓練好,這樣應用開發者可得到相對現成的訓練結果,基于此直接開發 AI 應用,不再需要從 0 到 1 訓練數據、建立模型。它通過堆疊數據集 " 貪婪式 " 地訓練模式,擁有較強的通用性,理論上可泛化到多種應用場景,而小樣本或零樣本的技術實現,則可讓應用開發者快速基于其構建工程應用。
顯而易見,ChatGLM-6B 的出現體現出了大模型預訓練與泛化通用的精髓,它的理念是 " 有舍才有得 ",弱化一些能力,但降低了部署門檻,讓開發者、研究者在本地計算機上進行大模型的微調、部署、訓練成了可能,進而可更好地支持大模型落地到海量場景。
在前幾天的一次公開活動上,智譜 AI CEO 張鵬曾表達一個觀點,"AIGC 產業基座是預訓練大模型,原因在于兩個方面:第一、通用泛化能力,為 AI 研發降本增效,這是非常關鍵的特性;第二,融入更多知識,讓大模型能更好模擬人的智能。但與此同時也面臨著一些挑戰,比如成本高昂、訓練數據巨大,周期長等。"ChatGLM-6B 的開源正是智譜 AI 實現通用泛化、降低 AI 研發門檻與成本的實踐。
ChatGLM-6B 讓大模型技術 " 人人可用 "ChatGLM-6B 通過輕量化的模式實現大模型的通用泛化,解決了大模型 " 高不可攀 " 這一開發者的痛點。在日益蓬勃的大模型產業中,有著獨特占位的 ChatGLM-6B 將在 AI 技術普惠中扮演重要角色。具體來說,它將給大模型產業帶來如下好處:
1、降低大模型使用門檻。更多開發者可輕松部署大模型,一方面, ChatGLM-6B 是開源的,開發者可深入大模型底層一探究竟,只有搞清楚大模型的運轉機制才能更好地利用好大模型技術。另一方面,開發者可基于 ChatGLM-6B 進行上層應用創新,開發出我們今天想都想不到的創新 AI 應用,在工業化階段再切換到 GLM-130B 這樣的千億級大模型上。
2、降低大模型的訓練成本。大模型訓練成本高昂且耗能,基于開源的 ChatGLM-6B,開發者不再需要搭建龐大的算力體系,在訓練推理時也不需要耗費驚人的電力資源、所需時間周期將大幅縮短,進而更高效、低碳、經濟地應用大模型技術,加速 AI 工業化大生產。
3、有利于大模型的教育普及。喬布斯當年曾說人人都要會編程,未來人人則要學會使用 AI 工具。在教育場景,計算機相關專業的大學生以及對編程有興趣的青少年,只要有一臺搭載顯卡的計算機就能輕松地部署 ChatGLM-6B,可以盡早了解并學會應用大模型這一基礎技術。
個人覺得,"ChatGLM-6B+GLM-130B" 的組合模式給 AI 大模型產業落地提供了一個新的范式:輕量級大模型扮演普惠的角色,讓更多人輕松 " 入門 ",學習、理解、熟悉大模型技術,進行創新應用的開發、驗證、測試等。到了應用階段,如有必要再使用 GLM-130B 這樣的千億級工業化大模型部署產品,面向客戶與用戶提供商業化服務。
寫在最后:
AI 大模型技術掀起新一輪產業革命,人類社會的生產力、生產資料與生產關系都將被重新定義,人們的生活與工作方式、企業的經營模式以及社會的治理方式都在被重構。在這樣的大變局下,AI 大模型已成為 " 國之重器 "。
在技術浪潮涌來時,國際形勢正波詭云譎,大國競爭日益激烈,科技是核心角力場,不論是十四五規劃綱要還是二十大均明確要增強科技創新引領作用,實現高水平科技自立自強。在這樣的時代背景下,大模型成了跟芯片一樣的制高點,我國必須要有自己的底層大模型技術,更需要有自己的完整的大模型應用與產業生態。
這幾天,王小川與百度的口水戰在大模型行業引發熱議,其實爭論 " 我國大模型距離 ChatGPT 的差距究竟是 2 個月還是 2 年 " 沒什么意義,我國大模型技術距離 GPT 還有客觀的差距,推動大模型技術精進和產業落地,是大模型玩家們的責任,行業更需要 ChatGLM-6B 這樣的可落地的解決方案,它大幅降低了 AI 開發門檻,未來還可結合低代碼等技術實現 " 人人都會大模型開發 ",這才是 AI 大模型技術普惠的必經之路,也是我國 AI 大模型實現趕超的關鍵。
在官方博客上,ChatGLM 團隊有一段樸素的文字:" 我們一直在探索、嘗試和努力,GLM 系列模型取得了一絲進展,但我們離國際頂尖大模型研究和產品(比如 OpenAI 的 ChatGPT 及下一代 GPT 模型)都還有明顯差距。中國大模型研究在原創算法、AI 芯片和產業上的追趕與突破需要大家的一起努力,更需要我們對下一代 AI 人才的培養與鍛煉。很幸運的是,GLM 團隊在過去幾年探索的過程中,有一群有情懷、有能力、有格局的年輕人加入我們并肩作戰,快樂開卷,大家一起焦慮,一起熬夜,一起成長,一起創造。通用人工智能探索,我們一直在路上,努力前行。"
我覺得還是很扎心的。大模型熱潮中,渾水摸魚、蹭熱點、搞炒作的玩家不少,但也有一些腳踏實地的團隊正在研發大模型技術,想方設法在推動大模型落地,只爭朝夕地追趕先行者,他們,值得被尊敬。
責任編輯:hnmd003
相關閱讀
-
世界快報:大模型掀起諸神之戰,我們更需要人人可用的“普惠模型”
大模型行業越來越熱鬧。國外,馬斯克為Twitter搶購1萬塊GPU籌備大模型項目、亞馬遜大力投資大型語言模型...
2023-04-17 -
環球快消息!2304 分區 4K 高刷 HDMI2.1 全能電競 MiniLED 顯示器創維 F27G60U 評測
在電競顯示器市場上,亮度更高、色彩表現優秀、壽命更好、高刷新的MiniLED顯示器無疑是高端的代表,而關...
2023-04-17 -
今日播報!Statter Labs 發布元宇宙產業應用平臺
品玩4月17日訊,據36氪報道,專注元宇宙技術開發的StatterLabs于美東時間4月16日宣布上線元宇宙產業應用...
2023-04-17 -
見過 iPhone、iPad、iWatch:來了解一下“ iCAR ”_焦點快報
見過iPhone、iPad、iWatch,你知道iCAR嗎?沒錯,它就是奇瑞汽車4月7日發布的全新智能電動汽車品牌——i...
2023-04-17
相關閱讀
-
世界快報:大模型掀起諸神之戰,我們更需要人人可用的“普惠模型”
大模型行業越來越熱鬧。國外,馬斯克為Twitter搶購1萬塊GPU籌備大模型項目、亞馬遜大力投資大型語言模型...
-
環球快消息!2304 分區 4K 高刷 HDMI2.1 全能電競 MiniLED 顯示器創維 F27G60U 評測
在電競顯示器市場上,亮度更高、色彩表現優秀、壽命更好、高刷新的MiniLED顯示器無疑是高端的代表,而關...
-
甚囂塵上“寒冬論”,手機行業的偽命題-環球最新
在中國手機市場的狂飆時代,叫得上名字的手機品牌可能達到幾十家甚至達百家。周周有新品,月月有新機,...
-
加碼布局中國市場,中東富豪們開啟 A 股“買買買”模式,卻也對北新建材、健康元等出手減持
財聯社4月17日訊(記者吳雨其)國內機構不斷布局海外資產的同時,其他國家的主權基金也正瞄準A股市場。2...
-
當前動態:北京兩宗地塊土拍規則升級:同一集團成員企業不得參拍同一地塊
北京兩宗地塊土拍規則升級:同一集團成員企業不得參拍同一地塊2023-04-1716:00:24來源:央廣網北京兩宗...
-
世界觀焦點:太平洋金福人生終身壽險值得買嗎?有哪些優勢?
對于有需求的朋友來說,是值得買的。 太平洋金福人生終身壽險的保障期限是終身是一款壽險,只要投保人...
-
當前速遞!人壽全家福保險介紹怎樣?值得購買嗎?
人壽全家福保險是一款給全家人提供保障的保險。這款保險的投保年齡范圍是出生滿28天到65周歲的人群,所...
-
眾安百萬醫療險騙局揭秘有哪些?可以買嗎?
眾安保險理賠的時候需要的資料是非常多的,遠比他們宣傳時所說的要多得多,而且很多情況都不在理賠的范...
-
世界速訊:廣州新房成交高位回落,開發商積極推貨備戰“五一”小長假
樓市小陽春漸入尾聲,廣州樓市走出“高開低走”行情。對此,開發商營銷人士感受頗深。在廣州本地房企從...
-
人壽生存金是什么意思?要怎么領取?
人壽生存金指的就是當大家在買了保險以后,在約定的時間就可以領取生存金,前提是大家在這個時候,必須...
-
宜脈相承終身壽險怎么樣?可以提供哪些保障?
一款正規的保險,保障比較全面。 這款保險是由信美人壽相互保險社所承保的,雖然說成立的時間并不是很...
-
日本電子游戲巨頭世嘉颯美控股擬收購《憤怒的小鳥》開發商Rovio
智通財經APP獲悉,日本電子游戲巨頭世嘉颯美控股(SegaSammyHoldingsInc )周一表示,該公司正在考慮收購...
-
iCAR品牌之夜盛大啟幕 入局新能源智能化賽道
iCAR品牌之夜盛大啟幕入局新能源智能化賽道4月16日,以“HiiCAR”為主題的iCAR品牌之夜盛大舉行。奇瑞汽...
-
視訊!星途攜星紀元STERRA系列等車型亮相上海
星途星紀元STERRA系列重磅發布,旗下星紀元STERRAES、星紀元STERRAET,以及奇瑞第三代混動技術首發車型...
-
全國高速貨車累計通行量環比增長13.96%|焦點消息
最新數據顯示,4月10日—16日,國家鐵路貨運繼續保持高位運行,累計運輸貨物7539 2萬噸,環比增長2 15...
-
國家安全部開通國家安全機關監督舉報平臺
國家安全機關堅決落實全面從嚴管黨治警政治責任,堅持自我革命與群眾監督相結合,近日面向全社會開通了1...
-
【世界聚看點】前雷克薩斯高管加盟極氪汽車
前雷克薩斯高管SpirosFotinos加盟中國汽車品牌極氪,主要負責極氪在歐洲的汽車業務。據悉,來自吉利旗下...
-
馬自達加速電動化轉型_環球速遞
近日,馬自達(中國)首次對外公布了電動化時代的轉型戰略和目標愿景,以及和長安汽車建立全新的合作模...
-
廣交會參展規模創新高,折射經濟動能強勁復蘇信號_環球要聞
第133屆廣交會于4月15日開幕,展會分三期舉辦,持續至5月5日,同時全年常態化運營線上平臺。本屆廣交會...
-
金佑人生終身壽險分紅型b款2017款怎么樣?要不要買?
金佑人生終身壽險分紅型B款2017是一款以保障為主,兼顧理財的保險產品。該產品的保障范圍包括身故保險金...
-
世界最資訊丨中國人壽推出的3萬一年交3年可以買嗎?靠譜嗎?
在考慮購買中國人壽推出的3萬元一年交3年的保險產品前,您需要根據自己的需求、預算和風險承受能力來評...
-
平安智盈人生萬能保險介紹是什么?怎么領取?:世界新要聞
平安智盈人生萬能保險,它的優勢是靈活多變,智盈人生是以萬能險+重疾險的保障方案進行保障,但隨著年齡...
-
全球快播:弘康人壽金玉滿堂2.0終身壽險在哪里買?怎么樣?
弘康人壽金玉滿堂2 0終身壽險在弘康人壽官網、各大保險公司官網均可購買。 購買時需要提供投保人和被保...
-
太平洋狀元紅兩全保險分紅型18歲能領本金嗎?怎么領取?
需要視具體情況而定。 太平洋狀元紅兩全保險分紅型產品的領取條件取決于具體的保單合同。通常情況下,如...
-
朱曉彤卸任特斯拉昆明公司法定代表人 仍任董事長:世界焦點
鳳凰網科技訊4月17日消息,據天眼查App顯示,近日,特斯拉汽車銷售服務(昆明)有限公司發生工商變更,...
-
感謝速通教育,也感謝自己,越努力越幸運!
面對突如其來的疫情,又重新對自己有了認知,覺的自己真的很渺小,想要做的事情有很多,但又很恐懼。好...
-
全聚德一季度扭虧為盈實現“開門紅”:環球看熱訊
根據全聚德日前發布的2023年一季度報告顯示,報告期內,全聚德實現營業收入3 20億元,同比增加49 39%...
-
世界關注:A股13份年報被非標背后:A股愈發謹慎
截至4月16日,滬深兩市有13家公司2022年年報被審計機構出具了非標意見。其中,1家公司被審計機構給出“...
-
最新快訊!國家網信辦等五部門:調整網絡安全專用產品安全管理有關事項
國家互聯網信息辦公室等五部門發布關于調整網絡安全專用產品安全管理有關事項的公告,自2023年7月1日起...
-
PGT技術成功阻斷銀羅素綜合征致病基因傳遞,誕生健康寶寶:新動態
近日,一名具有非凡意義的女嬰誕生了。據悉,這是國際上首次針對銀羅素綜合征(SRS3)開展PGT-M成功阻斷...
精彩推薦
閱讀排行
精彩推送
- 天天周報|茅臺Q1日賺2.3億;薇...
- 今日播報!Statter Labs 發布元...
- 九號公司徐鵬:主力產品價格不會...
- 見過 iPhone、iPad、iWatch:來...
- 能棄中國制造?蘋果攤牌:想讓印...
- iOS 17 重磅更新,6 年前神機...
- 魯陽節能12萬噸陶瓷纖維擴產項目...
- 內蒙古56名金融副村長赴魯“取經”
- 環球即時:業績爆雷!被投資者質...
- 熱點在線丨美國存款難尋容身之處...
- 焦點速訊:OPEC+ 減產利好油價...
- 2023三亞南山首屆華夏上古神獸創...
- 【當前獨家】學生保險有必要給孩...
- 國壽鑫享寶能不能買?靠不靠譜?
- 世界快看點丨支付寶的重疾險可靠...
- 眾安保險是否真實?有哪些險種?...
- 當前要聞:企業年金和補充養老保...
- 世界快訊:樂天派完成1900萬元天...
- 農夫山泉研發支出2.77億元
- 30年期國債期貨合約及相關業務規...
- 日本侵華獨家影像披露②丨清河車...
- 全球熱訊:上海:著力實體經濟 ...
- 世界新資訊:“ 12 個你不知道...
- 靈動萌顏,縱享絲滑,電視盒子就...
- 徐起:真我這機子京東手機總榜安...
- 手游股 IGG 月內漲超 83%!旗...
- 支付寶上線“付款碼隱私保護功能...
- 動態焦點:社保要交多少年?保險...
- 新華人壽是國企還是央企?分紅險...
- 怎么查醫保有沒有交?要交多少年...