區塊鏈是開啟人工智能大時代的關鍵變量
AI 大模型時代或已走向終局,前路未知
(資料圖)
2022 年 11 月 30 日,人工智能公司 OpenAI 推出了 AI 聊天機器人 ChatGPT,在短短兩個月的時間里,活躍用戶數突破一億,成為史上用戶數增長最快的消費級應用。ChatGPT 成功背后是 OpenAI 訓練的 1750 億參數模型 GPT-3。一時間 AI 大模型迅速成為時代焦點,微軟百億美元投資 OpenAI,谷歌、特斯拉、百度、阿里、小米等國內外互聯網巨頭在幾個月的時間內紛紛推出自己的 AI 大模型,OpenAI 迅速迭代出 GPT-4,幾乎每個月都至少有一家科技大公司入局訓練大模型,人工智能成為當前最炙手可熱的賽道。
然而就在這樣一個市場狂歡、科技巨頭紛紛 " 走火入模 " 的時刻,AI 大模型的領軍者,OpenAI,卻給市場澆了一盆冷水。2023 年 4 月 18 日在麻省理工學院的活動中,OpenAI 的 CEO Sam Altman 在演講中警告稱:"我們已經處在大模型時代的尾聲",并表示如今的 AIGC 發展中,將數據模型進一步做大,塞進更多數據的方式,已經是目前人工智能發展中最后一項重大進展,并且還聲稱目前還不清楚未來的發展方向何去何從。
如果拋開過熱的市場預期和浮躁的跟風模仿去分析問題的本質,Altman 對未來 AI 的發展方向是清晰而準確的。其說法側面道出了 OpenAI 乃至整個 AI 賽道參與者目前所面臨的現實困境:
1. 可用數據枯竭帶來的數據瓶頸
OpenAI 最早的語言模式是 GPT-2,于 2019 年公布,發布時就有 15 億參數,此后隨著 OpenAI 研究人員發現擴大模型參數數量能有效提升模型完善程度,真正引爆 AI 行業浪潮的 GPT-3.5 發布時,參數數量已經達到了 1750 億。但人類互聯網歷史上被保留下來的各種高質量語料,已經在 GPT-3 以及后續發布的 GPT-4 的學習中被消耗殆盡。大模型參數數量仍然可以繼續膨脹下去,但對應數量的高質量數據卻越來越稀缺,因此增長參數數量帶來的邊際效益愈發降低。
2. 算力爆炸導致邊際收益遞減帶來的經濟效益瓶頸
AI 三大核心要素是數據、算法和算力,而算力的發展是最為迅速的一環。2020 年 OpenAI 就發布分析報告,從 2012 年開始,AI 訓練所用的計算量呈現指數增長,平均每 3.43 個月便會翻倍,遠高于摩爾定律的 18 個月翻倍的速度。大模型正是在這一背景下誕生的。依托飛速發展的算力,簡單粗暴地堆砌參數是提升模型能效的捷徑。機器學習先驅 Richard S. Sutton 著名的文章《苦澀的教訓》里開篇就曾說道:"70 年的人工智能研究史告訴我們,充分利用計算能力的一般方法最終是最有效的方法。"OpenAI 秉承這一簡單甚至原始的理念,3 年內將模型參數從 15 億(在當時這已經是一個天文數字)提高到 1750 億,足足拉高了 116 倍。
參數的爆炸式增長帶來的直接后果就是模型成本的指數級上升。2019 年以前,人工智能還是個百家爭鳴的大眾賽道,而大模型帶來的投入成本門檻迅速把這個賽道變成了資本聚集、大廠統治的游戲。據業界估計,GPT-3 僅訓練一次的費用就高達 500 萬美元,行業估計 GPT-4 的研發加運營成本突破數億美元。
在如此高昂的成本之下,AI 如何商業化落地成為業界難題。盡管 GPT-4 已經表現出了較高的智能化水平,但其局限性也很明顯。支持大規模商業化應用所需要的是 GPT-X,即模型的場景化和快速更新。面對極度高昂的訓練成本,難以形成充分的市場化競爭,類似 OpenAI 這樣的市場寡頭也面臨投入成本邊際效應遞減嚴重的問題,缺乏持續研發迭代的經濟激勵。這正是 Altman 所說的 " 大模型已至終局 " 而前路未知的根本原因。3. 數據合規、隱私保護、AI 倫理層面的風險不確定
AI 的道德風險始終是行業發展中不可規避的話題。在 GPT-4 發布幾日內,特斯拉首席執行官埃隆 · 馬斯克在內的 1748 人簽署公開信,呼吁暫停訓練比 GPT-4 更強大的人工智能系統至少 6 個月,以評估潛在的 AI 道德風險。與此同時,專注于人工智能技術倫理的 AI 和數字政策中心(CAIDP)要求美國聯邦貿易委員會(FTC)調查 OpenAI 是否違反了消費者保護規則,認為其推出的 AI 文本生成工具 " 存在偏見、具有欺騙性,并且對公共安全構成風險 "。3 月 31 日,意大利國家隱私監管機構正式下令封禁 ChatGPT,并指控 OpenAI「非法收集個人數據」。值得注意的是,該「臨時禁令」將一直生效,直到 OpenAI 能夠尊重歐盟具有里程碑意義的隱私法——通用數據保護條例(GDPR)。
基于價值互聯網的 AI 新時代三范式
當一項顛覆性技術陷入瓶頸期時,往往需要另一項更加具有顛覆性的技術的介入來突破瓶頸。區塊鏈技術和人工智能作為 21 世紀數字化技術突破的代表,一直處于平行發展但偶爾交叉的狀態。關于區塊鏈與人工智能的結合業界多有討論,但大多只停留在表層,例如區塊鏈為 AI 提供分布式數據治理,AI 為區塊鏈提供智能化自動執行工具。但隨著兩項技術的快速迭代發展,各自領域均不斷涌現出突破性應用,二者結合所帶來的想象空間其實是被遠遠低估的。
在應用層面,區塊鏈技術發展的速度要遠遠領先于人工智能。它所創造出的最輝煌應用,就是 Web3。
Web3 是下一代價值互聯網由區塊鏈特有的激勵機制打造的數字資產應用為 Web3 賦予萬億美元經濟價值,成為數字時代的新經濟體。Web3 是數據所有權的變革,而數據要素是 AI 的核心生產力。這一內生聯系使區塊鏈和人工智能產生了巨大的交互空間,而這交互的核心就是數據要素化。數據要素化包含確權、加工和共享三個核心環節,在數據確權層面,區塊鏈提供用戶與建設者擁有并信任的互聯網基礎設施;在數據加工層面,區塊鏈構建安全可信的價值互聯網;在數據共享層面,區塊鏈創造用戶與建設者共建共享的新型經濟系統。以數據為核心,區塊鏈可為 AI 發展提供技術底座、經濟模型和商業化場景。在此我們提出基于價值互聯網的 AI 新時代三范式:
(一)支撐 AI 生產力的是去中心化數據基礎設施
數據是數字時代的生產要素,也是 AI 的核心生產力。OpenAI 發布 ChatGPT 之后,百度迅速發布 " 文心一言 ",但對比之下效果卻不甚理想。很多人說原因是 GPT 的語料庫是全球互聯網,而 " 文心一言 " 的是百度知道和百度貼吧。這當然是言過其實的調侃,但深思其背后的邏輯卻是成立的,即大模型的成功依賴于數據來源的廣度和開放度。僅從一兩個平臺獲取數據進行訓練,必然只會做出有 " 偏見 " 的模型。
ChatGPT 在這一點上做得很好,依靠互聯網的開放度盡可能多地收集了數據,但其主要來源仍然是中心化的數據平臺,這也是 Web2 互聯網范式下的數據困境,它會在數據應用層面帶來兩大問題:
1. 數據源枯竭
依賴中心化平臺所產生的數據無法保證有穩定持續的數據源來訓練升級模型。Altman 提到的互聯網語料已被 GPT 窮盡只是問題的冰山一角。更嚴重的問題是,缺少數據激勵會導致新的優質數據越來越少,甚至出現 AI 無數據可用的問題。
讓我們想象這樣一個場景。如果說 ChatGPT 逐漸完善成為唯一的知識平臺,Quora、Stackoverflow、知乎等一眾知識平臺必將失去生存空間,而它們卻又是 ChatGPT 訓練的主要數據來源,那未來的 ChatGPT 又要用什么數據來訓練呢?
2. 數據質量低下
對于 AI 來說,平臺有自己的應用場景,不會考慮 AI 訓練的需求。平臺不會對所謂的 " 數據質量 " 做審核,例如知乎上分享的不一定是知識,也可能是剛編的故事。同時根據不同平臺的使用人群不同還會產生內容偏見。這也是為什么 ChatGPT 經常會給出一些明顯錯誤甚至荒謬的回答。
以上問題的核心是平臺數據并沒有完成數據要素化。用戶作為數據的生產者無法對數據進行確權,導致數據全部歸平臺所有;平臺作為數據的加工者缺乏激勵,不會對數據進行應有的加工;模型公司作為數據的使用者與數據生產加工環節嚴重割裂。而去中心化數據基礎設施正是這些問題的解決方案。在《區塊鏈托管重塑數據要素權益分配機制》一文中,我們提到了 Web3 是數據要素革命,是數據主權的 " 還數于民 "。在 AI 新時代里,去中心化數據基礎設施將為 AI 模型提供全生命周期數據解決方案,包括:
1)數據確權:用戶數據通過自主數字身份確權,數據生產者直接參與模型建設周期并獲得對等激勵;
2)數據加工:數據加工者(例如模型數據標注、數據質量評價)通過去中心化數據基礎設施參與模型建設并獲得對等激勵;
3)數據共享:數據生產者通過去中心化數據托管共享數據給數據使用者(例如建模公司),建模公司可以通過智能合約自動化數據獲取和建模流程,實現快速模型升級。
(二)支撐 AI 商業化的是 DataFi
Web3 的成功在于區塊鏈技術所提供的優秀激勵模型和可持續的經濟系統。去中心化金融(DeFi)已經創造出了繁榮的數字經濟生態和萬億美元的市場價值,以數據資產為核心的數據金融(DataFi)將成為支撐 AI 商業化的全新商業模式。
在 DataFi 中,數據作為生產要素會實現通證化。數據的產生、加工、存儲和使用都會依照去中心化經濟模型自主產生或消耗數據資產通證。數據循環會被充分激勵并產生凈價值。AI 模型的全生命周期都會以一種更加分布式的形式呈現,包括去中心化算力供應商、去中心化數據標注和基于去中心化數據基礎設施的數據托管服務商。模型訓練不再具有高門檻。
在 DataFi 中,數據通證會創造出以數據資產為核心的衍生品交易市場。AI 生態參與方可以充分挖掘自身的數據價值或服務價值,參與以數據資產為核心的金融衍生品交易、質押、抵押貸款等創新金融服務。數據資產的使用效率得到充分釋放。
(三)支撐 AI 規范性的是分布式數字身份
除了上文提到的數據確權,分布式數字身份也將成為支撐 AI 合規發展的關鍵監管技術。分布式數字身份為用戶賦予了數據自主權,打破數據控制者對數據的天然壟斷,也提升了用戶在算法面前的自主權。在 AI 新時代中,分布式數字身份包含三個主要應用場景:
1. 用戶分布式數字身份
用戶通過分布式數字身份參與 AI 構建周期,通過數據確權和自主數據主權保護數據隱私,并實現對等數據激勵。在合規層面,通過分布式數字身份為用戶提供了 100% 的數據主權,用戶對自己的隱私數據擁有完全控制權,能夠自主決定數據的披露對象和使用場景,并且結合零知識證明等技術,實現最小化隱私披露,天然符合《數據安全法》《個保法》的相關規定。通過將個人作為數據共享的載體,是《個保法》中個人信息可攜帶權的體現,結合自主身份使得個人數據可以遵從本人意愿向數據使用方(例如建模公司),嚴格符合 GDPR 等國際數據共享法律法規。
2. 模型分布式數字身份
在 AI 新時代中,模型獨立且唯一的數字身份。用戶可以通過數字身份像選擇商品一樣選擇模型,并且通過模型數字身份解決使用量證明、版權糾紛和版本管理等問題。
3. 數字人和 AIGC 分布式數字身份
對于 AI 構建出來的實體(例如數字人)頒發唯一數字身份,并在法律層面規范其標準與權利范圍,實現 AI 的合規和可控。
基于分布式技術的強 AI 時代藍圖
理查德 · 費曼(Richard Feynman)在 1985 年的一次講座中第一次提出了 " 強人工智能 " 的概念,為我們描繪了一個全知全能的 AI 時代。后世人們不斷討論這個概念,但對強 AI 的具體定義和未來圖景眾說紛紜。斯蒂芬 · 霍金將強 AI 稱為對人類的最大威脅,馬斯克稱研究強 AI 就是在 " 召喚魔鬼 ",但人類仍然對它趨之若鶩。有人說是因為結束人工智能研究則意味著放棄了改善人類狀況的機會,也就是使人類文明更加美好或者維持下去的機會。那么如果采用了區塊鏈技術,強 AI 時代藍圖會有什么不同?
強 AI 時代不是指一個全知全能的 AI 出現,而是無數個 AI 的產業大繁榮。區塊鏈使產業高度去中心化,每一個個人都可以同時成為模型的使用者和訓練方。每一個模型都擁有自己的數字身份,高度智能也相互獨立。模型的使用場景高度細化,使用方式由智能合約定義。
強 AI 時代模型訓練成本極低而迭代速度極快。通過去中心化網絡串聯模型全生命周期參與方,數據使用效率達到極致。在很多業務場景,模型可以根據實時業務需求實現毫秒級生成和毫秒級迭代,一次性模型成為可能," 模型流 " 成為模型主流應用方式。
強 AI 時代控制權通過數據綁定在人類手中。Web3 實現數據自主擁有,AI 可以自迭代算法,但數據所有權牢牢掌握在人類手中。"AI 控制人類 " 的末世傳說不會實現。
本文系未央網專欄作者 :汪德嘉 發表,內容屬作者個人觀點,不代表網站觀點,未經許可嚴禁轉載,違者必究!
責任編輯:hnmd003
相關閱讀
相關閱讀
-
區塊鏈是開啟人工智能大時代的關鍵變量
AI大模型時代或已走向終局,前路未知2022年11月30日,人工智能公司Open
-
拆解報告:HONOR 榮耀 100W 超級快充充電器 HN-200500C05
前言本次拆解的是一款榮耀的100W超級快充充電器,這款充電器為白色機身
-
每日訊息!普里戈任發表錄音講話:瓦格納7月1日停止運作
俄羅斯雇傭兵組織瓦格納集團(WagnerGroup)首腦普里戈任(YevgenyPrig
-
極兔,只用一天躋身中國快遞前五 快播
作者|Eastland頭圖|ICphoto2023年6月16日,港交所官網披露了極兔速遞
-
即將消失的匿名社交
圖片來源:視覺中國知乎與億歐創始人黃淵普的糾紛折射出匿名社交的困境
-
北京體育局發警示提醒,為孩子暑期校外體育培訓支招
為保障孩子們度過一個安全愉快的暑假,2023年6月21日,北京市體育局發
-
天天速訊:西藏開展青少年禁毒實踐教育體驗進校園活動
在“6·26”國際禁毒日之際,由共青團西藏自治區委員會主辦,西藏青少
-
西藏羌塘野生動物樂園 藏羚羊悠然自得
近日,在羌塘國家級自然保護區那曲片區,野保員在巡邏中,用第一視角記
-
世界微速訊:西藏普通高等學校招生錄取最低控制分數線公布 對成績有異議 可于6月28日18:30前申請復查
6月26日,記者從西藏自治區教育考試院獲悉,經自治區招生考試委員會6月
-
西藏山南市交通運輸事業發展亮點紛呈:大道縱橫天地闊-天天最新
國道219隆子機場改線工程建成通車,國道349線和省道509線大中修工程全
-
半年線是多少天?半年線年線怎么顯示出來?
半年線是多少天?半年線是指120天線。是按照股市120個交易日收盤點數相加的總和除于120而來。在日常觀察K...
-
建行手機銀行怎么轉賬?建行手機銀行一天可以轉賬多少錢?
建行手機銀行怎么轉賬?首先打開建行手機客戶端,登錄賬號。點擊轉賬匯款。選擇我要轉賬。輸入收款戶名、...
-
個人所得稅可以抵扣房貸嗎?多少工資要交個人所得稅?
一、多少工資要交個人所得稅個人所得稅的起征點是5000元,如果個人收入超過5000元就要繳納個人所得稅。...
-
大宗交易制會為市場帶來哪些方便?為什么會有大宗交易制度?
大宗交易,又稱為大宗買賣。一般是指交易規模,包括交易的數量和金額都非常大,遠遠超過市場的平均交易規...
-
媒體:高考滿屏高分是錯覺和誤導!高考滿分多少分?
媒體:高考滿屏高分是錯覺和誤導!又到高考放榜時,各種查分短視頻再度刷屏。沖上熱搜的可謂個個高分,700...
-
三無產品賠償標準是怎樣的?產品質量法第五十四條規定內容是什么?
一、什么是三無產品(三)無產品一般是指無生產日期、無質量合格證以及無生產廠家,來路不明的產品。另一...
-
中華人民共和國憲法第三條的內容是什么?中華人民共和國的一切權力屬于人民
我國制定憲法的主體是人民,因為中華人民共和國的一切權力屬于人民。全體人民享有制憲權,是制憲主體,...
-
持倉均價是什么意思?持倉均價怎么計算?
持倉均價是什么意思?持倉均價是指投資者前一日持有的投資品種的結算價,也就是投資者前一交易日持有的投...
-
什么國際貿易術語?貿易術語在國際貿易中起著積極的作用主要表現在哪幾個方面?
國際貿易術語可以劃分為13種,分別是工廠交貨(EXW)、貨交承運人(FCA)、船邊交貨(FAS)、船上交貨(FOB)、...
-
淘寶車險怎么買?在淘寶上買車險靠譜嗎?
淘寶車險怎么買?點擊淘寶平臺。找到登陸口,進行登陸操作。找到登陸口后,輸入淘寶賬號 與密碼,點擊登陸,...
-
應稅車輛的計稅價格按照哪些規定確定?車輛購置稅的免稅、減稅的范圍是什么?
一、購置稅如何計算,計算方式有哪些購置稅的計算:汽車購置稅的計算公式是:應納稅額=計稅價格×...
-
從有序用電到負荷管理 發生了什么?_當前播報
從有序用電到負荷管理發生了什么?上月,國家發改委同時印發了兩份管理
-
大盤怎么看?大盤是誰操作的漲跌?
大盤怎么看?1 上證指數前面我們說了,看大盤,必看上證指數,上證指數我們主要利用技術分析進行判斷,...
-
年假的計算方法和時間怎樣的?帶薪休假的享有范圍是什么?
一、年假的計算方法和時間是怎樣的(一)年假的計算從請假的當日起算,不包含節假日。(二)年假的時間:1、...
-
如何購買指數基金?指數基金和ETF基金區別
如何購買指數基金?①選擇標的指數:目前我國可供參照的指數主要有上證指數,深證成指,上證180指數,上...
-
三種利率的換算公式是什么?年利率一般是怎么計算的?
年利率一般指的是一年的存款利率表或者貸款利率。其中年利率會牽涉到一個利息率的問題,而這個利息率就...
-
以年為計息周期進行計算的利息是什么?年利率和年化收益的區別和聯系是什么?
年利率是以年為計息周期進行計算的利息,簡單理解就是指一年的存款利率。年利率、月利率和日利率相互之...
-
銀證轉帳有限額嗎?銀證轉帳時間
銀證轉帳有限額嗎?沒有,銀證轉賬是通過綁定的銀行卡進行轉賬的,當天轉入的當天可以轉出,要注意的是當...
-
印花稅計稅依據是否包含增值稅?2019印花稅計稅金額為多少?
一、印花稅的計稅依據怎么算按金額比例貼花的應稅憑證,未標明金額的,應按照憑證所載數量及國家牌價計...
-
離職原因怎么寫?離職申請書怎么寫?
一、離職原因怎么寫(一)以家庭原因辭職的理由1、家里孩子太小,離不開。2、家里準備蓋房子。3、家里莊稼...
精彩推薦
閱讀排行
精彩推送
- 怎么辦理基金定投?基金定投有手...
- 公司注冊的法律依據是什么?企業...
- 工商銀行增額終身壽險靠譜嗎?如...
- 百萬醫療豁免保費什么意思?一般...
- 世界動態:百萬醫療得交多少年?...
- 乳腺結節不能買百萬醫療嗎?買百...
- 百萬醫療險如果意外身亡會理賠嗎...
- 我國現行憲法有五個修正案具體包...
- 景區回應“樂山大佛被賣”!樂山...
- 微速訊:【國際快訊】特斯拉Q2交...
- 【新要聞】寶沃靠不住,小米要自...
- 時訊:G6向卷而生與小鵬汽車的二...
- 全球關注:本田CR-V插混全系降2...
- 上汽集團官方回應“MG印度公司喪...
- 流動資金是什么意思?流動資金包...
- 農村宅基地的賠償方式是什么?結...
- 天天新動態:共享單車不文明騎行...
- 護航未成年人成長|市少先隊校外...
- 陳鴻福:“畫”好城市節水藍圖 ...
- 最愛包頭綠
- 青山區開展防汛應急處突演練-世...
- 什么是創業板股票?688和300開頭...
- 我懷著孕男方出軌了怎么辦?民法...
- 社會保險法第十六條的內容是什么...
- 高速免費通行的時間范圍是怎么樣...
- 股票底部特征怎么形成的?怎樣判...
- 6月26日基金凈值:交銀經濟新動...
- 銀行利息稅是什么意思?銀行利息...
- 長沙同寢兩考生成績被屏蔽!高考...
- 【新要聞】B 站陳睿:將以視頻...