首頁 > 新聞 > 智能 > 正文

激戰千億大模型,國產 chatgpt “五霸七雄”誰與爭鋒? 環球播報

2023-05-19 10:17:37來源:ZAKER科技  

在過去幾個月中,隨著 ChatGPT 在全球范圍迅速火爆,國內 AI 大模型賽道的熱度也隨之急速升溫。各路業界大神紛紛推出自己的大模型產品,八仙過海,各顯神通。


(資料圖片)

在過去幾個月中,隨著 ChatGPT 在全球范圍迅速火爆,國內 AI 大模型賽道的熱度也隨之急速升溫。各路業界大神紛紛推出自己的大模型產品,八仙過海,各顯神通。

誰將打造出比肩 ChatGPT 的中國人自己的 AI 應用?誰將成為中國的 Open AI?這兩個極具挑戰性的問題,不斷刺激著國內眾多互聯網大廠和科技大佬們的神經。同時,這兩個問題的提出,也預示著中國 AI 產業發展趨勢,已經從 1.0 版的 " 分封割據 " 期,邁入了 2.0 版的 " 戰國 " 時代。圍繞 " 大模型 " 的發布,國內 AI 界正在上演著一場 " 大混戰 "。

縱觀眼下國內涉足 AI 大模型賽道的玩家,如果按照已有相關產品落地的行業屬性來分,主要分為 " 互聯網界 " 和 "AI 科技派 " 這兩大流派。

所謂 " 互聯網界 ",指的是目前已經有具體產品的互聯網大廠,其中又以百度、阿里、騰訊、網易、京東這 5 家為代表。先是百度和阿里爭相推出各自的超大規模語言模型 " 文心一言 " 和 " 通義千問 ",并開放內測;后有騰訊、網易、京東也競相公開自家的大模型產品 " 混元 "、" 玉言 " 和 "ChatJD",且紛紛預告上線發布。由此,也成就了這 5 家互聯網企業大模型界 " 五霸 " 稱號。另外,知乎、網易、360 等一桿互聯網企業,也紛紛推出新品或研發計劃。

而與此相對應的則是 "AI 科技派 ",即以 AI 硬核科技企業為主的單位。它們也不甘寂寞,紛紛爭先恐后地推出自己的大模型方案和發展計劃。其中又以華為、商湯科技、科大訊飛、深蘭科技、昆侖萬維、出門問問、智源研究院這 7 家最具代表性。尤其是今年 4 月份集中爆發,如華為、商湯、深蘭科技、昆侖萬維、出門問問等科技企業分別推出了 " 盤古 "、" 日日新 "、 " 硅基知識 "、" 天工 " 和 " 序列猴子 " 大模型, 5 月初,科大訊飛也發布測試很久的 " 星火 " 大模型。因此,這 7 家科技企業也被業界譽為大模型界的 " 七雄 "。

由此,國內生成式 AI 領域的 " 大模型混戰 ",就此全面開打。

但如果換一個角度,我們發現今天國內 AI 企業界,除了分為 " 互聯網派 " 和 "AI 科技派 " 以外,還存在大模型開發的類型派系之爭。從以上這些企業推出的大模型來看,基于目標人群、用途和適用場景的不同,又可以分為通用和垂類兩種大模型開發企業。由此,也誕生了 " 通用派 " 和 " 垂類派 " 這兩大派采用不同大模型開發路線的企業群體。

其中,開發通用類大模型的企業,目的是為了做理論框架的搭建、大模型的訓練以及算法等,且這一類大模型的目標人群基本是針對所有人,適用范圍也很廣。說穿了,這一派做通用大模型的企業,就是在做通用 AI 的技術攻關,目的是為了打造中國版的 ChatGPT。

而開發垂類大模型的企業,則是以深度解決垂直領域問題為主,以產品開發為目的,即企業在自己擅長的領域開發一個產業版 ChatGPT,然后直接應用到自己的相關 AI 產品上,使該產品實現或增強某種功能。這一類大模型的搭建相較于通用大模型而言,在算力上的要求相對較低,但在數據量和算法上針對性會比較強。

由于在用戶群體規模體量和應用場景適用范圍上,通用大模型都要遠遠大于垂直應用類大模型,所以其開發周期和所需要投入繁榮財力、人力也遠高于垂直應用大模型。因此,目前國內做通用大模型的企業,基本上都是互聯網或科技大廠。像百度、阿里、華為等這些互聯網大廠和科技巨頭,就是屬于 " 通用派 " 系。

而就內容反饋數據來說,相較于通用大模型,垂直應用大模型生成的內容更符合特定垂直類場景的需求,質量更高。因此,也就吸引了眾多 AI 科技企業參與其中。如深蘭、出門問問、有道等聚焦 AI 具體賽道的企業,就是典型的 " 垂類派 " 企業。

就目前市場關注度而言,由于受 Open AI 成功開發 ChatGPT 并迅速走紅的影響,國內社會各界把目光大都集中到 " 通用派 " 企業和大模型上來,相反 " 垂類派 " 企業和產品卻受到了冷遇。

顯然,ChatGPT 的成功,正在潛移默化地引導著國內 AIGC 產業發展的走向。

那縱觀這些參戰的企業,到底誰能在這場 " 大模型混戰 " 中存活下來,并最后拔得頭籌?先后競相登場的那些大模型,它們的未來會是星辰大海,還是一地雞毛呢?下面我們就來盤點一下。

首先,來看目前市場上曝光率最高的大模型四巨頭 "BATH",即百度的 " 文心一言 "、阿里的 " 通義千問 "、騰訊的 " 混元 " 和華為的 " 盤古 "。這幾個大模型有以下幾個共同特點,那就是都布局了 NLP、CV、跨模態,適用范圍和對標人群都很廣,且都動用了海量數據參數進行了預訓練。

但這也導致了這四家的大模型同質性太強,應用上基本沒有區隔,正式進入市場后,非但難以發揮各自優勢,反而極易導致 " 內斗 ",就好比在一個 " 浴缸 " 里養了 4 條鯊魚,妥妥坐實了 "BATH" 之名。

然后,再來看市場上已公開的垂直應用大模型。這一類模型的特點是目前已經正式對外公開的不多,名氣也沒有 "BATH" 的響,且都不是獨立推出,而是附身于企業開發的某個具體 AI 產品上。如有道近期推出的自研教育場景下類 ChatGPT 模型 " 子曰 ",就是服務于 AI 口語老師和中文作文批改應用上的;而面向金融領域的 AI 企業百融云創,也將研發的與 ChatGPT 采用同源技術的智能語音機器人應用于金融行業的零售業務上;另外在 4 月 23 日舉行的全國工商聯物聯網委員會年會暨物聯網與人工智能高峰論壇期間,中新社報道深蘭科技開發的國內首款強化學習個人數字化產品 metamind 已經應用了自主知識產權的 " 硅基知識 " 大模型…這些都是 AIGC 大模型在垂直應用領域的成功案例。

從市場營銷角度來看,一個產品問世后,正確的市場手段是創造一個新的消費領域,以此避免自己陷入原有紅海市場的競爭。這對于 AIGC 大模型開發應用來說,也是完全適用的。因此,像 " 子曰 "、" 硅基知識 " 這一類產品技術的研發,可以說是在 AIGC 大模型實際應用上的一次突破創新。

而從另一方面來說,目前國內市場上所出現的大小廠都一窩蜂地去做類 ChatGPT 產品,對整個產業發展而言,并不是一個好的現象,只能說是脫實務虛,其中絕大多數企業應該是走不遠的。就以 "BATH" 這四巨頭而言,最終也很有可能陷入內耗式競爭。相反,企業如果能集中力量,聚焦某個具體應用領域,開發垂直應用大模型,也許會有意想不到的收獲。

就以 " 硅基知識 " 大模型為例,不同于傳統意義上的類 ChatGPT 大模型," 硅基知識 " 是專為深蘭個人數字化產品 Matemind 研發的,具備內容生成、記憶和發現三大功能,不僅能智能生成內容,還能將所生成的內容轉化為用戶個人記憶整體保存下來,作為 " 數字分身 " 基礎數據,以備未來生成新內容和延續個人 " 硅基生命 " 所需,有效解決了個人數字化所必需的數字分身在知識學習、積累和應用方面的問題。

簡單地說," 硅基知識 " 不僅實現了人生命的 " 數字化永生 ",還指出了一條人工智能產業發展的新路。透過 " 硅基知識 " 大模型這個案例,我們甚至可以說每一款垂直應用大模型,都是一盞點亮人工智能產業發展新方向的明燈。

自從進入 21 世紀以來,我們分別經歷了互聯網熱、電商熱、大數據熱……每一次熱潮開始,都會引得各方都爭先恐后地涌入,但潮水退去之后,就會發現當時那些蜂擁融入的弄潮兒們,絕大多數都不知所蹤,真正活下來的都是那些默默耕耘,在某個具體領域做出成績的企業。

那面對大模型混戰愈演愈烈的今天,中國企業應該如何參與其中?在我看來,做大模型既要看準大方向,也要瞄準小目標,切忌貪大求全,只有這樣才不至于重蹈以前那些失敗者的覆轍。

百度的李彥宏就曾表示,ChatGPT 作為一個通用模型,對于某些特定領域并不擅長,而大公司一般都從通用型產品開始做起,初期他們并不會特別關注某個細分垂直領域,但當你在某個細分領域內做到極致,你就會發現你的產品和所積累的用戶需求,很難被其他產品直接復制,此時你再去拓展應用領域,就會比較有競爭力。

錢學森在《系統工程論》提出這樣一個核心觀點,那就是做任何技術產品,都要從現有條件出發,不求單項技術的先進性,只求總體設計的合理性,充分利用現有資源;以總體設計負責對各個分系統的技術協調提升改造現有的工業技術。把這個理論放在大模型的開發上,一樣適用。大模型再厲害,也只是一項技術,它必須應用到具體產品上,才能發揮最大作用。因此一個企業做大模型,并不是做得越大越通用就越好,而是應該基于產品,聚焦在某個需求上,合理開發和利用,進而實現大模型在產品中功能的最大化。

不跟風,堅持做自己,保持一顆平常心,這一點對所有涉足中國 AI 領域的企業來說,都尤為重要,無論你是否參與了這場混戰。

做 AIGC 大模型本身就不是一場百米賽,而是一場馬拉松,比拼的不是看誰眼前跑得快,而是看誰今后走得遠。無論是百度、阿里、騰訊這些互聯網巨頭,還是商湯、科大訊飛、出門問問、深蘭科技這些 AI 賽道能手,誰能走到最后,關鍵還是看誰現在的做法對頭。

因此,有必要在這里潑潑冷水,讓大家都冷靜冷靜,千萬不要盲目跟風,被 ChatGPT 引燃的這股通用大模型 " 虛火 ",給引火燒了身。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀