首頁 > 新聞 > 智能 > 正文

30 個大模型,搶著落地

2023-07-08 22:07:43來源:ZAKER科技  

在 2023 年上海人工智能大會(WAIC)逛一圈,如果你想找大模型廠商,無需思考——找人扎堆的地方就可以。


(資料圖片僅供參考)

作為國內 AI 界當之無愧的風向標,WAIC 這次的主題前所未有地清晰—— AI 大模型。本屆 WAIC 邀請超過 400 個企業參會,主辦方甚至特設了 AI 大模型展區,大模型參數在 10 億以上的 AI 廠商數量,就超過 30 家。

" 大模型太多了!如果有哪家 AI 公司不做大模型,都不好意思露面了。" 人聲鼎沸的大模型展區中,一位投資人對 36 氪如此感嘆。

無論是大廠還是垂直廠商,AI+ 多個行業解決方案已是標配。大模型展區宛如一個大型超市,專屬解決方案琳瑯滿目,陳列其中:大模型 + 云計算、大模型 + 金融、大模型 + 教育……

但火熱表象下,國內大模型產品 " 大同小異 " ——是 36 氪得到的普遍反饋。這既是技術發展初期的無奈,也同樣是一種理性的現實。

百度文心一言企業級平臺展區 拍攝:36 氪

錯位

ChatGPT 火爆全球大半年后,如果說還有什么東西成為共識," 先落地 " 可能算第二個。

AI 廠商再也不吹概念,迅速尋求在 B 端落地,這和 2015 年的 AI 浪潮全然不同。比如,騰訊云至今沒有公布通用大模型 " 混元 " 的進展,但在 6 月中旬先高調公布了 " 行業大模型 " 的路線,一口氣拋出 10 大行業超過 50 個解決方案。

這明顯是國內客戶更感興趣的方向。

在百度文心一言、阿里通義千問的展位上," 企業級平臺 "、" 專屬大模型 " 被圍了里三層外三層,來詢問的企業客戶絡繹不絕。

一位文心一言員工告訴 36 氪,來咨詢的客戶,最關心的問題在于價格,其次是數據安全。" 都直接問賣多少錢,什么時候能開始用。"

但大模型私有部署和使用成本還是太高,再加上算力供不應求。大部分企業其實暫時很難用上大模型,這種錯位可能還要持續一段時間。

比如,阿里和騰訊如今都還是只定向邀約客戶使用,標準化的 API 服務還沒有全面開放。

一位外企 IT 從業者對 36 氪表示,他在日本的老板 " 很著急,很希望能盡快把大模型放到產品里,6 月專門來國內找 AI 大模型服務商,8 月還打算再來一趟。"

但在 WAIC 逛了一圈,上述從業者發現,現在的模型體量還是太大,部署太貴," 我們還是希望先找一個小的切入點,比如用較小的模型做智能客服,嵌入到業務當中。"

另一位阿里云員工則告訴 36 氪,現在做一個行業或者專屬大模型,一般需要千萬級別以上的預算,更適合業務體量較大的央國企和大公司。" 部署成本比較高,我們也希望盡快把模型壓縮到大家能接受的水平。"

為了解決 " 貴 " 的問題,阿里云也在通過開源模型、做生態來補足。阿里發起的大模型開源社區 " 魔搭 ",就想做成一個大模型超市,陳列出更偏行業化的專屬模型,目前已經聚集了 900 多個 AI 模型。

大會上,阿里云也發布了新產品 " 魔搭 GPT"(ModelScopeGPT)。用戶通過輸入指令,可以一鍵調用其他的 AI 模型,用多個模型協同完成復雜任務,這也是降低大模型使用門檻的方式。

AI 落地難,大模型要再經歷一次

從年初業內驚嘆 ChatGPT 的涌現算起,AI 大模型的熱度也不過半年。國內 AI 廠商離 ChatGPT 仍有不短的距離,但隨著國內廠商迅速選擇落地,不少難點已經顯現。

本質上,AI 大模型訓練仍然昂貴,即便是大廠,也不可能不求回報地一直投入。這意味著,國內廠商剛開始做大模型,就面臨著更殘酷的生存考驗。搶著在行業落地,也是希望能盡快商業化,再投入到 AI 模型的開發和訓練中。

但資金只是入門券。搶先在行業落地,廠商們更多的是想搶占數據 " 高地 "。

如果是做模型是烹飪,數據好比是食材,大模型對高質量的 " 食材 " 需求更高。但在公開互聯網中,中文的高質量數據本就偏少,大模型廠商其實很難建立起數據壁壘。在國內廠商尚在追趕 GPT-3.5 的情況下,沒有誰能顯著拉開差距。

在很長一段時間中,數據會是更難的一環。一位頭部社交公司戰略人士告訴 36 氪,ChatGPT 出來后,公司團隊迅速就將國內大模型看了一遍,也都進行相應測試," 但他們既沒有這個賽道的高質量數據,通用大模型能力又尚不足以支撐業務需求,測試下來,大家效果都一般般。"

為了拿到數據,一位大廠的大模型產品負責人對 36 氪表示,在其合作模式中,如果企業客戶愿意提供數據(越有行業屬性越好),他們愿意在商務權益上做出極大讓步,甚至愿意免費為提供數據的客戶部署大模型。

想要大模型順利落地到場景中,難度也絲毫沒有減小。

" 企業需要的,是在實際場景中真正解決某個問題,而不是在 100 個場景中解決了 70%-80% 的問題。" 騰訊云副總裁吳云聲在 WAIC 演講中表示。

問題在于,上一波以視覺識別(CV)為首的 AI 浪潮里,廠商們更先發展的是單點 AI 能力——比如用 AI 進行人臉識別,以 API 形式單次收費是更普遍的形式。但隨著技術走向同質化,AI 廠商們到后來只能開始做大項目、私有化部署。由于難標準化,賬其實很難算得過來。

將大模型用在業務里,AI 模型會和客戶的核心數據結合得更加緊密。這意味著,想要真正解決客戶最核心的業務問題,私有化必不可少,程度可能還會更深——廠商們也許需要幫助客戶,從頭對核心數據進行標注、訓練,再進行模型訓練。

談及私有化大模型的投入產出比,賬能算得過來嗎?騰訊副總裁、騰訊云智能負責人吳運聲對 36 氪坦承:" 從現在的時間節點上看的話,確實會有比較大的挑戰。"

如今,騰訊采取一種較為折中的辦法——上個月,騰訊推出面向文旅、政務、教育、金融等十大行業,超過五十個解決方案。相當于 " 前進半步 ",客戶并不需要從頭提供行業數據進行訓練。在這些模型的基礎上,客戶只需要加入自己的場景數據進行精調,就可以快速生成 " 專屬模型 "。

歸根到底,AI 大模型技術仍然在快速發展中,成本上的博弈其實尚無定論。大模型的核心技術,以及算法、芯片等上游產業鏈都在快速迭代,成本下降其實很快。以百度為例,百度在今年 3 月發布 AI 大模型,到了 5 月,調用文心一言的成本,就已經降低到剛發布時的 10%。

而在另一邊,AI 大模型會帶來更大的應用層機會,用戶付費意愿也會更高,這會帶來更大的收入增量。比如,近期行業里就冒出了不少針對營銷場景的 AI 產品,有了 AI 大模型加持后效果顯著,比如 AI 數字人——近期,不少數字人公司因此煥發新機,產品也迅速帶來公司收入提升。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀