30 個大模型，搶著落地

2023-07-08 22:07:43來源：ZAKER科技

在 2023 年上海人工智能大會（WAIC）逛一圈，如果你想找大模型廠商，無需思考——找人扎堆的地方就可以。

(資料圖片僅供參考)

作為國內 AI 界當之無愧的風向標，WAIC 這次的主題前所未有地清晰—— AI 大模型。本屆 WAIC 邀請超過 400 個企業參會，主辦方甚至特設了 AI 大模型展區，大模型參數在 10 億以上的 AI 廠商數量，就超過 30 家。

" 大模型太多了！如果有哪家 AI 公司不做大模型，都不好意思露面了。" 人聲鼎沸的大模型展區中，一位投資人對 36 氪如此感嘆。

無論是大廠還是垂直廠商，AI+ 多個行業解決方案已是標配。大模型展區宛如一個大型超市，專屬解決方案琳瑯滿目，陳列其中：大模型 + 云計算、大模型 + 金融、大模型 + 教育……

但火熱表象下，國內大模型產品 " 大同小異 " ——是 36 氪得到的普遍反饋。這既是技術發展初期的無奈，也同樣是一種理性的現實。

百度文心一言企業級平臺展區拍攝：36 氪

錯位

ChatGPT 火爆全球大半年后，如果說還有什么東西成為共識，" 先落地 " 可能算第二個。

AI 廠商再也不吹概念，迅速尋求在 B 端落地，這和 2015 年的 AI 浪潮全然不同。比如，騰訊云至今沒有公布通用大模型 " 混元 " 的進展，但在 6 月中旬先高調公布了 " 行業大模型 " 的路線，一口氣拋出 10 大行業超過 50 個解決方案。

這明顯是國內客戶更感興趣的方向。

在百度文心一言、阿里通義千問的展位上，" 企業級平臺 "、" 專屬大模型 " 被圍了里三層外三層，來詢問的企業客戶絡繹不絕。

一位文心一言員工告訴 36 氪，來咨詢的客戶，最關心的問題在于價格，其次是數據安全。" 都直接問賣多少錢，什么時候能開始用。"

但大模型私有部署和使用成本還是太高，再加上算力供不應求。大部分企業其實暫時很難用上大模型，這種錯位可能還要持續一段時間。

比如，阿里和騰訊如今都還是只定向邀約客戶使用，標準化的 API 服務還沒有全面開放。

一位外企 IT 從業者對 36 氪表示，他在日本的老板 " 很著急，很希望能盡快把大模型放到產品里，6 月專門來國內找 AI 大模型服務商，8 月還打算再來一趟。"

但在 WAIC 逛了一圈，上述從業者發現，現在的模型體量還是太大，部署太貴，" 我們還是希望先找一個小的切入點，比如用較小的模型做智能客服，嵌入到業務當中。"

另一位阿里云員工則告訴 36 氪，現在做一個行業或者專屬大模型，一般需要千萬級別以上的預算，更適合業務體量較大的央國企和大公司。" 部署成本比較高，我們也希望盡快把模型壓縮到大家能接受的水平。"

為了解決 " 貴 " 的問題，阿里云也在通過開源模型、做生態來補足。阿里發起的大模型開源社區 " 魔搭 "，就想做成一個大模型超市，陳列出更偏行業化的專屬模型，目前已經聚集了 900 多個 AI 模型。

大會上，阿里云也發布了新產品 " 魔搭 GPT"（ModelScopeGPT）。用戶通過輸入指令，可以一鍵調用其他的 AI 模型，用多個模型協同完成復雜任務，這也是降低大模型使用門檻的方式。

AI 落地難，大模型要再經歷一次

從年初業內驚嘆 ChatGPT 的涌現算起，AI 大模型的熱度也不過半年。國內 AI 廠商離 ChatGPT 仍有不短的距離，但隨著國內廠商迅速選擇落地，不少難點已經顯現。

本質上，AI 大模型訓練仍然昂貴，即便是大廠，也不可能不求回報地一直投入。這意味著，國內廠商剛開始做大模型，就面臨著更殘酷的生存考驗。搶著在行業落地，也是希望能盡快商業化，再投入到 AI 模型的開發和訓練中。

但資金只是入門券。搶先在行業落地，廠商們更多的是想搶占數據 " 高地 "。

如果是做模型是烹飪，數據好比是食材，大模型對高質量的 " 食材 " 需求更高。但在公開互聯網中，中文的高質量數據本就偏少，大模型廠商其實很難建立起數據壁壘。在國內廠商尚在追趕 GPT-3.5 的情況下，沒有誰能顯著拉開差距。

在很長一段時間中，數據會是更難的一環。一位頭部社交公司戰略人士告訴 36 氪，ChatGPT 出來后，公司團隊迅速就將國內大模型看了一遍，也都進行相應測試，" 但他們既沒有這個賽道的高質量數據，通用大模型能力又尚不足以支撐業務需求，測試下來，大家效果都一般般。"

為了拿到數據，一位大廠的大模型產品負責人對 36 氪表示，在其合作模式中，如果企業客戶愿意提供數據（越有行業屬性越好），他們愿意在商務權益上做出極大讓步，甚至愿意免費為提供數據的客戶部署大模型。

想要大模型順利落地到場景中，難度也絲毫沒有減小。

" 企業需要的，是在實際場景中真正解決某個問題，而不是在 100 個場景中解決了 70%-80% 的問題。" 騰訊云副總裁吳云聲在 WAIC 演講中表示。

問題在于，上一波以視覺識別（CV）為首的 AI 浪潮里，廠商們更先發展的是單點 AI 能力——比如用 AI 進行人臉識別，以 API 形式單次收費是更普遍的形式。但隨著技術走向同質化，AI 廠商們到后來只能開始做大項目、私有化部署。由于難標準化，賬其實很難算得過來。

將大模型用在業務里，AI 模型會和客戶的核心數據結合得更加緊密。這意味著，想要真正解決客戶最核心的業務問題，私有化必不可少，程度可能還會更深——廠商們也許需要幫助客戶，從頭對核心數據進行標注、訓練，再進行模型訓練。

談及私有化大模型的投入產出比，賬能算得過來嗎？騰訊副總裁、騰訊云智能負責人吳運聲對 36 氪坦承：" 從現在的時間節點上看的話，確實會有比較大的挑戰。"

如今，騰訊采取一種較為折中的辦法——上個月，騰訊推出面向文旅、政務、教育、金融等十大行業，超過五十個解決方案。相當于 " 前進半步 "，客戶并不需要從頭提供行業數據進行訓練。在這些模型的基礎上，客戶只需要加入自己的場景數據進行精調，就可以快速生成 " 專屬模型 "。

歸根到底，AI 大模型技術仍然在快速發展中，成本上的博弈其實尚無定論。大模型的核心技術，以及算法、芯片等上游產業鏈都在快速迭代，成本下降其實很快。以百度為例，百度在今年 3 月發布 AI 大模型，到了 5 月，調用文心一言的成本，就已經降低到剛發布時的 10%。

而在另一邊，AI 大模型會帶來更大的應用層機會，用戶付費意愿也會更高，這會帶來更大的收入增量。比如，近期行業里就冒出了不少針對營銷場景的 AI 產品，有了 AI 大模型加持后效果顯著，比如 AI 數字人——近期，不少數字人公司因此煥發新機，產品也迅速帶來公司收入提升。