首頁 > 新聞 > IT資訊 > 正文

跟大廠“GPT”搶時間的昆侖商湯們，到底在搶什么環球熱門

2023-04-12 13:30:22來源：北京商報網

“大模型訓練一次就要花500萬美元”。

今年2月，原美團聯合創始人王慧文高調入局AI時，就曾因為5000萬美元的資金遭到過一陣“嘲諷”。

【資料圖】

兩個月過去了，這股始于ChatGPT的AIGC浪潮不僅沒有偃旗息鼓，反而愈演愈烈。越來越多的互聯網大佬下場創業，體量較小的企業也紛紛推出自己的大模型。圍觀者驚嘆，原來高投入的大模型從來都不只是“大廠之間的游戲”。

“諸神之戰”

一天之內，大模型領域迎來了三位重量級的嘉賓。

先是搜狗公司創始人王小川，一封公開信正式宣告了“百川智能”的誕生。據了解，百川智能旨在打造中國版的OpenAI基礎大模型及顛覆性的上層應用。

緊接著，兩家公司先后官宣。在當天的技術交流日上，商湯科技董事長兼CEO徐立展示了“日日新”體系下的語言大模型“商量”，據悉，這是一個1800億參數的中文大語言模型，可實現多輪對話、邏輯推理、語言糾錯、內容創作、情感分析等。

與此同時，昆侖萬維(300418)也表示，即將推出對標ChatGPT的雙千億級大語言模型“天工”3.5，并定于4月17日啟動邀請測試。當晚，昆侖萬維發布2022年年報，明確提到“未來10年將堅定的‘All in’AGI與AIGC”。

大模型成了這一輪AIGC浪潮的兵家必爭之地。百度“文心”、阿里“通義”、騰訊“混元”、京東“ChatJD”、華為“盤古”，傳統大廠無一掉隊。

垂直領域諸多企業紛紛入局，除商湯科技及昆侖萬維外，科大訊飛(002230)也在互動平臺表示，將于5月6日發布訊飛預訓練大模型的詳細信息，大模型將用于教育、翻譯等領域。

互聯網大佬們更不畏懼大模型的“從0到1”。公開報道顯示，王慧文的 “光年之外”A 輪融資后估值已達到10億美元，前商湯科技副總裁閆俊杰新公司MiniMax的首款大模型產品 Glow累計用戶已突破百萬。

華西證券研報總結了現有國產大模型的兩個特征：一是頭部廠商主導，To B為主要模式，賦能原有優勢業務；二是均未對公眾大面積開放，未有明確的ToC入口，實際水平不透明。

通用還是垂直

AIGC產業主要分為基礎和應用兩個層面，前者包含理論框架的搭建、大模型的訓練以及算法等，大投入、智力密集和長期性三個特點缺一不可。而后者主要是將別人開發出的東西與自己的業務進行整合，見效快，成本相對也較低。

而這也是當下中國AIGC企業押注的兩個方向，有人勢要成為中國的OpenAI，但也有人將目光瞄準了垂直領域的應用。

天使投資、資深人工智能專家郭濤表示，根據AI大模型應用范圍的不同，可以分為通用型大模型和產業型大模型，通用型AI大模型在企業級與消費級市場都擁有廣泛的應用場景，如OpenAI旗下的ChatGPT；而產業型的AI大模型主要應用于垂直行業或細分應用場景，如京東旗下的ChatJD。

“整體來看，通用型大模型應用場景相比產業型大模型更為廣泛，隨著規模化、多樣化應用場景的落地，促使算法模型快速迭代升級，不斷豐富和拓展新的應用場景，市場競爭力也將會不斷增強。”郭濤認為。

但全聯并購工會信用管理委員會專家安光勇則提到，通用大模型在應對多樣化任務時具有競爭力，而專業大模型在特定領域有深厚的技術積累和應用優勢。

安光勇認為，體量相對較小的企業在大模型領域與“大廠”搶的主要是技術創新和應用場景的拓展。相較于大廠，“小廠”在技術創新上通常更加靈活和敏捷，能夠迅速響應市場需求，快速推出具有差異化和競爭力的大模型產品。

此外，小廠在應用場景上可能更加專業化和垂直化，能夠深入某一領域或行業，提供定制化的解決方案，滿足特定客戶的需求。此種專業化和靈活性為小廠在大模型領域與大廠競爭中帶來了一定的優勢。

“‘大廠更適合做模型’其實是一種慣性思維。”元語智能聯合創始人兼COO朱雷解釋稱，通用的大模型解決不了具體行業的問題，尤其是在國內，大部分高質量中文語料都在行業內，而不在公域的互聯網內，即便是大廠也很難拿到行業數據，從這個角度上看，專用的模型在特定領域的效果一定要比大公司的通用模型更合適。

“這也決定了，在發展的過程中，大廠和初創公司的機會都是均等的。雙方都會選擇自己擅長的領域，再慢慢擴大，就看是誰先在這上面演化出了更優秀的產品。可以斷定的是，在這個巨大的浪潮面前，無論是初創企業還是大廠，都不會錯過這一波機遇。”朱雷補充稱。

AIGC該降溫了？

不久前，國際權威咨詢機構IDC發布的《2022中國大模型發展白皮書》中預測，2026年中國人工智能軟件及應用市場規模將達到211億美元，人工智能進入大規模落地應用關鍵期。數據顯示，自2020年起，中國的大模型數量驟增，僅2020-2021年，中國大模型數量就從2個增至21個，和美國量級同等，大幅領先于其他國家。

薩摩耶云科技集團首席經濟學家鄭磊認為，在通用大模型方面，中美存在時間差，而應用層則各有千秋。大模型訓練成本高，初創企業目前投入的資金很快就會消耗光，需要多輪融資，而商業應用前景不確定，這類投資不太適合存續期較短的創投基金投資，“建議政府將其作為新基建項目，引導社會資金共同投資”。

此外，鄭磊提到，由于還存在可能替代大模型的其他技術路線，國家也應關注，及時加強研究支持，縮小與歐美技術差距。對于中小企業來說，可以根據市場定位和行業發展趨勢，選擇已有的合適的大模型作為垂直應用研發的基座，逐步形成AI賦能的產品和服務，借助市場力量推動產品研發，形成在細分領域的競爭優勢。

上個月末，一覽科技推出業界首個基于GPT大模型的“文本+圖片+虛擬人”視頻AIGC全域工作流，彼時，一覽科技創始人兼 CEO 羅江春就曾提到，AIGC工具只會越來越多，同質化非常嚴重，說是新一輪“百團大戰”也不為過，關鍵的問題是誰能解決某一個垂直領域用戶的根本需求。

“大模型需要降溫了。”于資本市場，深度科技研究院院長張孝榮做出了這樣的判斷。在他看來，大模型是人為炒作起來的一個現象，前期是國際巨頭推廣產品，后期是國內資本市場跟進，炒作相關企業股價，許多公司股價脫離理性軌道，在短短幾個月的時間內翻了數倍，導致資本市場發燒。

北京商報記者楊月涵

關鍵詞：

責任編輯：hnmd003

跟大廠“GPT”搶時間的昆侖商湯們，到底在搶什么 環球熱門

相關閱讀

相關閱讀

精彩推薦

閱讀排行

精彩推送

推薦閱讀

跟大廠“GPT”搶時間的昆侖商湯們，到底在搶什么環球熱門