首頁 > 新聞 > 智能 > 正文

大模型,開始“搶人”

2023-05-15 12:12:59來源:ZAKER科技  

作者 | 沙拉醬

編輯 | 麻吉


(相關資料圖)

大模型越來越火,搶人大戰愈演愈烈。

在 AIGC、ChatGPT 的帶動下,大模型概念開始被廣泛討論。2023 年還未過半,就已經有包括百度、阿里、騰訊、商湯、京東、科大訊飛等多家互聯網、AI 公司陸續宣布對大模型展開探索。

誠然,在大模型的技術和商業化進程上,國內相較于國外仍有一定差距。因此,大廠們毫不吝嗇地開出百萬年薪來爭奪算法、深度學習等高級技術人才。

除此之外,大模型在中國這片土壤上要如何生長,其商業化進程又需要突破哪些瓶頸呢?

越來越 " 大 " 的大模型

AIGC 和 ChatGPT 等熱詞帶動下,大模型概念逐漸被關注。不過,大模型到底是什么,又能做什么,對很多人來說,這個問題的答案似乎很模糊。

一位中國傳媒大學計算機技術碩士,在知乎上這樣描述了大模型:如果說模型是一個盒子,那么普通模型就是一個小盒子,因為容量有限,所以其處理和存儲的數據、信息也有限。因此,普通模型可以完成分類、預測、生成等簡單任務;相較之下,大模型就是一個超級大倉庫,往往需要數十億,甚至上百億個參數組成,可以完成更高級的思考和決策。比如,自然語言理解、語音識別、圖像識別等。

而這個大模型,到底有多 " 大 "?舉例來說,GPT-4 使用了 1750 億規模的參數,微軟推出的 Turing-NLG 有 1000 億參數,谷歌則推出號稱有 1.6 萬億模型參數的 switch transformer。作為對照,我們日常使用的智能語音通常只有幾個億的參數。

雖然,在模型參數的規模上,國內產品似乎仍落后一步——例如,率先推出文心一言的百度有 100 億參數、華為盤古大模型使用 1000 億參數。不過,過去的幾個月,陸續加速布局大模型的國內公司卻如雨后春筍,其中包括阿里的通義大模型、騰訊的混元大模型、科大訊飛的訊飛星火、京東的 ChatJD 等等。

從目前國內推出的幾款大模型產品來看,我們似乎仍在等待和尋找自己的 "iPhone 時刻 "。無論是百度的文心一言、華為的盤古大模型,還是科大訊飛的訊飛星火,似乎仍停留在從自己原本的優勢入手的 " 集大成者 ",相對缺少更多的創新。

像是以搜索引擎為所長的百度,推出了類似 GPT-3 這樣具備搜索屬性的文心一言。

華為的盤古大模型則更加專注于自己比較有優勢的 TO B 業務。在發布會上,華為也表示,在過去的 2022 年,華為盤古大模型主要是 AI for Industry(AI 賦能產業),為煤礦、水泥、電力、金融、農業等行業創造了更多產業價值,其中 CV 大模型早就有了許多用武之地。

比如在與能源公司合作的盤古礦山大模型案例中,礦井現場是一個 40 米長的采掘機,寬度僅 2 米左右,傳統相機很難一下子捕捉到全部畫面,只能用圖中的九宮格視頻畫面。而通過 5G+AI 全景視頻拼接綜采畫面卷,傳輸到地面,地面工作人員將來可以實現地面控制機器進行采礦,實現礦下無人、少人安全作業。

科大訊飛則是在深度神經網絡算法方面擁有豐富經驗,尤其在語音識別和圖文識別方面水平過硬,其訊飛火星的體驗頁面,就包含語音合成、聽寫、翻譯、文字識別等功能。

圖源:訊飛星火體驗頁面

人才之爭

艾瑞咨詢曾在報告《ChatGPT 浪潮下,看中國大語言模型產業發展》中討論過中外大模型研發的差距,其中表示," 對百度等國內大廠而言,則在數據、算力、工程化能力等關鍵要素上存在短板,短期內難以對國外領先大模型實現趕超,為跟隨者角色,長期更需要國內 AI 全產業鏈整體進化。"

要補充短板,一個重要的因素,就是人才。因此,大廠也都紛紛行動起來。

BOSS 直聘上,百度、騰訊、阿里、螞蟻集團等紛紛發布了相關崗位的招聘信息。其中,百度以 25-40k/ 月招聘 AI 大模型算法工程師、20-40k/ 月招聘模型構架工程師;螞蟻集團以 45-75k/ 月招聘深度學習大模型 GPT 工程師;阿里以 40-70k/ 月招聘大模型訓練及算法工程師;騰訊則以 30-60k/ 月招聘大模型預訓練方向的工程師 ... ...

部分大模型招聘信息。圖源:BOSS 直聘

值得注意的是,這些崗位幾乎都在一日內被回復了超過 10 次,負責招聘的聯絡人也幾乎都是 " 正在活躍 " 的狀態。由此可見,求職者對于大模型相關崗位充滿信心,且招聘者也正在如火如荼地爭奪人才。

而從脈脈發布的《AIGC 才趨勢報告》中可以看出,自 Open AI 推出的 2021 年以來,對于 AIGC 相關的人才爭奪就已經開始了。2021 年 1-2 月,AIGC 相關崗位招聘同比上升 281.88%,而后的 2022 年和今年的 1-2 月,招聘數量分別保持了 76.74% 和 31.3% 的同比增幅。

圖源:脈脈《AIGC 才趨勢報告》

這些招聘中,純互聯網大廠占比超過 33%,處于人才爭奪的主導位置。而且,大廠并不吝嗇給錢,圖像識別、深度學習、算法研究工程師的平均年薪超過了 100 萬元人民幣。

圖源:脈脈《AIGC 才趨勢報告》

此外,相較國外,目前國內大模型人才的學術背景似乎也略遜一籌。比如,在 AIGC 相關人才的學歷背景中,本科和碩士占據了幾乎 90%,博士生占比僅 4%。相比之下,由科技情報分析機構 AMiner 和智譜研究發布的《ChatGPT 團隊背景研究報告》顯示,ChatGPT 研發團隊中,本科、碩士和博士的占比分別為 33%、30%、37%。

前路很長

誠然,人才的爭奪只是第一步,對不少大廠來說,積極投入研發的最終意義是賺錢。而大模型目前的商業化分成了 C 端與 B 端兩個路徑方向——對于 C 端來說,以 GPT 為例,通過開源方式將用戶和數據引進來,再逐漸轉化成訂閱制;而就 B 端而言,比如 Open AI 與微軟 Azure 的合作,間接實現 " 模型即服務 ",小 B 開發者可以調用其大模型 API。

商業模式上,ChatGPT 已經明確指向 API、訂閱制和戰略合作(嵌入微軟 Bing、Office 等軟件)三種營收方式,且已在用戶數據積累、產品布局和生態建設層面充分領先;Google 雖有意追趕,但由于聊天機器人這樣的產品形態對于其主營的搜索引擎業務的助益有限,因此在與搜索引擎結合方面較為審慎,更希望借助大模型能力開展 " 模型即服務 " 范式,開拓其當前市占率較低的云服務業務的市場空間。

國內大廠也幾乎是在這兩條路上摸索。比如百度的文心一言更傾向于 C 端市場的探索,而 " 文心千帆 " 產品則劍指 B 端市場,意圖進一步帶動云服務營收。

不過無論是靠哪一條 " 腿 " 走路,想要實現商業化,大模型產品仍需要解決幾個緊迫的問題。

比如,信息準確性??萍夹袠I投資觀察員林允告訴價值星球:" 大模型所輸出的內容準確性其實絕大部分取決于其底層數據的質量。我自己在測試了國內某廠推出的類 GPT 產品后,最大的感觸是,底層數據質量還是有一定差距。" 林允還補充道,用中文訓練模型相較于英文也是沒有語言優勢的。

但是,消費者不會體會研發者的難處,一旦產品開啟訂閱制,用戶就會對產品輸出的內容要求極其嚴苛。免費使用的時候,用戶還能將錯誤反饋當成吐槽的笑話,但收費之后,這些錯誤可能就成了投訴的理由。

除此之外,在目前大模型較多應用的文字和圖形創作上,如何保證原創性也成了一個關鍵問題。一位 AI 從業者就表示,以 AIGC 為例,目前很多 AIGC 系統仍缺乏創造力,甚至不能獨立生成原創內容,只能根據給定的模板或者指導生成相關內容。而這可能會牽扯原創的道德問題,以及更實際的,涉及版權資金的問題。

最重要的是,大模型由于所需要的數據規模巨大,因此對算法、算力、數據存儲空間都有極大的要求,而這些不止是人才可以彌補的,還需要大量的資金。要知道,Open AI 的成功也是微軟當初用數十億美金堆出來的。巨大的資金需求,對大廠的研發決心也是一種考驗。

但毋庸置疑的是,大模型已經開始改造很多應用場景。林允就表示," 以 ChatGPT 為例,它將會徹底改變人們工作的方式,所以不論是搜索引擎為主的百度,還是發展云業務的阿里、騰訊、華為,大廠們對大模型的探索是無法阻擋的大勢所趨。只是進展和成效如何,要邊走邊看。"

* 文中林允為化名

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

精彩推送

推薦閱讀