字節的野心:做大模型時代的「軍火商」
字節跳動謹慎邁出了跨入大模型賽道的第一步。
(資料圖片)
6 月 28 日下午,字節旗下的火山引擎召開發布會,首次正式公布在大模型領域的研發布局和合作進展,并發布大模型服務平臺火山方舟,提供模型訓練、推理、評測、精調等全方位功能與服務。
此前,百度、阿里、騰訊、商湯、360 等國內大廠已經相繼宣布入局,大部分的做法都是發布一個通用大模型或者數個行業大模型底座,行業客戶可以基于這些基礎模型和自身擁有的行業數據精調,打造一個服務自身業務的 AI 應用。
但字節的切入方式與其他大廠有明顯的不同。火山沒有發布自己的通用大模型或者行業大模型,火山方舟聚合了一批第三方生產商開發的大模型底座。
火山引擎向大模型生產商提供構建、訓練大模型基座所必須的算力和工具體系,并將這些生產商的大模型聚集到自己的 MaaS 平臺,供應給企業使用。這與微軟投資算力供給 OpenAI,并基于后者開發的 GPT 模型向企業提供 Azure AI 云服務,有相似之處。
因此,火山引擎介紹的合作案例也與其他大廠有所差異。這場發布會上登臺的合作伙伴,包括英偉達這樣的上游顯卡供應商,以及智譜 AI、百川智能、IDEA 等當下國內第一梯隊的大模型開發商。而其他大廠的發布會,介紹的往往主要是金融、文旅、企服等各行各業的合作伙伴。
火山引擎總裁 譚待
截至今年 5 月,國內已公開披露的大模型數量達到 79 個。按照火山引擎總裁譚待的說法,未來大模型市場一定不會是一家或者幾個寡頭壟斷,而是一個百花齊放的多模型市場,會有少數幾個超級大模型,多個通用大模型,和更多行業/垂直大模型。 企業使用大模型,未來也會呈現「1+N」的模式,除了通過自研或深度合作,形成 1 個主力模型;由于成本和場景復雜多元等原因,在這個主力模型之外,還會有 N 個模型同時應用。 大模型開啟了新一輪行業變革,在這個淘金時代,OpenAI、谷歌、MiniMax、百川智能等大模型生產商是時代浪尖的淘金者。而火山引擎要做的,就是要在大模型時代「賣鏟子」。
01 火山引擎大模型 服務平臺——火山方舟
會上,火山引擎發布了自己的 MaaS 平臺——火山方舟。 火山引擎總裁譚待在會后接受媒體采訪時強調:火山方舟最終服務的是模型的應用方;火山引擎是跟大模型的生產方合作,一部分被精選的大模型廠商在火山方舟上部署,然后對外提供服務。
想讓企業用戶和大模型生產商加入到火山方舟的生態體系,首先要解決的是數據安全的問題。 火山引擎總裁譚待認為,企業使用大模型,最擔心的是數據泄露;如果將大模型私有化部署,企業將承擔更高的成本,模型生產方也會擔心知識資產安全?!富鹕椒街邸沟氖滓蝿?,就是做好大模型使用者、提供者和云平臺可以互相信任的安全保障。 據火山引擎智能算法負責人吳迪介紹,「火山方舟」已上線了基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網絡隔離、流量審計等方式,實現了模型的機密性、完整性和可用性保證,適用于對訓練和推理延時要求較低的客戶。
安全沙箱示意圖
此外,「火山方舟」還在探索基于 NVIDIA 新一代硬件支持的可信計算環境、基于聯邦學習的數據資產分離等多種方式的安全互信計算方案,更全面地滿足大模型在不同業務場景的數據安全要求。 第二,想要讓企業可以更高效地打造 AI 大模型應用。一方面要降低企業用戶使用大模型打造應用的門檻,另一方面也要降低用戶使用大模型服務的成本。
上文提到,火山引擎認為未來企業使用大模型會呈現「1+N」的模式,也就是 1 個自研主力模型+N 個小模型同時應用。比如一個對話式的 AI 服務產品,對話功能的基礎是源自企業自研的大模型,但提供文生圖、文生視頻、特定語種翻譯,或者回答醫療、金融等專業領域的問題時,卻可以調用其他的小模型。 這樣做最大的好處是降低模型的推理成本。吳迪稱,訓練大模型很昂貴,但是從長期來看,模型的推理開銷會超過訓練開銷。效果和成本的矛盾永遠存在,降低推理成本會是大模型應用落地的重要因素,「一個經過良好精調的中小規格模型,在特定工作上的表現可能不亞于通用的、巨大的基座模型,而推理成本可以降低到原來的十分之一?!?/p> 舉例來說,微軟以醫學文章數據精調了生物領域的 BioGPT-Large 模型,僅有 15 億參數,其在 PubMedQA 基準測試中的準確率卻優于有著上千億乃至數千億參數的大型通用語言模型。 但對企業來說,「1+N」模式的一大痛點就在于開發應用的過程中,需要調用各種不同的大模型。而火山方舟提供的第一個功能就是模型廣場,不僅集成了大量的第三方大模型,企業自身開發的大模型也可以通過這個平臺進行管理。 吳迪介紹,企業可以用統一的工作流對接多家大模型,對于復雜需求可設置高級參數、驗證集、測試集等功能,再通過自動化和人工評估直觀對比模型精調效果,在不同業務場景里還可靈活切換不同的模型,實現最具性價比的模型組合。這些自定義指標和評估數據的積累,將成為企業在大模型時代寶貴的數據資產。
火山方舟負責人 吳迪
02 火山引擎的 大模型「朋友圈」
火山引擎暢想的前景非常理想,但要做到有一個前提,就是大大小小的大模型開發商需要聚集到火山引擎。數據安全是他們愿意接入火山引擎的必要條件,但顯然不會是充分條件。火山引擎吸引大模型開發商合作的基礎,在于其掌握的算力資源,也就是過去囤積的大量 GPU。 去年 ChatGPT 發布后,國內 AI 算力緊張已經算是行業半公開的秘密,而字節跳動擁有國內最豐富的算力資源。 據《晚點 LatePost》報道,字節今年向英偉達訂購了超過 10 億美元的 GPU(約合 70 億元人民幣),到貨和沒到貨的 A100 與 H800 總計有 10 萬塊。而 2022 年全年,英偉達數據中心 GPU 在中國的銷售總額大約為 100 億元,也就是說,僅字節一家公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU 總和。 大部分團隊沒有條件購買大量 GPU 訓練大模型,從火山引擎采購算力也就不足為奇。而對火山引擎來說,大模型生產商發展越好,業務量越大,反過來就需要購買更多的算力。所以在這方面,大模型生產商和火山引擎有著相同的訴求。 今年 4 月,火山引擎宣布與國內 70% 的大模型生產商達成合作,原因也在于此。
「火山方舟」首批大模型合作伙伴
會上,火山引擎重點介紹了第一批加入火山方舟的大模型,包括百川智能、出門問問、復旦大學 MOSS、IDEA 研究院、瀾舟科技、MiniMax、智譜等多家 AI 科技公司及科研院所的大模型,并已啟動邀測。 而首批邀測的企業,則包括金融、汽車、消費等眾多行業的客戶。北京銀行 CIO 龔偉華表示,大模型與客戶營銷、辦公協同、數據智能的結合,在金融應用場景有巨大潛力。北京銀行將與「火山方舟」合作,在算力優化、模型精調等方面展開研究,共同推動金融風控、營銷等模型應用落地。 除了第三方的客戶,吳迪介紹,在火山方舟平臺推向市場之前,已經利用眾多的內部產品打磨和改進平臺。字節跳動有 10 余個業務線正在探索接入和試用,在代碼糾錯等研發提效場景,文本分類、總結摘要等知識管理場景,以及數據標注、歸因分析等方面探索,利用大模型能力促進降本增效。 但是,對于這些內部嘗試何時面向用戶,吳迪向極客公園表示:還需要一些時間,把大模型應用好是一個需要長周期打磨的事。 火山引擎總裁譚待進一步補充:有一些應用對用戶是無感知的,因為它是在已有的環境中去提升效率,而不是像 ChatGPT 這種大模型原生應用,用戶能明顯感知到是一個大模型來做這個事情。比如客服這個場景,回答時需要檢索知識庫,但現在通過大模型去給它一些提示,但跟你對話的還是那個對應的客服,只是它的效率高了。
03 字節跳動的下一步
目前來看,字節/火山布局大模型第一階段的思路已經非常清晰。 從商業上看,火山引擎就是賣水賣鏟子的思路。憑借火山引擎的技術體系,加上此前算力資源的積累,做管道和前期的底層服務應該是沒有任何問題,所以在這個階段把基礎工具開放出來,幫助大家做好大模型,或者更直接說,從收益上的考量,這個階段發布技術體系工具比發布大模型的收益值更高。 但有一個很重要的問題是:今天賣鏟子的字節,未來會不會下場淘金? 答案是肯定的。譚待告訴極客公園,其內部也有團隊在研發大模型。如果做好了,也會上到方舟平臺對外提供。此前字節副總裁楊震原也曾向財新回應:字節跳動對大模型也在做一些學習和研究,現在還沒有什么結果,也沒有大模型產品落地時間表。 但這存在一個問題,就是如何平衡自家大模型和其他第三方的關系。對此,譚待表示,自家的模型只會是眾多模型中的一個,其余的是客戶自己的選擇,不需要火山來平衡,一個企業未來一定會在多個場景用多個模型,因為每個模型在不同場景的性價比是不一樣的,這會是一個開放的市場。 正式入局后,不少行業人士看好火山引擎在大模型領域的市場份額會在接下來一段時間快速飆升,原因主要有三個: 第一是因為基礎需求。字節本身在云服務這個層面是國內用量排在前三的公司,就算火山引擎,最終只是為了服務字節這一個生意而建,它的收益和投入產出比都是相當可觀的。 第二是產品能力。字節這套體系迭代出來的產品工具向外傳遞,在云服務里的積累和產品化的能力會非常的強,從這個維度來說,對于很多中小開發者,甚至有體系的開發者是很有吸引力的。 第三是因為生態系統成熟。字節本身在云服務這套體系并不是只做了火山引擎,字節在上下游的廣告分發、基礎設施建設,開發工具等維度都有完善和成熟的生態鏈,甚至早幾年還收購了開發者社區。有著可靠的基礎體系,完整的工作鏈條和生態社區。
過去字節布局國內云服務市場的痛點,在于起步較晚,飛書要挑戰已經成熟的釘釘、企業微信,而云服務的特點就是前期獲客難,但獲客后由于用戶遷移成本太高,所以輕易不會更換。 今天的大模型是一條全新的賽道,所有云服務廠商又回到了同一起跑線,對于想要打開云服務市場的字節和火山而言,這也是十年難得一遇的機遇。
責任編輯:hnmd003
相關閱讀
相關閱讀
-
字節的野心:做大模型時代的「軍火商」
字節跳動謹慎邁出了跨入大模型賽道的第一步。6 月 28 日下午,字
-
奔馳和吉利退出?smart品牌:不實! 全球頭條
奔馳和吉利退出?smart品牌:不實!據國家企業信用信息公示系統顯示,
-
Stellantis將停止在維也納生產變速箱
Stellantis將停止在維也納生產變速箱Stellantis表示:“目前公司尚未確
-
【全球速看料】在宜賓!寧德時代聯合長安汽車等共設動力電池公司
在宜賓!寧德時代聯合長安汽車等共設動力電池公司6月29日,蓋世汽車獲
-
醫院物業管理包括哪些內容?醫院物業管理要求都有什么?
一、醫院物業管理包括哪些內容(一)房屋及附屬設備設施的維修養護與運行管理主要包括對房屋建筑、中央空...
-
b股怎么開戶?b股開戶需要什么條件?
b股怎么開戶?1、攜帶個人有效身份證件去當地的外匯存款銀行辦理轉款手續,將現匯存款和外幣現鈔存款轉入...
-
建筑安全事故分為幾類?工地出了安全事故由誰來承擔?
一、建筑安全事故分為幾類(1)按事故的原因及性質分類:從建筑活動的特點及事故的原因和性質來看,建筑安...
-
股票現量是什么含義?股票現量紫色是買還是賣?
股票現量是什么含義?股票現量指的是現在的,也就是當前剛成交的這一筆訂單的成交量而不是股票現在的存量...
-
暴力行為打架要判刑嗎?治安管理處罰法第十二條的內容是什么?
一、暴力行為以毆打等暴力手段或唆使他人以毆打等暴力手段造成公民身體傷害或死亡,是嚴重的侵犯公民人...
-
好太太童瑤同款智能鎖:一款真正的3D人臉識別智能鎖
智能門鎖,風頭正盛,無論是公司、小區、校園,你都能頻頻看見它的
-
我國的最高權力機關是什么?中華人民共和國憲法第五十七條的內容是什么?
我國國家最高權力機關為全國人民代表大會,在閉會期間,由人民代表大會常務委員會代行其職權。根據我國...
-
基金申購的法律依據是什么?中華人民共和國證券投資基金法第六十一條的內容是什么?
一、基金申購和認購的區別主要在哪基金申購和認購的主要區別在于購買時間不同、購買價格不同、贖回條件...
-
打假維權的途徑是幾種方式?中華人民共和國民法典第一千一百九十五條內容是什么?
打假維權的途徑有如下幾種方式:1、消費者向網絡購物平臺進行投訴;2、撥打消費者協會12315電話進行投訴;...
-
勞動教養最長期限是多長時間?公安機關辦理勞動教養案件規定第四十四條內容是什么?
一、勞動教養制度是什么勞動教養就是勞動、教育和培養,簡稱勞教。勞動教養并非依據法律條例,從法律形...
-
美股期指是什么意思?美股期指幾點開盤幾點收盤?
美股期指是什么意思?美股期指是指美國股票期貨指數,也被稱為美國股指期貨或標普500期貨。它是一種以標普...
-
公司公章怎么掛失?公章掛失的流程是什么?
一、公司公章怎么掛失1、法人要帶身份證原件及復印件;工商營業執照副本原件及復印件到丟失地點所轄的派...
-
電網調度是指什么意思?電網運行實行統一調度的原則嗎?
第一章 總 則第一條 為了加強電網調度管理,保障電網安全,保護用戶利益,適應經濟建設和人民生活的...
-
金融服務費一般收多少?金融服務費可以不交嗎?
金融服務費一般收多少?金融服務費普遍的收費標準是貸款金額的2%左右,但是不同的商家收取的金額多少不同,...
-
延期還款怎么協商?延期還款和停息掛賬的區別
延期還款怎么協商?1、主動致電銀行信用卡中心,申請協商還款一般客服人員和刻意回避這個問題,或者直接...
-
什么是工程造價?工程造價是什么意思?
一、工程造價是什么意思工程造價是指構成項目在建設期預計或實際支出的建設費用。綜合運用管理學、經濟...
-
奧迪前CEO施泰德被判刑_世界微頭條
近日,奧迪前CEO施泰德因涉嫌在大眾“排放門”丑聞中犯有過失欺詐罪,
-
【天天熱聞】學什么、怎么學、咋發展——今年新增本科專業全解讀
教育部日前發布最新《普通高等學校本科專業目錄》,列入目錄的新專業共
-
百明信康完成逾11億元C輪融資
6月29日,專注于提供突破性免疫治療方案的生物制藥公司百明信康宣布完
-
5月份工業企業利潤繼續改善
5月份,隨著消費需求不斷恢復,消費品制造業利潤改善,其中,紡織服裝
-
企業保險怎么買?企業保險每月交多少錢?
企業保險怎么買?公司給在職員工會投保五險,即養老保險、醫療保險、失業保險、工傷保險、生育保險,參保...
-
聽證會的組織程序是怎么樣的?如何組織一次聽證會?
一、聽證會制度是什么聽證會起源于英美國家,是一種把司法審判的模式引入行政和立法程序的制度。聽證會...
-
美國券商 Wedbush 表示:支出可能達到 8000 億美元 人工_全球看點
【友財網訊】-美國券商Wedbush表示,科技公司可能會在人工智能淘金熱中
-
FTC 聽證會文件透露,《最后生還者 2》《西之絕境》制作成本超過 2 億美元|今日熱訊
近日微軟與FTC的法庭辯論中,周三索尼向美國聯邦貿易委員會(FTC)提交的
-
樹大招風的 ChatGPT 又遭起訴 用以訓練的數據究竟值多少錢? 全球消息
財聯社6月29日訊(編輯馬蘭)人工智能雖然是今年最大的趨勢之一,但事
-
彌補全球認知鴻溝,微軟開始提供生成式 AI 職業培訓項目 世界熱門
品玩6月29日訊,據財聯社報道,當地時間周三,全球AI大廠微軟宣布,正
精彩推薦
閱讀排行
精彩推送
- Airpods Max 平替要來!蘋果 ...
- 讓老年人樂享晚年_精選
- 西藏拉薩市公安局交警支隊上半年...
- 西藏稅務部門豐富立體式稅費服務...
- 日播時尚回應高管減持和重組失敗...
- 工商銀行房貸申請流程是什么?工...
- 工商銀行購買基金手續費多少?基...
- 購買什么基金好?購買基金要注意...
- 公務員停薪留職的規定內容是什么...
- 卓越·和悅丨尚學 新品實力當“燃”
- 美國縮表是什么意思?美國縮表對...
- 什么是期貨交易系統?期貨交易系...
- 交強險保險條款內容有什么?機動...
- 華達科技:6月28日融資買入324.6...
- 銀行頭寸是什么意思?銀行頭寸調...
- 資訊推薦:了不起的意思是什么
- 作品轉載的規定內容是什么?著作...
- 醫保卡丟了怎么辦?醫??▉G失別...
- 按照房產性質將房屋所有權分為哪...
- 股票加dr是什么意思?股票dr之后...
- 股票經紀人是干什么的?股票經紀...
- 全球快訊:四房企獲準股權融資 ...
- 炒股在哪里開戶?炒股開戶需要什...
- 當前關注:眾安百萬醫療險真實嗎...
- 今日快看!大眾點評的到店生意:1...
- 安邦暢盈兩全保險(萬能型)b款怎...
- 科技思變,2023廣汽科技日描繪移...
- 支付寶平安百萬醫療險可靠嗎?怎...
- 三六零:6月28日融資買入1.79億...
- 陽光保險融合c百萬醫療保證續保...