首頁 > 新聞 > 智能 > 正文

騰訊推出混元大模型,已接入騰訊會議、微信搜一搜等 50 多個騰訊業務和產品

2023-09-07 18:12:17來源:ZAKER科技  

騰訊補上了大模型布局中最重要的一塊拼圖。


(相關資料圖)

9 月 7 日,在 2023 騰訊全球數字生態大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。騰訊介紹,混元大模型是由騰訊全鏈路自研的通用大語言模型,具備強大的中文創作能力,復雜語境下的邏輯推理能力,以及可靠的任務執行能力。

馬化騰此前曾經表示騰訊不急于推出大模型半成品。但很顯然,首次亮相的混元大模型不可能是通俗意義上的「完美版」。對此,騰訊集團副總裁蔣杰將當下推出的混元大模型,定義成一個「可用」「可實踐」的版本。

「我們一直在演進我們的能力,從大語言模型到文生圖,到今天演講最后非??萍几械囊曨l,也是混元生成的視頻?!故Y杰說,「我們今天的發布只是一個開始,還不值得大家對我們有很高的要求,我希望我們每個月都會給大家驚喜。」

此前在今年 6 月和 7 月,騰訊先后發布了面向 B 端客戶的騰訊云 MaaS 解決方案和 AI 原生向量數據庫 Tencent Cloud VectorDB,加上此次發布的自研通用大模型,騰訊已經搭建起一套包含通用大模型、云服務平臺、向量數據庫的完整大模型產品服務體系。

大模型時代,所有的軟件服務都將被重塑。騰訊旗下的社交、游戲、娛樂、金融等產品擁有廣泛的 C 端和 B 端用戶,騰訊也在加快用大模型升級這些產品的進程。

目前,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 瀏覽器等超過 50 個騰訊業務和產品,已經接入騰訊混元大模型測試,并取得初步效果。此外,混元大模型也將作為騰訊云 MaaS 服務的底座,客戶不僅可以直接通過 API 調用混元,也可以將混元作為基底模型,為不同產業場景構建專屬應用。

會上,騰訊集團高級執行副總裁、云與智慧產業事業群 CEO 湯道生表示,騰訊將邁入「全面擁抱大模型」時代。騰訊集團副總裁蔣杰進一步表示:「我們研發大模型的目標不是在評測上獲得高分,而是將技術應用到實際場景中?!?/p>

混元大模型

今年 6 月,騰訊發布了行業大模型及大模型的工具鏈 TI 平臺。但對其通用大模型,一直被傳在公司內部應用測試。

在今日舉辦的 2023 騰訊全球數字生態大會上,騰訊自己的通用大模型——混元大模型,終于亮相。

騰訊云 MaaS 服務全景圖丨拍攝:極客公園

在現場演示中,混元大模型揭開了「自己」的神秘面紗。現場,工作人員向混元大模型進行了一系列提問:

混元是誰?

混元的核心技術架構是什么?

混元模型參數量多大?

混元訓練數據截止什么時候?(今年 7 月,每個月不斷迭代)

混元大模型,你有什么特點、優點?

據混元大模型自述,它擁有超千億參數規模,預訓練語料超 2 萬億 tokens,是騰訊自研的通用大模型。就其能力而言,騰訊方面表示,混元大模型的中文能力超過 GPT3.5,英文能力目前比 GPT3.5 差。此外,騰訊還自研了機器學習框架 Angel,使訓練速度相比業界主流框架提升 1 倍,推理速度比業界主流框架提升 1.3 倍。

現場,騰訊集團副總裁蔣杰介紹道,訓練燒錢、百模大戰,在投入大模型時騰訊在期待什么?他認為是更成熟,更可靠的大模型。

但在技術手段上,他稱,搜索增強、知識圖譜,通過這些通過外掛、開卷考試,來解決大模型的「幻覺」等不可靠問題,存在局限性。在接受采訪時,蔣杰進一步解釋道:「盡管這些技術我們也會用,但是比例不是很高,混元大模型是在大模型的預訓練階段,來控制這個問題」。據悉,騰訊在預訓練階段通過「探真」算法進行事實修正,讓混元大模型出現幻覺的概率降到最低。

他補充說,更成熟、更可靠的大模型,是一個拼細節的過程?!复蠹叶贾朗裁唇袕娀瘜W習,都知道大語言模型是通過 Transformer 來做、通過 decode 來做,但每個公司做的效果都不一樣。這需要在算法、工程、數據標注的完整性等一系列綜合能力上,摳細節?!?/p>

騰訊方面稱,針對大模型容易「胡言亂語」的問題,騰訊優化了預訓練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了 30% 至 50%;通過強化學習的方法,讓模型學會識別陷阱問題;通過位置編碼優化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。

對于混元大模型何時開始研發,蔣杰稱,從 2020 年開始,騰訊一直在跟進和投入這樣的技術能力,最早起于 400 GB、用于支撐廣告業務的稀疏大模型,并不是現在看到的稠密大模型。當時,這一模型使得 GMV 提升了大約 13%,在這之后,騰訊對大模型的投入和積累逐漸增加。

在中國信通院《大規模預訓練模型技術和應用的評估方法》的標準符合性測試中,混元大模型共測評 66 個能力項,在「模型開發」和「模型能力」兩個重要領域的綜合評價均獲得了當前的最高分。在主流的評測集 MMLU、CEval 和 AGI-eval 上,混元大模型均有優異的表現,特別是在中文的理科、高考題和數學等子項上表現突出。

騰訊大模型的決戰,還是在產品

騰訊自研通用大模型的首次亮相在主要大廠中并不算早。從今天披露的進展來看,技術上也很難說明顯的差異或者突破性的變革,就像騰訊高管自己說的那樣,混元大模型才剛剛起步,今天還不能對其有太多不切實際的要求。

但這不意味著騰訊就是這場競爭中的陪跑。雖然大模型的基礎能力和積累上騰訊沒有太多優勢,但推動大模型落地,騰訊強大的產品和其背后廣闊的用戶體量,就是其最大的優勢所在。

就在發布會的前一天,微信向一部分受邀用戶開放了「騰訊混元助手」小程序,這是一款騰訊混元大模型多模態對話 Bot 產品,可以回答各類問題,也能處理多種任務,如:獲取知識、解決數學問題、翻譯、提供旅游攻略、工作建議等,也能進行 AI 繪畫。

大模型本身只是一項技術,落地到真正的場景需要解決產品、用戶、運營等一系列具體的問題,這也是為什么大模型廠商需要找第三方合作。但當下構建大模型的門檻越來越低,有場景的更愿意開發自己的大模型,這就讓云服務商的定位越來越像一個提供開發平臺和算力的供應商,巨大投入自研的通用大模型,卻不容易找到場景。

而騰訊是中國最大的軟件服務商,社交有微信、QQ 兩個 10 億用戶級的產品,游戲能占到中國市場四成甚至更多的市場份額,旗下還有著中國前兩大的支付工具,前三大的視頻平臺,前三大的短視頻平臺,以及中國最大的音樂 App、網文 App,此外在辦公領域,騰訊會議、騰訊文檔、企業微信等產品也有著領先的市場份額。

混元大模型就像是一個生在金礦上的「孩子」,別人都是拿著錘子找釘子,騰訊最不缺的就是釘子。會上公布 50 多個騰訊產品已經接入混元大模型,其中數億級用戶的產品比比皆是,比如有 4 億用戶的騰訊會議,覆蓋 6 億用戶的騰訊廣告、也有幾億用戶的騰訊文檔。

會上,蔣杰展示了騰訊會議、騰訊文檔、騰訊廣告等多個業務在接入騰訊混元大模型后的實際應用情況。

比如騰訊會議基于混元大模型打造了AI小助手,只需要簡單的自然語言指令,就能完成會議信息提取、內容分析等復雜任務,會后還能生成智能總結紀要。據實測,在指令理解、會中問答、會議摘要、會議待辦項等多個方面,混元大模型均獲得較高的用戶采納率。

騰訊會議 AI 助手丨來自:騰訊

在文檔處理方面,騰訊混元大模型支持數十種文本創作場景,在騰訊文檔推出的智能助手功能中已有應用。同時,混元還能夠一鍵生成標準格式文本,精通數百種 Excel 公式,支持自然語言生成函數,并基于表格內容生成圖表,目前這些功能正在內測階段,將在成熟后面向用戶開放。

在廣告業務場景,騰訊混元大模型支持智能化的廣告素材創作,能夠適應行業與地域特色,滿足千人千面的需求,實現文字、圖片、視頻的自然融合。此外,基于混元大模型的能力,廣告智能導購能夠幫助商家在企業微信等場景,提升服務質量和服務效率。

騰訊廣告 AI 創意工具丨來自:騰訊

蔣杰在接受采訪時表示,其實今天騰訊大模型的應用就是跟騰訊業務的深度結合,今天是跟會議的結合,跟文檔的結合,那未來可以是跟微信的結合,QQ 的結合,是跟騰訊視頻的結合,騰訊音樂的結合。

大模型的發展不能也不會只靠燒錢推動,一定需要落地到具體的場景產生價值,落的場景越多,使用的用戶越多,產生的商業價值、數據越多,通用大模型的訓練成本就會被攤的越薄、推理成本也就降的越低,而模型能力卻會更強,形成互聯網老生常談的「飛輪效應」。

在這場大模型競爭中,騰訊是最不需要「搶」的那個。做好自己的事情,持續提升模型能力,做好為現有的產品的賦能和升級,給用戶創造價值,騰訊就足以贏下一張大模型時代的船票。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀