騰訊推出混元大模型，已接入騰訊會議、微信搜一搜等 50 多個騰訊業務和產品

2023-09-07 18:12:17來源：ZAKER科技

騰訊補上了大模型布局中最重要的一塊拼圖。

(相關資料圖)

9 月 7 日，在 2023 騰訊全球數字生態大會上，騰訊混元大模型正式亮相，并宣布通過騰訊云對外開放。騰訊介紹，混元大模型是由騰訊全鏈路自研的通用大語言模型，具備強大的中文創作能力，復雜語境下的邏輯推理能力，以及可靠的任務執行能力。

馬化騰此前曾經表示騰訊不急于推出大模型半成品。但很顯然，首次亮相的混元大模型不可能是通俗意義上的「完美版」。對此，騰訊集團副總裁蔣杰將當下推出的混元大模型，定義成一個「可用」「可實踐」的版本。

「我們一直在演進我們的能力，從大語言模型到文生圖，到今天演講最后非?？萍几械囊曨l，也是混元生成的視頻?！故Y杰說，「我們今天的發布只是一個開始，還不值得大家對我們有很高的要求，我希望我們每個月都會給大家驚喜。」

此前在今年 6 月和 7 月，騰訊先后發布了面向 B 端客戶的騰訊云 MaaS 解決方案和 AI 原生向量數據庫 Tencent Cloud VectorDB，加上此次發布的自研通用大模型，騰訊已經搭建起一套包含通用大模型、云服務平臺、向量數據庫的完整大模型產品服務體系。

大模型時代，所有的軟件服務都將被重塑。騰訊旗下的社交、游戲、娛樂、金融等產品擁有廣泛的 C 端和 B 端用戶，騰訊也在加快用大模型升級這些產品的進程。

目前，騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 瀏覽器等超過 50 個騰訊業務和產品，已經接入騰訊混元大模型測試，并取得初步效果。此外，混元大模型也將作為騰訊云 MaaS 服務的底座，客戶不僅可以直接通過 API 調用混元，也可以將混元作為基底模型，為不同產業場景構建專屬應用。

會上，騰訊集團高級執行副總裁、云與智慧產業事業群 CEO 湯道生表示，騰訊將邁入「全面擁抱大模型」時代。騰訊集團副總裁蔣杰進一步表示：「我們研發大模型的目標不是在評測上獲得高分，而是將技術應用到實際場景中?！?/p>

混元大模型

今年 6 月，騰訊發布了行業大模型及大模型的工具鏈 TI 平臺。但對其通用大模型，一直被傳在公司內部應用測試。

在今日舉辦的 2023 騰訊全球數字生態大會上，騰訊自己的通用大模型——混元大模型，終于亮相。

騰訊云 MaaS 服務全景圖丨拍攝：極客公園

在現場演示中，混元大模型揭開了「自己」的神秘面紗。現場，工作人員向混元大模型進行了一系列提問：

混元是誰？

混元的核心技術架構是什么？

混元模型參數量多大？

混元訓練數據截止什么時候？（今年 7 月，每個月不斷迭代）

混元大模型，你有什么特點、優點？

據混元大模型自述，它擁有超千億參數規模，預訓練語料超 2 萬億 tokens，是騰訊自研的通用大模型。就其能力而言，騰訊方面表示，混元大模型的中文能力超過 GPT3.5，英文能力目前比 GPT3.5 差。此外，騰訊還自研了機器學習框架 Angel，使訓練速度相比業界主流框架提升 1 倍，推理速度比業界主流框架提升 1.3 倍。

現場，騰訊集團副總裁蔣杰介紹道，訓練燒錢、百模大戰，在投入大模型時騰訊在期待什么？他認為是更成熟，更可靠的大模型。

但在技術手段上，他稱，搜索增強、知識圖譜，通過這些通過外掛、開卷考試，來解決大模型的「幻覺」等不可靠問題，存在局限性。在接受采訪時，蔣杰進一步解釋道：「盡管這些技術我們也會用，但是比例不是很高，混元大模型是在大模型的預訓練階段，來控制這個問題」。據悉，騰訊在預訓練階段通過「探真」算法進行事實修正，讓混元大模型出現幻覺的概率降到最低。

他補充說，更成熟、更可靠的大模型，是一個拼細節的過程?！复蠹叶贾朗裁唇袕娀瘜W習，都知道大語言模型是通過 Transformer 來做、通過 decode 來做，但每個公司做的效果都不一樣。這需要在算法、工程、數據標注的完整性等一系列綜合能力上，摳細節?！?/p>

騰訊方面稱，針對大模型容易「胡言亂語」的問題，騰訊優化了預訓練算法及策略，讓混元大模型的幻覺相比主流開源大模型降低了 30% 至 50%；通過強化學習的方法，讓模型學會識別陷阱問題；通過位置編碼優化，提高了超長文的處理效果和性能；提出思維鏈的新策略，讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。

對于混元大模型何時開始研發，蔣杰稱，從 2020 年開始，騰訊一直在跟進和投入這樣的技術能力，最早起于 400 GB、用于支撐廣告業務的稀疏大模型，并不是現在看到的稠密大模型。當時，這一模型使得 GMV 提升了大約 13%，在這之后，騰訊對大模型的投入和積累逐漸增加。

在中國信通院《大規模預訓練模型技術和應用的評估方法》的標準符合性測試中，混元大模型共測評 66 個能力項，在「模型開發」和「模型能力」兩個重要領域的綜合評價均獲得了當前的最高分。在主流的評測集 MMLU、CEval 和 AGI-eval 上，混元大模型均有優異的表現，特別是在中文的理科、高考題和數學等子項上表現突出。

騰訊大模型的決戰，還是在產品

騰訊自研通用大模型的首次亮相在主要大廠中并不算早。從今天披露的進展來看，技術上也很難說明顯的差異或者突破性的變革，就像騰訊高管自己說的那樣，混元大模型才剛剛起步，今天還不能對其有太多不切實際的要求。

但這不意味著騰訊就是這場競爭中的陪跑。雖然大模型的基礎能力和積累上騰訊沒有太多優勢，但推動大模型落地，騰訊強大的產品和其背后廣闊的用戶體量，就是其最大的優勢所在。

就在發布會的前一天，微信向一部分受邀用戶開放了「騰訊混元助手」小程序，這是一款騰訊混元大模型多模態對話 Bot 產品，可以回答各類問題，也能處理多種任務，如：獲取知識、解決數學問題、翻譯、提供旅游攻略、工作建議等，也能進行 AI 繪畫。

大模型本身只是一項技術，落地到真正的場景需要解決產品、用戶、運營等一系列具體的問題，這也是為什么大模型廠商需要找第三方合作。但當下構建大模型的門檻越來越低，有場景的更愿意開發自己的大模型，這就讓云服務商的定位越來越像一個提供開發平臺和算力的供應商，巨大投入自研的通用大模型，卻不容易找到場景。

而騰訊是中國最大的軟件服務商，社交有微信、QQ 兩個 10 億用戶級的產品，游戲能占到中國市場四成甚至更多的市場份額，旗下還有著中國前兩大的支付工具，前三大的視頻平臺，前三大的短視頻平臺，以及中國最大的音樂 App、網文 App，此外在辦公領域，騰訊會議、騰訊文檔、企業微信等產品也有著領先的市場份額。

混元大模型就像是一個生在金礦上的「孩子」，別人都是拿著錘子找釘子，騰訊最不缺的就是釘子。會上公布 50 多個騰訊產品已經接入混元大模型，其中數億級用戶的產品比比皆是，比如有 4 億用戶的騰訊會議，覆蓋 6 億用戶的騰訊廣告、也有幾億用戶的騰訊文檔。

會上，蔣杰展示了騰訊會議、騰訊文檔、騰訊廣告等多個業務在接入騰訊混元大模型后的實際應用情況。

比如騰訊會議基于混元大模型打造了AI小助手，只需要簡單的自然語言指令，就能完成會議信息提取、內容分析等復雜任務，會后還能生成智能總結紀要。據實測，在指令理解、會中問答、會議摘要、會議待辦項等多個方面，混元大模型均獲得較高的用戶采納率。

騰訊會議 AI 助手丨來自：騰訊

在文檔處理方面，騰訊混元大模型支持數十種文本創作場景，在騰訊文檔推出的智能助手功能中已有應用。同時，混元還能夠一鍵生成標準格式文本，精通數百種 Excel 公式，支持自然語言生成函數，并基于表格內容生成圖表，目前這些功能正在內測階段，將在成熟后面向用戶開放。

在廣告業務場景，騰訊混元大模型支持智能化的廣告素材創作，能夠適應行業與地域特色，滿足千人千面的需求，實現文字、圖片、視頻的自然融合。此外，基于混元大模型的能力，廣告智能導購能夠幫助商家在企業微信等場景，提升服務質量和服務效率。

騰訊廣告 AI 創意工具丨來自：騰訊

蔣杰在接受采訪時表示，其實今天騰訊大模型的應用就是跟騰訊業務的深度結合，今天是跟會議的結合，跟文檔的結合，那未來可以是跟微信的結合，QQ 的結合，是跟騰訊視頻的結合，騰訊音樂的結合。

大模型的發展不能也不會只靠燒錢推動，一定需要落地到具體的場景產生價值，落的場景越多，使用的用戶越多，產生的商業價值、數據越多，通用大模型的訓練成本就會被攤的越薄、推理成本也就降的越低，而模型能力卻會更強，形成互聯網老生常談的「飛輪效應」。

在這場大模型競爭中，騰訊是最不需要「搶」的那個。做好自己的事情，持續提升模型能力，做好為現有的產品的賦能和升級，給用戶創造價值，騰訊就足以贏下一張大模型時代的船票。

騰訊推出混元大模型，已接入騰訊會議、微信搜一搜等 50 多個騰訊業務和產品

相關閱讀

相關閱讀

精彩推薦

閱讀排行

精彩推送

推薦閱讀