騰訊發(fā)布混元大模型！在微信里有個(gè)「賈維斯」是什么體驗(yàn)？

2023-09-07 17:22:49來源：ZAKER科技

8 月 31 日，注定成為國產(chǎn)大模型歷史上的關(guān)鍵轉(zhuǎn)折。多家國產(chǎn)大模型公司通過備案，陸續(xù)向全社會(huì)公眾開放服務(wù)。

這意味著國產(chǎn)大模型進(jìn)入一個(gè)全新的階段，國產(chǎn)大模型可以向數(shù)以億計(jì)的用戶提供服務(wù)，同時(shí)也將面臨同樣倍數(shù)的審視和挑戰(zhàn)。

剛剛，騰訊也正式發(fā)布了自研的通用大語言模型——混元大模型。

【資料圖】

目前騰訊已經(jīng)有超過 50 個(gè)自有產(chǎn)品和業(yè)務(wù)接入混元大模型測(cè)試，包括騰訊云、騰訊廣告、騰訊文檔、微信搜一搜、QQ 瀏覽器等，接下來騰訊預(yù)計(jì)還會(huì)有更多產(chǎn)品接入。

比起百度阿里，騰訊作為國內(nèi)互聯(lián)網(wǎng)巨頭在大模型應(yīng)用上似乎更加謹(jǐn)慎，其實(shí) AIGC 在騰訊內(nèi)部?jī)?yōu)先級(jí)已非常高，馬化騰在 5 月的騰訊財(cái)報(bào)會(huì)議上也直接表明了騰訊的態(tài)度：

我們最開始以為這是互聯(lián)網(wǎng)十年不遇的機(jī)會(huì)，但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇，所以我們覺得（AI）非常重要……但是并不急于早早做完，把半成品拿出來展示。

愛范兒也獲得了體驗(yàn)資格，并在第一時(shí)間給你挖掘到更多細(xì)節(jié)。

混元大模型，請(qǐng)多指教

混元者，元?dú)馕捶郑煦鐬橐唬獨(dú)庵家病拿Q上就可以看出，渴望「開天辟地」的騰訊對(duì)混元大模型寄予了厚望。

作為騰訊全鏈路自研的通用大語言模型，混元大模型擁有優(yōu)異的語料庫、創(chuàng)新的大模型算法、自研 Angel 機(jī)器學(xué)習(xí)框架、強(qiáng)大的算力基礎(chǔ)設(shè)施。

針對(duì)實(shí)際的應(yīng)用場(chǎng)景，騰訊混元大模型的主要研發(fā)團(tuán)隊(duì)代表，騰訊集團(tuán)副總裁蔣杰也在發(fā)布會(huì)上演示了致力于更可靠、更成熟的混元大模型。混元大模型更可靠，經(jīng)過大量的研究和嘗試，混元大模型找到一種基于探真的方法，有效降低大語言模型 30%-50 % 的幻覺率。

更可靠的混元大模型還能識(shí)別「陷阱」，抗拒「誘導(dǎo)」，讓模型對(duì)不安全的問題說「不」。

面對(duì)挑戰(zhàn)，更成熟的混元大模型能夠處理超長(zhǎng)文本的生成和續(xù)寫能力，比如撰寫一篇關(guān)于農(nóng)業(yè)裝置專利。混元大模型提出思維鏈的新策略，有效強(qiáng)化模型對(duì)問題拆解和分布思考的傾向。蔣杰的展望是，大模型可以像人一樣結(jié)合實(shí)際的應(yīng)用場(chǎng)景合理地做出推理。蔣杰向混元大模型提問了關(guān)于「你是誰、混元大模型的核心架構(gòu)是什么、混元大模型的參數(shù)是多少？」等問題，可以看出，混元大模型的回答充滿條理性。值得注意的是，混元大模型的更新截止到 2023 年 7 月，且仍在不斷迭代。為了演示混元大模型的邏輯推理能力，蔣杰向混元大模型提出邏輯思考題：「買一堆咖啡，上午喝了一半，下午又喝了剩下的一半，還剩 30 杯，一共買了多少杯」。在極短的時(shí)間內(nèi)，混元大模型就給出了正確的答案。相較于主流大模型注重參數(shù)和評(píng)測(cè)，騰訊混元大模型更關(guān)注應(yīng)用。

比如在與騰訊會(huì)議的結(jié)合中，混元大模型可以生成整場(chǎng)會(huì)議的總結(jié)，整理會(huì)議的相關(guān)細(xì)節(jié)。

與騰訊文檔的結(jié)合，發(fā)布會(huì)還演示了混元大模型的文本歸納、文檔創(chuàng)作與編輯，翻譯等能力，掌握數(shù)十種文本生成場(chǎng)景，輕松根據(jù)數(shù)百種公式生成 Excel 圖表。與騰訊廣告的結(jié)合中，混元大模型適應(yīng)行業(yè)與地域特色，滿足千人千面需求，實(shí)現(xiàn)文字、圖片、視頻的自然融合，廣告生成效果以 42% 的用戶采納率超過主流的 Midjourney，遠(yuǎn)遠(yuǎn)超過開源的 Stable Diffusion 模型。在 AI 大模型的賽道上，騰訊的布局其實(shí)要早得多。

2019 年，騰訊推出了廣告推薦 MoE 大模型，單模型參數(shù)超千億。

2021 年，騰訊推出千億規(guī)模的 NLP 大模型，顯著提高模型訓(xùn)練推理效率、降低成本。

進(jìn)入 2022 年，厚積薄發(fā)的混元大模型迎來了收獲的季節(jié)，5 月，混元 AI 大模型同時(shí)登頂 CLUE 總排行榜、閱讀理解、大規(guī)模知識(shí)圖譜三個(gè)榜單，一舉打破三項(xiàng)紀(jì)錄。

一個(gè)月后，騰訊多模態(tài) AI 大模型率先被應(yīng)用在廣告投放，當(dāng)時(shí)累計(jì)給廣告主帶來 15% 的 GMV 提升。

這些積累都給混元大模型奠定了基礎(chǔ)。

騰訊混元大模型初體驗(yàn)

「騰訊混元助手」首頁由「聊天」和「靈感發(fā)現(xiàn)」兩個(gè) Tab 組成，「聊天」功能和會(huì)話類 AI 產(chǎn)品類似，與 ChatGPT 不同的是，「騰訊混元助手」已經(jīng)集成了不少指令集，同時(shí)會(huì)在首頁給你推薦一些問題。

正在發(fā)布會(huì)現(xiàn)場(chǎng)趕稿的我，也嘗試了讓它來寫稿，看看能不能幫我節(jié)省些時(shí)間（moyu）。在「靈感發(fā)現(xiàn)」里則集成了不同行業(yè)眾多常用場(chǎng)景的應(yīng)用，包括工作、編程、營銷、生活、角色扮演、娛樂等領(lǐng)域。你可以直接讓它生成代碼、寫種草文案，也能讓它扮演不同的角色，比如對(duì)新手父母可以直接點(diǎn)擊「教育專家」，孩子在不同階段遇到的各種問題都能給到實(shí)用的建議。在「聊天」和「靈感發(fā)現(xiàn)」的記錄，可以通過點(diǎn)擊首頁左上角菜單圖標(biāo)查看。關(guān)于用戶數(shù)據(jù)的問題，我們也在隱私協(xié)議中看到，騰訊承諾不會(huì)將這些對(duì)話記錄用戶實(shí)際模型訓(xùn)練。關(guān)于「騰訊混元助手」更多的功能和細(xì)節(jié)，請(qǐng)留意我們后續(xù)更詳細(xì)的體驗(yàn)，你對(duì)哪些功能體驗(yàn)更感興趣，也歡迎在評(píng)論區(qū)告訴我們。

國產(chǎn)大模型狂奔

國內(nèi)跨界互聯(lián)網(wǎng)的創(chuàng)業(yè)者無不希望抓住這個(gè)可能比移動(dòng)互聯(lián)網(wǎng)更大的機(jī)會(huì)，大模型創(chuàng)業(yè)的熱潮洶涌。

從美團(tuán)聯(lián)合創(chuàng)始人王慧文廣發(fā) AI 英雄帖打造中國 OpenAI 開始，如今主要的互聯(lián)網(wǎng)和科技公司都悉數(shù)投入到這場(chǎng)競(jìng)爭(zhēng)中。

百度的文心一言，阿里的通義千問，騰訊的混元大模型，字節(jié)跳動(dòng)不久前也公開測(cè)試大模型應(yīng)用「豆包」。最近的手機(jī)廠商發(fā)布會(huì)，華為鴻蒙 4 的推出和雷軍年度演講，大模型也成為主角。

但無論是 ChatGPT 還是國內(nèi)外一眾大模型，也還沒真正出現(xiàn)面向普通用戶的「殺手級(jí)應(yīng)用」，商業(yè)化的路徑尚還未成熟，目前明顯從 AIGC 浪潮中盈利的，還是「賣鏟子」的英偉達(dá)。

因此，擁有 13.3 億微信月活用戶的騰訊，怎么將大模型應(yīng)用和龐大的 C 端用戶體驗(yàn)結(jié)合，自然更加備受關(guān)注，這樣的體量也是騰訊不能急于將半成品推出的的重要原因。

至于騰訊用戶最多的兩款產(chǎn)品——微信和 QQ，是否以及何時(shí)會(huì)接入混元大模型，目前尚不確定，但蔣杰表示團(tuán)隊(duì)內(nèi)部已經(jīng)在推進(jìn)。

實(shí)際上騰訊上在大模型上的布局并不算慢，目前國內(nèi)估值最高的兩家大模型創(chuàng)業(yè)公司——光年之外和 MiniMax 也與騰訊有合作。

其中成立不到 2 年的 MiniMax ，在今年 3 月推出面向企業(yè)用戶的 API 開放平臺(tái)，支持文本和語音模型的服務(wù)調(diào)用，已經(jīng)成為抖音火山引擎和金山 WPS AI 的底層大模型，也是首批通過備案的大模型公司之一，估值達(dá)到 12 億美元。

在發(fā)布混元大模型前，騰訊云在 6 月份已經(jīng)推出了面向 B 端客戶的行業(yè)大模型，覆蓋了金融、文旅、政務(wù)、傳媒、教育等 10 大行業(yè)，提供超過 50 個(gè)解決方案。

奇績(jī)創(chuàng)壇創(chuàng)始人兼 CEO 陸奇認(rèn)為，全球范圍內(nèi)只有兩個(gè)國家和地區(qū)具備大模型產(chǎn)業(yè)核心的能力，就是北美和中國。他在之前的演講提到，中國大模型追趕 OpenAI 有三大關(guān)鍵要素：

第一是打造基礎(chǔ)模型，是攀升至 GPT-3.5。

第二是要打造模型產(chǎn)業(yè)化的能力。

第三是平臺(tái)開發(fā)和生態(tài)建立。

如果稍微留意 ChatGPT 最近的動(dòng)態(tài)，OpenAI 同樣在朝著三個(gè)方面發(fā)力。而首批中國大模型產(chǎn)品通過備案后，第二第三批或許也不遠(yuǎn)了，各家都在沖刺大模型，上演大模型時(shí)代「百團(tuán)大戰(zhàn)」，但這場(chǎng)長(zhǎng)跑才剛剛開始。

無論是科技互聯(lián)網(wǎng)行業(yè)的格局，還是一個(gè)普通打工人的未來，或許在 2023 這一年，已經(jīng)埋下了草蛇灰線。