首頁 > 新聞 > 智能 > 正文

騰訊發(fā)布混元大模型!在微信里有個(gè)「賈維斯」是什么體驗(yàn)?

2023-09-07 17:22:49來源:ZAKER科技  

8 月 31 日,注定成為國產(chǎn)大模型歷史上的關(guān)鍵轉(zhuǎn)折。多家國產(chǎn)大模型公司通過備案,陸續(xù)向全社會(huì)公眾開放服務(wù)。

這意味著國產(chǎn)大模型進(jìn)入一個(gè)全新的階段,國產(chǎn)大模型可以向數(shù)以億計(jì)的用戶提供服務(wù),同時(shí)也將面臨同樣倍數(shù)的審視和挑戰(zhàn)。

剛剛,騰訊也正式發(fā)布了自研的通用大語言模型——混元大模型。


【資料圖】

目前騰訊已經(jīng)有超過 50 個(gè)自有產(chǎn)品和業(yè)務(wù)接入混元大模型測(cè)試,包括騰訊云、騰訊廣告、騰訊文檔、微信搜一搜、QQ 瀏覽器等,接下來騰訊預(yù)計(jì)還會(huì)有更多產(chǎn)品接入。

比起百度阿里,騰訊作為國內(nèi)互聯(lián)網(wǎng)巨頭在大模型應(yīng)用上似乎更加謹(jǐn)慎,其實(shí) AIGC 在騰訊內(nèi)部?jī)?yōu)先級(jí)已非常高,馬化騰在 5 月的騰訊財(cái)報(bào)會(huì)議上也直接表明了騰訊的態(tài)度:

我們最開始以為這是互聯(lián)網(wǎng)十年不遇的機(jī)會(huì),但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇,所以我們覺得(AI)非常重要……但是并不急于早早做完,把半成品拿出來展示。

愛范兒也獲得了體驗(yàn)資格,并在第一時(shí)間給你挖掘到更多細(xì)節(jié)。

混元大模型,請(qǐng)多指教

混元者,元?dú)馕捶郑煦鐬橐唬獨(dú)庵家病拿Q上就可以看出,渴望「開天辟地」的騰訊對(duì)混元大模型寄予了厚望。

作為騰訊全鏈路自研的通用大語言模型,混元大模型擁有優(yōu)異的語料庫、創(chuàng)新的大模型算法、自研 Angel 機(jī)器學(xué)習(xí)框架、強(qiáng)大的算力基礎(chǔ)設(shè)施。

針對(duì)實(shí)際的應(yīng)用場(chǎng)景,騰訊混元大模型的主要研發(fā)團(tuán)隊(duì)代表,騰訊集團(tuán)副總裁蔣杰也在發(fā)布會(huì)上演示了致力于更可靠、更成熟的混元大模型。混元大模型更可靠,經(jīng)過大量的研究和嘗試,混元大模型找到一種基于探真的方法,有效降低大語言模型 30%-50 % 的幻覺率。

更可靠的混元大模型還能識(shí)別「陷阱」,抗拒「誘導(dǎo)」,讓模型對(duì)不安全的問題說「不」。

面對(duì)挑戰(zhàn),更成熟的混元大模型能夠處理超長(zhǎng)文本的生成和續(xù)寫能力,比如撰寫一篇關(guān)于農(nóng)業(yè)裝置專利。混元大模型提出思維鏈的新策略,有效強(qiáng)化模型對(duì)問題拆解和分布思考的傾向。蔣杰的展望是,大模型可以像人一樣結(jié)合實(shí)際的應(yīng)用場(chǎng)景合理地做出推理。蔣杰向混元大模型提問了關(guān)于「你是誰、混元大模型的核心架構(gòu)是什么、混元大模型的參數(shù)是多少?」等問題,可以看出,混元大模型的回答充滿條理性。值得注意的是,混元大模型的更新截止到 2023 年 7 月,且仍在不斷迭代。為了演示混元大模型的邏輯推理能力,蔣杰向混元大模型提出邏輯思考題:「買一堆咖啡,上午喝了一半,下午又喝了剩下的一半,還剩 30 杯,一共買了多少杯」。在極短的時(shí)間內(nèi),混元大模型就給出了正確的答案。相較于主流大模型注重參數(shù)和評(píng)測(cè),騰訊混元大模型更關(guān)注應(yīng)用。

比如在與騰訊會(huì)議的結(jié)合中,混元大模型可以生成整場(chǎng)會(huì)議的總結(jié),整理會(huì)議的相關(guān)細(xì)節(jié)。

與騰訊文檔的結(jié)合,發(fā)布會(huì)還演示了混元大模型的文本歸納、文檔創(chuàng)作與編輯,翻譯等能力,掌握數(shù)十種文本生成場(chǎng)景,輕松根據(jù)數(shù)百種公式生成 Excel 圖表。與騰訊廣告的結(jié)合中,混元大模型適應(yīng)行業(yè)與地域特色,滿足千人千面需求,實(shí)現(xiàn)文字、圖片、視頻的自然融合,廣告生成效果以 42% 的用戶采納率超過主流的 Midjourney,遠(yuǎn)遠(yuǎn)超過開源的 Stable Diffusion 模型。在 AI 大模型的賽道上,騰訊的布局其實(shí)要早得多。

2019 年,騰訊推出了廣告推薦 MoE 大模型,單模型參數(shù)超千億。

2021 年,騰訊推出千億規(guī)模的 NLP 大模型,顯著提高模型訓(xùn)練推理效率、降低成本。

進(jìn)入 2022 年,厚積薄發(fā)的混元大模型迎來了收獲的季節(jié),5 月,混元 AI 大模型同時(shí)登頂 CLUE 總排行榜、閱讀理解、大規(guī)模知識(shí)圖譜三個(gè)榜單,一舉打破三項(xiàng)紀(jì)錄。

一個(gè)月后,騰訊多模態(tài) AI 大模型率先被應(yīng)用在廣告投放,當(dāng)時(shí)累計(jì)給廣告主帶來 15% 的 GMV 提升。

這些積累都給混元大模型奠定了基礎(chǔ)。

騰訊混元大模型初體驗(yàn)

「騰訊混元助手」首頁由「聊天」和「靈感發(fā)現(xiàn)」兩個(gè) Tab 組成,「聊天」功能和會(huì)話類 AI 產(chǎn)品類似,與 ChatGPT 不同的是,「騰訊混元助手」已經(jīng)集成了不少指令集,同時(shí)會(huì)在首頁給你推薦一些問題。

正在發(fā)布會(huì)現(xiàn)場(chǎng)趕稿的我,也嘗試了讓它來寫稿,看看能不能幫我節(jié)省些時(shí)間(moyu)。在「靈感發(fā)現(xiàn)」里則集成了不同行業(yè)眾多常用場(chǎng)景的應(yīng)用,包括工作、編程、營銷、生活、角色扮演、娛樂等領(lǐng)域。你可以直接讓它生成代碼、寫種草文案,也能讓它扮演不同的角色,比如對(duì)新手父母可以直接點(diǎn)擊「教育專家」,孩子在不同階段遇到的各種問題都能給到實(shí)用的建議。在「聊天」和「靈感發(fā)現(xiàn)」的記錄,可以通過點(diǎn)擊首頁左上角菜單圖標(biāo)查看。關(guān)于用戶數(shù)據(jù)的問題,我們也在隱私協(xié)議中看到,騰訊承諾不會(huì)將這些對(duì)話記錄用戶實(shí)際模型訓(xùn)練。關(guān)于「騰訊混元助手」更多的功能和細(xì)節(jié),請(qǐng)留意我們后續(xù)更詳細(xì)的體驗(yàn),你對(duì)哪些功能體驗(yàn)更感興趣,也歡迎在評(píng)論區(qū)告訴我們。

國產(chǎn)大模型狂奔

國內(nèi)跨界互聯(lián)網(wǎng)的創(chuàng)業(yè)者無不希望抓住這個(gè)可能比移動(dòng)互聯(lián)網(wǎng)更大的機(jī)會(huì),大模型創(chuàng)業(yè)的熱潮洶涌。

從美團(tuán)聯(lián)合創(chuàng)始人王慧文廣發(fā) AI 英雄帖打造中國 OpenAI 開始,如今主要的互聯(lián)網(wǎng)和科技公司都悉數(shù)投入到這場(chǎng)競(jìng)爭(zhēng)中。

百度的文心一言,阿里的通義千問,騰訊的混元大模型,字節(jié)跳動(dòng)不久前也公開測(cè)試大模型應(yīng)用 「豆包」。最近的手機(jī)廠商發(fā)布會(huì),華為鴻蒙 4 的推出和雷軍年度演講,大模型也成為主角。

但無論是 ChatGPT 還是國內(nèi)外一眾大模型,也還沒真正出現(xiàn)面向普通用戶的「殺手級(jí)應(yīng)用」,商業(yè)化的路徑尚還未成熟,目前明顯從 AIGC 浪潮中盈利的,還是「賣鏟子」的英偉達(dá)。

因此,擁有 13.3 億微信月活用戶的騰訊,怎么將大模型應(yīng)用和龐大的 C 端用戶體驗(yàn)結(jié)合,自然更加備受關(guān)注,這樣的體量也是騰訊不能急于將半成品推出的的重要原因。

至于騰訊用戶最多的兩款產(chǎn)品——微信和 QQ, 是否以及何時(shí)會(huì)接入混元大模型,目前尚不確定,但蔣杰表示團(tuán)隊(duì)內(nèi)部已經(jīng)在推進(jìn)。

實(shí)際上騰訊上在大模型上的布局并不算慢,目前國內(nèi)估值最高的兩家大模型創(chuàng)業(yè)公司——光年之外和 MiniMax 也與騰訊有合作 。

其中成立不到 2 年的 MiniMax ,在今年 3 月推出面向企業(yè)用戶的 API 開放平臺(tái),支持文本和語音模型的服務(wù)調(diào)用,已經(jīng)成為抖音火山引擎和金山 WPS AI 的底層大模型,也是首批通過備案的大模型公司之一,估值達(dá)到 12 億美元。

在發(fā)布混元大模型前,騰訊云在 6 月份已經(jīng)推出了面向 B 端客戶的行業(yè)大模型,覆蓋了金融、文旅、政務(wù)、傳媒、教育等 10 大行業(yè),提供超過 50 個(gè)解決方案。

奇績(jī)創(chuàng)壇創(chuàng)始人兼 CEO 陸奇認(rèn)為,全球范圍內(nèi)只有兩個(gè)國家和地區(qū)具備大模型產(chǎn)業(yè)核心的能力,就是北美和中國。他在之前的演講提到,中國大模型追趕 OpenAI 有三大關(guān)鍵要素:

第一是打造基礎(chǔ)模型,是攀升至 GPT-3.5。

第二是要打造模型產(chǎn)業(yè)化的能力。

第三是平臺(tái)開發(fā)和生態(tài)建立。

如果稍微留意 ChatGPT 最近的動(dòng)態(tài),OpenAI 同樣在朝著三個(gè)方面發(fā)力。而首批中國大模型產(chǎn)品通過備案后,第二第三批或許也不遠(yuǎn)了,各家都在沖刺大模型,上演大模型時(shí)代「百團(tuán)大戰(zhàn)」,但這場(chǎng)長(zhǎng)跑才剛剛開始。

無論是科技互聯(lián)網(wǎng)行業(yè)的格局,還是一個(gè)普通打工人的未來,或許在 2023 這一年,已經(jīng)埋下了草蛇灰線。

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀