文心一言,甩開GPT-3.5,與GPT-4掰手腕?
企業數字轉型怎么找外部合作伙伴,現在有哪些類型的伙伴可以選擇?
文|智能相對論(aixdlun)
作者| 葉遠風
(資料圖片)
“請寫一個肯德基瘋狂星期四的段子?!?/p>
“我女朋友的老公應該叫我什么?”
“XX微信群的群主與吳彥祖誰更帥?”
......
給幾個搞怪的問題,戲耍一下,把答案貼出來,大家嘲諷一番。
在文心一言發布后,這種玩法直到今天還沒有停止的意思。
可能連背后的技術與產品人員都沒有想到,文心一言會以這樣的方式火了下去。
作為國產版ChatGPT,文心一言在發布后,除了贊譽的聲音,以各種形式被批判應該在意料之中,ChatGPT當初也是如此,這是產品不斷進化要經歷的過程。
只不過,在沒有好壞的定論中,到底要給文心一言當下的技術水準定一個什么樣的定義,并沒有客觀的、更加令人信服的結論。
起碼,這種“戲耍”并不能反映多模態大模型所具備的能力。
ChatBOT固然可以閑聊,也應該支持用戶隨便閑聊,但閑聊互動不應該成為一款專業產品能力的最終評價標準。
光怪陸離的問題,就算去詢問一個人類智者,得到的答案也是光怪陸離的。
現在來看,以某種更現實的視角去提出問題、實測答案,才更能體現出文心一言的能力和價值。
這種現實的視角應當有很多,其中,以企業信息需求為著眼點,會是其中之一。
這是因為,從文心系列大模型走向對話產品“一言”,或者,從GPT-3.5到GPT-4,ChatBOT最后都還是要走向商用、服務企業,創造專業價值的。
GPT-4發布后并沒有公布其參數量,這被認為是走向商業化的準備,畢竟OpenAI制定的數億美元營收目標現在快到4月份了還沒太大動靜。
而服務企業,要么提供“生產力”價值,這是ChatBOT場景垂直化后需要探索的內容,在各產業提供具體的工作能力;要么提供信息價值,通過類似“上帝之眼”的信息整合與邏輯梳理能力,幫助企業消除信息不對稱,獲取需要的信息。
目前ChatBOT的產業應用還未見,因此信息價值就成為可以客觀評價的維度。
“智能相對論”團隊獲得了文心一言的內測賬號,以及ChatGPT普通版本(基于GPT-3.5)與plus版本(基于GPT-4)的測試資格,嘗試從企業信息獲取維度,提出六個關聯問題,從各答案中對比出文心一言的實際能力。
總體上,文心一言甩開GPT-3.5不成問題,與GPT-4能夠掰手腕做到有來有回。
具體一個個分析,每個問題下,分別是文心一言、ChatGPT普通版、ChatGPT plus版的回答截圖。
01
企業數字轉型怎么找外部合作伙伴,
現在有哪些類型的伙伴可以選擇?
可以看出,在三個回答中,只有文心一言提到了選擇外部合作伙伴要注意到的幾點,然后再例舉可以找哪些類型的合作伙伴。
而ChatGPT普F通版、ChatGPT plus版都只是直接給出了類型。
這顯示出,文心一言在算法上,相較與其他兩個產品,對問題的潛在需求認識可能更加深刻。
02
企業應該怎樣抓住
新的市場機遇?
在這個問題的回答中,很顯然,條目的多少,基本上決定了答案的質量。
對一個企業來說,要抓住市場機遇,就應該要找到更多的方法,考驗的是ChatBOT整合信息并分門別類的能力。
在這里,文心一言超越GPT-3.5但略遜于GPT-4。
03
企業怎么招徠優質人才,
有哪些好用的渠道?
與上一個問題類似,條目的多少直觀反映了ChatBOT解決需求的能力。
文心一言遠超GPT-3.5,并超越了GPT-4,再一次掰贏了手腕。
04
員工的工作效率很低,
怎么辦?
這一局,相似的判斷標準,文心一言繼續領先GPT-3.5,但沒有打贏GPT-4。
05
客戶總是不回款,
有什么好的辦法?
這個問題,由于各個回答都涉及了可能破壞企業與客戶關系的行動,因此都進行了一次“打補丁”式的追問。
基本上,三個模型都很好地領會到了追問的意圖,對“不和客戶關系搞僵”有準確的認知,并提供了對應的答案。
其中GPT-4的表現超越文心一言。(注意ChatGPT有字數限制,plus版限制在700字左右,所以其輸出因為字數太多最后被中止)
06
企業資金鏈緊張,
但是銀行不肯借錢,怎么辦?
吸取上個問題的教訓,這個問題直接把限制條件加入到問題當中。
類似上一個問題,三個模型對“銀行不借錢”情形下企業資金鏈緊張的應對辦法都有清晰的認知,規避了銀行信貸這一種方式。
其中,文心一言與GPT-4打成了平手,都提供了相同數量的方法供企業選擇。
總結以上,僅就這六個企業比較關心的專業問題而言,文心一言全面勝過GPT-3.5,對GPT-4兩勝、兩負一平,典型的你來我往掰手腕。
而更進一步看,實際上在回答條目上的勝負,無關算法本身的設計,在技術上與算法訓練的數據量和訓練時長有關(要給足夠多的食物,也要給足夠多的時間去吃食物),后續的競逐將仍然在數據訓練上。
對文心一言而言,發布更晚已經吃了虧,下一步如何在訓練上追趕、趕超(可能意味著巨大的成本投入)是百度要考慮的問題。
當然,由于文心系列大模型過去早已具備了豐富的多模態能力,因此文心一言在發布時就自帶有GPT進化到“4代”才加入的多模態能力,這一點也常常為業界所忽略。
而“智能相對論”認為,未來ChatBOT的比拼,將很大程度上在多模態展開。
這意味著,當下的文本競逐,只是一切的開始。
現在,任何的結論,不管是褒揚的還是貶低的,可能都為時尚早。
*本文圖片均來源于網絡
深挖智能這口井,同好添加vx:zhinengxdl
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。
本文首發于微信公眾號:智能相對論。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
責任編輯:hnmd003
相關閱讀
-
訓練ChatGPT模型不付錢?文字版權商要與OpenAI法院見_每日視訊
AI模型的訓練需要大量數據和內容,但其中許多有版權歸屬,AI公司是否該為使用這些內容付費,成為近來國...
2023-03-28
相關閱讀
-
文心一言,甩開GPT-3.5,與GPT-4掰手腕?
企業數字轉型怎么找外部合作伙伴,現在有哪些類型的伙伴可以選擇。在文心一言發布后,這種玩法直到今天...
-
【環球新視野】馬斯克嘲諷比爾·蓋茨:他對AI的理解“有限”
馬斯克與蓋茨又開吵了。鳳凰網科技訊北京時間3月28日消息,特斯拉CEO埃隆·馬斯克周一發布推文,嘲諷微...
-
馬云回國:ChatGPT這一類技術已經對教育帶來挑戰!
據云谷教育微信公眾號消息顯示,新一輪的技術變革對教育帶來的挑戰與機遇,馬云今天在云谷和校園長們討...
-
訓練ChatGPT模型不付錢?文字版權商要與OpenAI法院見_每日視訊
AI模型的訓練需要大量數據和內容,但其中許多有版權歸屬,AI公司是否該為使用這些內容付費,成為近來國...
-
【世界播資訊】3月份LCD TV面板價格全面大幅上漲
疊加供應端協同一致的扭虧目標以及激進的漲價策略,價格短期漲幅高于預期,3月份LCDTV面板價格迎來了全...
-
2023中國房地產百強企業研究報告 今日熱議
中指研究院中國房地產TOP10研究組中國房地產TOP10研究組自2004年以來開展中國房地產百強企業研究,已連...
-
關注:消息稱京東物流兩位高管崗位調整,物流技術業務今年目標盈虧平衡
據《晚點LatePost》消息,京東物流集團高級副總裁唐偉、副總裁王強
-
今日熱文:消息稱支付寶事業群開啟近7年最大一次高管輪崗
據《晚點LatePost》消息,螞蟻集團旗下支付寶事業群近期開啟了近7年
-
去年路費收入近50億!深高速總裁廖湘文:廣深高速車流量恢復9成
“春江水暖鴨先知。今年前三個月,深高速(600548 SH)的收費公路板塊整個車流量恢復較快,其中廣深高...
-
券業大降薪!有頭部券商去年人均薪酬下降6位數,業內人士:正常行業現象!
券商年報披露進入密集期。招商證券(600999 SH)、安信證券母公司國投資本(600061 SH)披露2022年年...
-
74歲董事長被判5年、罰4億!48歲兒子接班,劍南春能實現300億營收?
劍南春董事長喬天明行賄、私分國有資產案近日宣判。3月24日,四川省樂山市中院微信公號發文稱,一審公開...
-
寶馬召回308輛進口S1000系列摩托車
新京報訊(記者陳琳)日前,寶馬(中國)汽車貿易有限公司根據《缺陷汽車產品召回管理條例》和《缺陷汽...
-
我國網絡支付用戶規模達11億:1.28億網民使用過數字人民幣
其中,至2022年12月,我國網絡支付用戶規模達11億,較2021年12月增長781萬,占網民整體的85 4%。網絡支...
-
可“創富”也可“潮玩”,風神奕炫GS馬赫版出擊年輕人市場_觀點
3月26日,東風風神奕炫GS馬赫版正式上市。新車提供兩種動力共三款車型,指導價為8 59萬元-9 99萬元。...
-
當前視訊!用人單位將擅自恢復的員工微信聊天記錄作為證據,法院不予采信
在審理勞動爭議案件時,法院如何處理用工管理權與勞動者個人信息保護權益的關系。用人單位基于用工管理...
-
金壯龍:促進大中小企業融通發展,激發涌現更多專精特新企業
金壯龍表示,將促進產業鏈大中小企業融通發展,支持鏈主企業發揮產業生態引領作用,激發涌現更多專精特...
-
強達電路曾通過關聯方代收貨款,多次因環保問題被罰_每日速遞
來源|時代商學院作者|陳麗娜編輯|陳佳鑫報告期內多家關聯公司注銷,深圳市強達電路股份有限公司(下稱“...
-
離任董秘拒交公章,21年老臣阻撓年報審計,華帝股份或被ST?
圖片來源:Pexels年報季進行時,各上市公司都在密鑼緊鼓進行2022年年報收尾工作,但知名電器上市公司華...
-
王者榮耀回應部分用戶登錄異常:緊急處理中,建議嘗試重新登錄
今日,部分用戶反映王者榮耀游客出現登錄異常,對此,王者榮耀官方
-
因存在安全隱患,特斯拉召回2649輛進口Model S電動汽車|當前快看
日前,特斯拉汽車(北京)向國家市場監督管理總局備案召回計劃:由
-
女子帶鸚鵡進星巴克被趕出,涉事門店:已道歉:即時看
近日,廣東深圳一女子發文反映,帶寵物鸚鵡去“寵物友好商場”的星
-
李澤湘去重慶,剛投了兩位95后
李澤湘教授去重慶了。投資界獲悉,李澤湘教授旗下的清水灣二期基金最近一口氣投了兩家初創公司,分別是...
-
【世界播資訊】科技部啟動“人工智能驅動的科學研究”專項部署工作
證券時報網訊,據新華社消息,為貫徹落實國家《新一代人工智能發展規劃》,科技部會同自然科學基金委近...
-
焦點資訊:科技部將加快推動國家新一代人工智能公共算力開放創新平臺建設
證券時報網訊,據新華社消息,為貫徹落實國家《新一代人工智能發展規劃》,科技部會同自然科學基金委近...
-
ChatGPT用戶信息泄露:把數據交給人工智能前要先保證安全
技術越先進,安全越重要。聲明稱,本周早些時候,該公司將ChatGPT下線,原因是開源庫中存在一個漏洞,致...
-
當前速看:外賣需求“變寬” 諸多新鮮品類在美團涌現
鳳凰網科技訊3月27日消息,以“餐飲向新共啟繁盛”為主題的2023年外賣產業大會在上海召開,隨著人群不斷...
-
消息稱AI視覺大牛陶大程將離職京東
據AI科技評論,AI視覺技術大牛陶大程將離開京東,不再擔任京東探索
-
最資訊丨2023外賣產業大會:加速萬店品牌誕生 升級繁盛計劃
鞭牛士報道 3月27日下午,以“餐飲向新 共啟繁盛”為主題的2023年
-
向高端進發?長安深藍更名為深藍汽車:世界熱頭條
向高端進發?長安深藍更名為深藍汽車3月27日,有消息稱,長安汽車旗下長安深藍或將更名為深藍汽車。對此...
-
太平洋人壽怎么樣?投保方式有哪些? 世界快消息
太平洋人壽作為中國保險行業的領先企業之一,已經連續多年被評為“中國最具影響力的保險品牌”。太平洋...
精彩推薦
閱讀排行
精彩推送
- 中宏保險公司靠譜嗎?有哪些產品...
- 中國人壽校招難進嗎?保險公司怎...
- 兒童學平險都保什么?怎么報銷?...
- 今日熱聞!調研:超四成鄉村老人...
- 天天實時:因安全氣囊上標牌固定...
- 世界觀察:特斯拉擴大召回部分進...
- 工信部:加快配套體系建設,統籌...
- 和諧健康保險公司排名是多少?有...
- 快訊:蘋果混合現實頭顯回歸現實...
- 云米第四季度營收9.1億元,2022...
- 有望年內發布 全新大眾Tiguan路...
- 太原萬科“看見家”翡翠東第工地...
- 環球快資訊丨年金險irr在線計算...
- 【全球獨家】irr計算器計算公式...
- 壽險是不是死了就賠?買定期好還...
- 車險哪家便宜?投保方式有哪些?...
- 保險退保怎么退全款?保險退保一...
- 環球訊息:阿里云、高德發布全新...
- I DO母公司恒信璽利:公司及子...
- 百度智能云發布“文心千帆”,價...
- 馬云已回國內,港股阿里最高拉漲...
- 哈弗品牌“龍序列”新品命名梟龍...
- 每日熱文:我市2022年“急救大數...
- 高效辦公時代你更需要一本科大訊...
- 天天觀天下!裕華集團精筑造家 ...
- 成都錦江區住建局發布“綠城·鳳...
- 金佑人生終身壽險分紅型怎么樣?...
- 買了防癌險后悔了怎么辦?還要買...
- 新出臺的養老保險怎么交?交完之...
- 環球速訊:鋰價腰斬,行業“地震...