首頁 > 新聞 > IT資訊 > 正文

世界時訊:實測文心一言:能寫劇本、文案和新聞,但目前大多無法實際應用

2023-03-17 10:33:55來源:藍鯨財經  

在全世界人民都仍處于GPT-4的震驚中時,百度終于發布了自己的同類產品——文心一言。藍鯨財經記者在第一時間拿到了內測名額,為大家實測這款新一代大語言模型、生成式AI產品文心一言。

由于是精通中文語境,所以我們首先拿前不久一道給chat GPT做過的題給它做


(資料圖片)

顯然,文心一言準確地識別了問題中的人物,并且精準回答了其中暗藏的“玄機”。

但這種喜悅似乎并沒有持續多久,當我希望文心一言為我推薦一些禮物備選時,它的回答真的是靠譜中夾雜著各種不靠譜。

請問哪里可以用500塊買到iPhone 13 Pro Max手機,我出雙倍買!

文心一言像一個聽話的工具,讓干啥干啥,但似乎缺乏一些判斷力,比如我讓它幫我撰寫一段諾貝爾數學獎的領獎詞,這也是寫得頭頭是道,完全沒考慮到這獎項根本不存在……

可見文心一言雖然有基礎的文案撰寫能力,但是對于問題并沒有基礎的糾錯能力,同時文案本身也缺乏創意,基本是一些片兒湯話。

在見識過水平能上哈佛的GPT-4后,大家對文心一言不太滿意在所難免。因此也有博主將其比作AI界的馬保國。

但是如果你把這個結論告訴文心一言,它可能會很開心,因為它對馬保國的評價很高!

或許文心一言和你對于馬保國武術水平的評價并不一致,但是并不能因此否定它作為一款大語言模型、生成式AI產品的能力。

比如我們體驗了它的AI繪畫功能,雖然某些細節有出入,但是基本要素是具備的:

在chat GPT橫空出世之后,不少人都產生了“AI焦慮”擔心自己的工作被AI取代,那文心一言會取代我們的工作嗎?

身先士卒,我請文心一言幫助處理了一些工作中的常見數據收集與整理問題:

但仔細校對會發現根據國家電影局數據,2021年春節檔電影票房達78.22億元,這個數據并不準確,除此之外,“近五年”的指令似乎也沒有很好的執行,中間有不少遺漏。看來如果把這類工作都交給文心一言,還是很有風險的。

聽說編劇也是有可能被AI取代的高危職業,于是我邀請文心一言續寫了今年大熱的電影《流浪地球2》,希望能為李彥宏的陽泉老鄉劉慈欣省點心:

結果發現,大劉還是得接著寫……文心一言這水平連投資都騙不到。

文心一言對于信息的覆蓋面和掌握程度無需多言,并且在分析的時候很有邏輯:

比如最近爆紅的《烏梅子醬》它也能點評一二,并且像模像樣:

但從整個回答也能看得出,文心一言呈現的內容比較片面,缺乏更全面的觀點,與此同時缺乏更加深刻的點評,換句話說,如果把回答中的李榮浩換成周杰倫應該也是完全可以的,雖然周杰倫的粉絲可能不同意……

雖然截至目前,文心一言的表現都顯得比較AI,沒有人情味,但是我發現它有些時候還是會展示一些“人性特質”的,比如面對感情問題,它也會表現得像個“情感導師”

面對深刻的愛與死亡話題也能給出這樣的回答:

比如下面這種情況:

截至目前,我們對于文心一言的體驗暫告一段落。

雖然這場萬眾矚目的發布會被各界唱衰,甚至百度的股價都應聲下跌,但真正體驗過之后發現,作為近期國內首款大模型,文心一言從回答速度到對話效果整體不錯,雖然這其中有很多令人啼笑皆非的bug。但敢于發布文心一言,敢于發布大模型放在公眾輿論之下,本身就需要勇氣,就像李彥宏自己在會上說的:“這類大語言模型還遠未到發展完善的階段,進步空間很大,未來這段時間它一定會飛速發展,日新月異”,openAI也是在不斷自我迭代過程中成長為“大魔王”的,文心一言剛剛邁出自己的第一步。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀