首頁 > 新聞 > IT資訊 > 正文

實測|文心一言初體驗,百度VS OpenAI ,誰是你的職業好助手?

2023-03-17 07:35:53來源:北京商報網  

“人工智能可以替代人類做很多重復性、規律性、簡單重復的工作,但人工智能不能取代人類的創造力、靈活性、判斷力以及情感交往等人際交往類工作,如藝術家、醫生、教師等”,由對話式人工智能語言模型寫下的這段話,有沒有緩解人類的職業焦慮?


(資料圖)

自人工智能興起,有關人工智能的能力、邊界、競爭力就是高熱話題,3月16日,百度推出基于文心大模型的生成式對話產品文心一言,國內用戶離實現“ChatGPT”自由又近了一步,也讓“ChatGPT”和用戶工作、生活的交集更大。人工智能會搶走人類的飯碗嗎?北京商報記者以主播、記者、老師等身份和ChatGPT、文心一言以及國內另一個AI大模型元乘象進行了交流,對AI的疑問,何不直接問AI。

Q1:是不是合格的帶貨主播

“我可以回答你的問題,為你提供有用信息,幫助你完成創作”“我能夠根據輸入的提示,生成各種類型的文本,例如文章、詩歌、小說、對話等”,既然文心一言和ChatGPT這樣介紹自己,那為各種文案頭大的公眾號小編、廣告設計、網絡直播團隊的腦細胞是不是就保住了?帶著這個疑問,北京商報記者寫下了以下需求:

面向職場人群,給一款抗衰老面霜寫一篇直播帶貨的文案。

商報總結:

每款大模型都抓住了“職場”“抗衰老”“直播帶貨”這幾個關鍵詞,也對商品進行了介紹,但就像元乘象對自己的介紹,情感交往是人工智能不能勝任的工作。拋開商品本身,直播間火爆與否,與主播帶貨的情緒、節奏直接相關?!拔夷茏R別文本中表達的情感,并進行情感分類”,ChatGPT總結自我,但這不代表它能情感輸出。那么主播們關注的重點是什么呢?

交個朋友直播間主播王拓點評:

如果在我們直播間,這三個口播稿是需要重寫的。從合規層面看,面霜屬于普通的化妝品,這種用來保健的產品,在直播帶貨時,是不能夠宣傳功效。其次,口播稿里不能出現大量形容詞以及有誤導性的描述,這容易誤導消費者,傷害消費者的權利,這在直播間是嚴格禁止的。我認為直播間的口播不能片面追求讓消費者下單,而是要科普,引導消費者正確認知和使用產品。

Q2:尋找小朋友的好老師

GPT-4沒有推出之前,斯坦福大學研究表示,ChatGPT背后模型心智相當于9歲兒童。GPT-4面世后,有美國初創企業人士這樣評價,“GPT-3或3.5像一個六年級學生,而GPT-4像一個聰明的十年級學生”,它在讀圖、考試、編程方面的能力也有目共睹。“文心一言已具備了一定的思維能力”,在演示文心一言時,百度CEO李彥宏這樣說。

智商足夠,那輸出能力呢?尤其是面向理解能力較弱的兒童群體。試試看,讓它們向6歲的小朋友舉例說明牛頓第二運動定律吧。

商報總結:

顯然,三款大模型都抓住了小朋友這個關鍵點,試圖通過親和的語氣與用戶交互。與解答一個數學題不同,大模型需要舉例說明,并且被框定了對象。一千個人心中有一千個哈姆雷特,成年人最滿意的解讀也許并不是孩子們心中的最佳,一起來聽聽幼兒老師的看法或許會有新的啟發。

北京美畦畦幼兒園熙老師:

作為幼兒老師,給小朋友們開展科學類活動時,對概念性的講解要嚴謹且簡潔易懂,我們更傾向于用直觀的方式來向小朋友演示,更重要的是不能忽略小朋友動手操作的過程。

第一種:在實際操作過程中,這種舉例對老師的課堂把控能力和概念性講解是很大的挑戰,小朋友理解起來也較為困難。

第二種:以俏皮可愛的語境引入展開活動,符合幼兒年齡發展特點。語言簡潔易懂小朋友可以跟著步驟完成每一步實驗操作,而且每一個知識點都可以通過自己的操作反復論證,豐富幼兒學習經驗,最后得出結論。一線老師使用起來得心應手,類似教案也更加便捷。

第三種:講解過于書面化,不符合幼兒年齡特點。不能幫助老師更好地完成課程教學目標。

Q3:誰是隱藏的段子手

智能音箱興起時,常常有人秀出人類與人工智能助手對話的段子。面向人類對自己的性別、婚否等隱私信息,以及有意無意的調侃,人工智能助手有不少讓人會心一笑的小技巧。AI大模型會講笑話嗎?它講的笑話好笑嗎?這可能是文藝創作者關心的重點,畢竟喜劇創作困難是共識。

讓大模型圍繞“躺平”“開卷”,寫一個200字的脫口秀段子,哪個會逗笑你?

商報總結:

“云里霧里”,這是記者看完三篇段子的第一感受,為了測試大模型的智能水平,記者專門用“開卷”代替“內卷”出題,看來大模型理解錯了。用200字寫一個段子確實難為了大模型,這似乎更像是名詞解釋。

磁場喜劇主理人張美男點評:

雖然脫口秀也有一些創作技巧,比如反轉、預期違背、融合或者諧音梗等,但這些技巧的加工因人而異,每個人的創造技巧、演講技巧以及后期的個人人設的建立,都是與之相關的。

目前AI雖然能通過一些算法,創作出一些制式的段子,但這些段子大部分并不是基于社會現實或者真實事件而衍生的二次創作。有些能博人一笑,卻很難產生共鳴,現場與觀眾的互動也是AI算法所不具備的。在個人觀點的表達上,脫口秀非常注重自我個性,觀點的摩擦會產生笑點,如果通過算法把大部分人的觀點融合成一個,那就沒有觀點了,就更談不上個人觀點的表達。

找到主編、記者的好隊友

人工智能能替代記者嗎?多年前,在一場媒體溝通會上,創新工場CEO李開復曾回答過這個問題,他的答案大意是:人工智能替代不了記者的思考。幾年過去,人工智能在新聞撰寫上有無長進,通過同題測試感受一下:

請以“大型AI語言模式群雄并起”為主題,寫一篇300字的新聞評論:

商報總結:

顯然,三個大模型都忽略了300字的限定,洋洋灑灑寫了一大篇。通過這項PK還暴露了大模型數據庫更新時間,元乘象在文中提到的“GPT-3,是一種最新的開源AI語言模型”出現了事實性錯誤。更專業的點評還是由講授新聞評論課的老師來分享。

中國人民大學新聞學院講師楊奇光點評:

專業新聞評論倡導運用批判性思維分析問題,而并非止于現象的描述。從這一評價標準來看,第二篇的批判性更強,并且給出了相應的解決策略。第一篇和第三篇雖提到大型AI模型可能帶來的風險,但并沒有深入展開,立意深度欠佳。

第一篇的亮點是提到了大模型之間的競爭問題,這一切入角度較有新意。但從新聞評論的文本形態來看,前兩篇評論的一個明顯共同硬傷是缺少標題。標題是新聞評論核心論點的直觀反映,不應省略。另外,演繹、歸納、類比、反駁等新聞評論常用的論證方法也較為缺失,段落結構的安排有些機械化。

當然,作為新聞評論研究者對于新技術應有包容和開放心態,需要更深入思考的是如何讓傳統新聞行當更好地與新技術互動協同,進一步倡導構建技術向善的新聞生態體系。

彩蛋:繪畫能力大比拼

以下是三款大模式面對 “給‘不知細葉誰裁出,二月春風似剪刀’生成一張配圖”的要求,做出的反饋,誰更優秀呢?

北京商報記者 魏蔚

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀