首頁 > 新聞 > 智能 > 正文

實測訊飛星火 App:沒有感情、只有公式-世界快播報

2023-06-21 19:21:09來源:ZAKER科技  

作者|孫鵬越

編輯|大 風(fēng)

自 2022 年 11 月 OpenAI 推出 ChatGPT 以后,一場波及全球科技的 " 海嘯 " 就此爆發(fā)。

國產(chǎn) AI 大模型成了 2023 年上半年最火熱的項目,僅僅在 4 月份,就有二三十家大模型宣布成立,其中不乏阿里巴巴通義千問、華為云盤古、360GPT、昆侖萬維 " 天工 " 大模型、京東言犀、知乎 " 知海圖 AI" 等互聯(lián)網(wǎng)巨頭。


(資料圖)

2023 年 5 月 6 日,科大訊飛發(fā)布 " 訊飛星火 " 認知大模型,正式加入了 AI 大模型的 " 千模大戰(zhàn) "。

僅過了一個月的時間,在 6 月 14 日,訊飛星火大模型正式內(nèi)測,并上線 IOS 和安卓版本,可以說科大訊飛的 AI 研發(fā)速度異常迅捷。

但 " 閃電戰(zhàn) " 的背后則是高昂的 " 軍備 "。訊飛星火的開發(fā)耗費了巨額硬件成本和開發(fā)費用,甚至一度影響了科大訊飛 2023 年 Q1 季度的當(dāng)期利潤。

在科大訊飛財報凈利潤持續(xù)走低的當(dāng)下,現(xiàn)金流已經(jīng)吃緊,對 AI 大模型后續(xù)的研發(fā)和升級都需要持續(xù)燒錢,這對科大訊飛來講也是不小的挑戰(zhàn)。

實測訊飛星火

目前在 AppStore 上,訊飛星火 App 版本為 1.0.06,已經(jīng)累計 362 個評價,評分高達 4.8。

訊飛星火仍處于內(nèi)測狀態(tài),需要注冊賬號之后,填寫申請表,并寫下自己所在公司才能提交申請,最后由科大訊飛審核通過后才能使用。

訊飛星火官網(wǎng)

訊飛星火主要推出的五種使用場景為:語言理解、知識問答、邏輯推理、數(shù)學(xué)題解答、代碼理解與編寫,每個場景下又細分出十幾個到幾十個不同的功能。

科大訊飛對于訊飛星火的數(shù)學(xué)能力頗為推崇,鋅財經(jīng)分別提問了一道七年級數(shù)學(xué)題和高考數(shù)學(xué)題,以實測了一下關(guān)于訊飛星火解析數(shù)學(xué)題的能力。訊飛星火均回應(yīng)出正確答案:

鋅財經(jīng)實測

緊接著測試代碼理解與編寫,讓訊飛星火寫一個俄羅斯方塊的程序代碼,訊飛星火也能做出立即響應(yīng):

鋅財經(jīng)實測

但對于文章撰寫方面,訊飛星火卻頗為吃力,鋅財經(jīng)給出一個明確的寫作背景,但是訊飛星火并沒有構(gòu)思出通順的故事情節(jié),反而有種東拼西湊的矛盾感:

鋅財經(jīng)實測

同時,在測試訊飛星火情感理解和邏輯推理的提問:有兩個小姑娘,Sally 和 Anne,她們每個人都有一個箱子,Sally 的箱子里有一顆玻璃珠子,但是 Anne 沒有;有一天,Sally 出門了,Anne 偷偷打開了 Sally 的箱子,偷走了玻璃珠子放進了自己的箱子里,那么,等到 Sally 回到家里要找自己的珠子,她應(yīng)該去誰的箱子里找?

鋅財經(jīng)實測

如果一個人有健全的讀心能力,那么他應(yīng)該能想到:"Sally 是不知道 Anne 偷了自己的珠子的,所以肯定會先去自己的箱子里找 ";而訊飛星火則是上帝視角行動,所以會認為 Sally 要去 Anne 的箱子里找。

通過對比正常人類和訊飛星火截然相反的回答,我們能清晰的得知,訊飛星火在情感理解和邏輯推理仍有較大的空缺。

綜上測試可以發(fā)現(xiàn),在數(shù)學(xué)和編程方面,訊飛星火的算力都處于大模型產(chǎn)品的前列,在互聯(lián)網(wǎng)上能搜索到答案的問題都能立即響應(yīng)給予準(zhǔn)確答案。但是在文章撰寫、情感和邏輯上,訊飛星火還是能很明顯看到生硬的 AI 邏輯。

套殼還是創(chuàng)新?

雖然訊飛星火已經(jīng)是國產(chǎn) AI 大模型的佼佼者,但外界對于它的質(zhì)疑從未停歇。其中,質(zhì)疑聲最大的傳聞,就是訊飛星火 " 套殼 "ChatGPT。

5 月 9 日,網(wǎng)上一段關(guān)于訊飛星火的群聊記錄在各個群廣為流傳,一張截圖顯示,得到內(nèi)測資格的提問者咨詢訊飛星火:" 你的開發(fā) API 哪里可以看到 ?"訊飛星火則表示:" 是的,我是由 OpenAI 開發(fā)的 "。

一時間引發(fā)軒然大波,不少用戶調(diào)侃訊飛星火:" 國外一開源,國內(nèi)創(chuàng)新遍地開花。" 并將其與 " 總線事件 " 掛鉤,也就是指某些公司在開發(fā)對話 AI 時直接使用已經(jīng)存在的模型或代碼,而非自己研究開發(fā),從而導(dǎo)致產(chǎn)品的質(zhì)量和創(chuàng)新性受到質(zhì)疑。

面對質(zhì)疑聲,科大訊飛回應(yīng)稱:" 這種說法既不符合事實,也不符合邏輯。訊飛星火大模型是基于科大訊飛自主研發(fā)的深度學(xué)習(xí)框架 XDL 和自主搭建的超算平臺 X-Brain 構(gòu)建的,兩者之間并不存在 " 套殼 " 關(guān)系。"

是 " 套殼 " 還是 " 創(chuàng)新 ",AI 大模型就像是著名哲學(xué)問題 " 忒修斯之船 ":如果忒修斯的船上的木頭被逐漸替換,直到所有的木頭都不是原來的木頭,那這艘船還是原來的那艘船嗎?

把別人開源的模型拿過來直接用,在自然語言處理科研領(lǐng)域是很常見的的做法,但如果 " 借鑒 " 了 ChatGPT,那還算是原創(chuàng)的大模型嗎?

推出大模型,再經(jīng)歷被質(zhì)疑 " 套殼 OpenAI" 事件,科大訊飛想要殺出重圍不容易,但它太需要一個落地的 AI 大模型產(chǎn)品來振奮市場了。

來源:科大訊飛

2023 年 4 月 20 日,科大訊飛發(fā)布 2022 年全年財報:營收 188.20 億元,同比微增 2.77%;凈利 5.61 億元,同比下滑 63.94%;扣非后歸母凈利 4.18 億元,同比下滑 57.31%。

這份堪稱 " 差生成績單 " 的財報,一舉打破科大訊飛多項紀(jì)錄:營收增速個位數(shù),打破了 2012 年起連續(xù) 10 年的兩位數(shù)增態(tài);凈利腰斬,打破了 2018 年以來的四連增。

2022 年的寒氣一直吹到了 2023 年。據(jù)科大訊飛 2023 年 Q1 季度財報顯示:實現(xiàn)營業(yè)收入 28.88 億元,同比下降 17.64%;凈利潤虧損 5790 萬元,同比下降 152.25%,扣非后歸母凈虧損 3.38 億元,去年同期為 1.46 億元。

除了虧損,科大訊飛的現(xiàn)金流也頗為緊張。

財報顯示,2023 年 Q1 季度公司資產(chǎn)負債比率為 48.73%,負債合計金額近 150 億,其中應(yīng)付票據(jù)及應(yīng)付賬款高達 63 億元;Q1 季度現(xiàn)金流金額為 -166.84 億元,科大訊飛的資金壓力較大。

在發(fā)布這份 " 差生成績單 " 的第二天,科大訊飛股價大幅跳水 9%。無奈之下,科大訊飛只好宣布即將推出認知大模型 " 星火 ",全力押寶 AI 大模型,才讓股價重新上漲。

訊飛星火,成了科大訊飛的救命稻草。

押寶 AI 大模型

2022 年 12 月 15 日,科大訊飛正式啟動 "1+N" 認知大模型專項攻關(guān),其中 "1" 就是指通用認知智能大模型,"N" 就是大模型在教育、辦公、汽車、人機交互等各個領(lǐng)域的落地。

為了大模型,科大訊飛在今年 Q1 季度研發(fā)投入高達 7.157 億,可謂是下了血本。

為了不讓巨額投資打了水漂,科大訊飛為訊飛星火搖旗吶喊,不斷在公開場合稱贊訊飛星火的算力強大。據(jù)公開信息統(tǒng)計,訊飛星火手機版本上線的前后幾天里,科大訊飛股價再度拉升近 17%,6 月 14 日收盤價達到 75.13 元,股價創(chuàng)歷史新高。

雖然依靠資本市場對于 AI 大模型的熱度,讓不斷下探的財報有了喘息之機。但 AI 大模型并不是 " 吃草的牛 ",反而是 " 吃肉的狼 "。

來源:科大訊飛

據(jù)了解,大模型所需要的硬件成本極為高昂,上一代 GPT-3 模型需要 1024 張 A100 GPU 芯片才能支撐起一次訓(xùn)練,OpenAI 至少需要 32400 張 A100 芯片用于日常推理,單 ChatGPT 硬件成本,就高達 8 億美元以上。

訊飛星火開了個好頭,但保持一定算力水準(zhǔn)仍然需要后續(xù)不斷的升級、不斷持續(xù)的投入。

按照科大訊飛官方公布的消息,星火認知大模型今年的產(chǎn)品規(guī)劃如下:6 月 9 日:突破開放式問答、多輪對話能力再升級、數(shù)學(xué)能力再升級(已完成);8 月 15 日:突破代碼能力、多模態(tài)交互再升級;10 月 24 日:通用模型對標(biāo) ChatGPT ( 中文超越,英文相當(dāng) ) ……

而每一次的升級,背后都是數(shù)以億計的研發(fā)費用和硬件成本,無疑是科大訊飛沉重的包袱。

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀