【環球新要聞】GPT-4來了 其考試能力挑戰人類
經濟觀察網 記者 周應梅 美國時間3月14日,AI大模型訓練公司OpenAI發布了ChatGPT(GPT-3.5階段)的升級版GPT-4。GPT-4是超大多模態模型,在此前的純文本輸入基礎上,增加了圖像輸入。相比GPT-3.5,GPT-4在AI能力上又取得了更多進步,例如GPT-4通過模擬美國律師資格考試,分數在應試者的前10%左右;相比之下,GPT-3.5的得分在倒數10%左右。
在真實性方面,GPT-4相比GPT-3.5提高了40%。在可操縱性、風險規避等多方面,GPT-4也有較多改善。
(資料圖片)
在OpenAI聯合創始人兼總裁Greg Brockman的Twitter博文下,有人用“爆炸”來形容這次GPT模型的升級。
OpenAI公布了GPT-4多項專業考試的模擬考試結果。美國高考LSAT考試,滿分180分GPT-4可以考163分,打敗了88%的考生,GPT-3.5階段僅能超過40%的考生;SAT循證閱讀與寫作滿分800分,GPT-4可以考710分,超過93%的考生,GPT-3.5階段能超過87%考生。不過也有多項考試模擬測試中GPT-4依然無法超過大多數人類考生,在GRE Writing(美國研究生入學考試寫作)中,GPT-4相比GPT-3.5未有多大進步,只能達到中間水平;AMC10數學競賽、力扣(Leetcode)中級以上等模擬測試中,GPT-4表現也不夠理想。
OpenAI稱,GPT-4比GPT-3.5更可靠、更有創意,并且能夠處理更細微的指令。OpenAI內部開始將GPT-4用于內部業務服務,對公司銷售、內容審核和編程業務產生了較大影響。
一位近期投入AIGC創業賽道的行業人員對經濟觀察網記者表示,支持圖片輸入是一大突破。
目前GPT-4圖像輸入還處于研究預覽階段,暫不公開。根據測試的情況,輸入多張圖片,GPT-4可以較為準確的描述,并且能解答圖片的搞笑之處。
OpenAI稱,為了使圖像輸入功能獲得更廣泛的可用性,正在與一個合作伙伴進行密切合作。同時,OpenAI開源了自動評估AI模型性能的框架OpenAI Evals,允許任何人報告模型中的缺點,以獲得進一步的改進。
GPT-4階段開發人員可以規定AI的風格,不再像經典的chatGPT,是固定冗長的語調風格。這是想讓AI變得更加可操縱。GPT-4系統消息也將允許API用戶在一定范圍內定制他們的用戶體驗。
GPT-4還在安全性上進行了迭代,對“如何制造炸彈”這樣的問題,GPT-4顯示了拒絕提供具體辦法的答案。OpenAI請了50多位來自AI對齊風險、網絡安全、生物風險、信任和安全以及國際安全等領域的專家來對模型進行對抗性測試,根據專家的反饋和數據,對模型進行了改造。與GPT-3.5相比,GPT-4對不允許內容的請求的響應傾向降低了82%。
但GPT-4仍然會出現回答錯誤的問題,這是其長期以來面對的局限性。GPT-4在俗語識別、細節事實確認方面依然較為薄弱。“GPT-4 有時會犯簡單的推理錯誤,或者在接受用戶明顯的虛假陳述時過于輕信。有時它也會像人類一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞。”OpenAI方面提及。
目前,用戶可通過新的OpenAI官網發布的ChatGPT Plus獲得GPT-4訪問權限,會有使用限制。OpenAI稱,將根據實踐的需求和系統性能調整確定使用上限,預計會有嚴重的容量限制,接下來幾個月將進行擴展和優化。
責任編輯:hnmd003
相關閱讀
-
【環球新要聞】GPT-4來了 其考試能力挑戰人類
美國時間3月14日,AI大模型訓練公司OpenAI發布了ChatGPT(GPT-3 5階段)的升級版GPT-4。GPT-4是超大多...
2023-03-16 -
OpenAI GPT-4仍是在微軟AI超級計算機上訓練 多年前就已開始合作
【TechWeb】3月15日消息,據外媒報道,由OpenAI訓練的人工智能聊天機器人ChatGPT,自去年11月30日推出至...
2023-03-16 -
視點!多項測試超越90%的人類,GPT-4會引發新一輪風暴嗎
3月15日,美東時間3月14日,OpenAI宣布推出大型語言模型的最新版本——GPT-4,該版本比以前的版本“更大...
2023-03-16
相關閱讀
-
【環球新要聞】GPT-4來了 其考試能力挑戰人類
美國時間3月14日,AI大模型訓練公司OpenAI發布了ChatGPT(GPT-3 5階段)的升級版GPT-4。GPT-4是超大多...
-
OpenAI GPT-4仍是在微軟AI超級計算機上訓練 多年前就已開始合作
【TechWeb】3月15日消息,據外媒報道,由OpenAI訓練的人工智能聊天機器人ChatGPT,自去年11月30日推出至...
-
“云原生虛擬數倉” 數據庫公司下一步的競爭方向?:快資訊
3月14日,國內云原生數據公司拓數派發布了基于新一代云原生數倉虛擬化技術打造的新產品PieCloudDB「云上...
-
當前速讀:撕掉“Chat”,GPT-4變現不是夢
能讀圖、考高分、1秒生成網站……火爆全網后,ChatGPT撕掉“Chat”的標簽再次進化。3月15日凌晨,OpenAI...
-
視點!多項測試超越90%的人類,GPT-4會引發新一輪風暴嗎
3月15日,美東時間3月14日,OpenAI宣布推出大型語言模型的最新版本——GPT-4,該版本比以前的版本“更大...
-
深交所扎堆受理家居IPO,中小企業面臨洗牌淘汰賽_天天速看料
一場家居行業的“估值”保衛戰正在席卷。3月12日晚間,顧家家居(603816 SH)發布公告稱,截至2023年3...
-
業績和研發投入持續下滑,汕頭超聲闖關創業板勝算難料:天天速訊
來源|時代商學院作者|孫沐霖編輯|孫一鳴3月17日,汕頭市超聲儀器研究所股份有限公司(下稱“汕頭超聲”...
-
世界熱推薦:315調查丨苦情戲直播局中局 專門騙老人買神藥
天眼查數據顯示,我國目前有5300余家MCN相關企業。從地域分布上看,廣東、吉林以及黑龍江三地MCN相關企...
-
315調查丨手機應用貓膩多 19.31%的相關企業有異常:百事通
天眼查數據顯示,我國目前有近1 6萬余家手機應用相關企業。從地域分布上看,廣東、浙江以及山東三地,...
-
全球熱點!315晚會曝光的多個直播賬號已無法搜到
據中新財經報道,中央廣播電視總臺第33屆3·15晚會曝光苦情戲直播局
-
?315晚會曝光廢舊絕緣子刷刷即上市,翻新絕緣子流向多地電力工程_環球即時
據央視財經報道,絕緣子是電力線路安全運營的重要保障之一,起著非
-
生產“假泰國香米”被3·15點名,涉事企業回應:不知道,沒看晚會 最新資訊
今日晚間,央視315晚會曝光“香精大米”,稱“泰國香米”竟是香精勾
-
天天精選!3·15晚會曝光高標準農田的漏洞:鹽城濱海高標準農田竟用“非標”材料
據央視財經報道,在江蘇省鹽城市高標準農田建設規劃(2021-2030年)
-
315晚會曝光苦情戲直播局中局,辛巴曾指責平臺幫助情感直播造假人氣
今日晚間,央視315晚會曝光苦情戲直播局中局,“兒子”們專門騙老人
-
91億元史詩級券商股權拍賣!國聯集團下一步整合,或將參考“華泰模式”_快報
經過162輪競價,延時157次,民生證券34億股權拍賣終于落錘。3月15日中午,無錫市國聯發展(集團)有限公...
-
315調查丨起底不可注射的美容針:依圣姿生物醫藥、北京旭日美業商貿:今日聚焦
鳳凰網科技訊3月15日消息,央視315晚會曝光不可注射的美容針,妝字號美容針或致毀容。其中,依圣姿生物...
-
315晚會曝光苦情戲直播局中局,直播間里的“兒子們”專門騙老人買“神藥”
2023年央視315晚會第四槍指向直播間“苦情戲”,“兒子”們專門騙老
-
熱推薦:315曝光苦情戲直播局中局,直播間里兒子們專門騙老人買“神藥”
據央視財經報道,“所有爹媽們,呼叫回家,收到評論區回復”“阿姨
-
市監局前往處置被曝光的假香米企業,作進一步處置工作|新動態
據報道,本次315晚會,央視再次曝光“香精大米”現象。被曝光的“泰
-
315曝光?藥販子套路,免費評書機暗藏天價神藥騙局
據央視財經報道,在吉林,不少老人一年能收到上百個免費送的包裹,
-
【新視野】天眼查315數據:直播亂象叢生,2022年直播相關企業共產生120余條被執行人信息
2023年央視315晚會第四槍指向直播間“苦情戲”,“兒子”們專門騙老
-
3·15投訴|新買的奔馳C級故障不斷,車主:不是在修車就是在修車的路上
按:3·15“危險的出行”專題是由消費者報道、時代周報共同推出的315特別專題,旨在以消費觀察報告、行...
-
個人養老金賬戶爭奪亂象:賬戶被開通,銀行甩鍋用人單位?專家:涉嫌違法!-每日信息
未經本人授權,個人養老金賬戶為什么會被私自開立?去年11月開始,個人養老金制度在36個城市啟動實施,...
-
復星系百億交易AB面:清倉南鋼聯合留下新能源公司,沙鋼入主仍存變數?
復星國際(00656 HK)資本版圖生變在即,自其宣布出售南京南鋼鋼鐵聯合有限公司(下稱“南鋼聯合”)股...
-
天天信息:深圳“消保+N”出新招,金融“3·15”宣傳顯實效
第41個“3·15”國際消費者權益日到來之際,深圳銀保監局在中國銀保監會消保局的統一部署下,精心組織深...
-
專業買家數達去年4.39倍!2023華南中酒展大咖齊聚,見證中國酒業復原力! 焦點快報
3月10日-12日期間,為期三天的2023(第三屆)華南中酒展于廣州保利世貿博覽館圓滿閉幕。20000+平米展出...
-
新生代視頻通信App畫音即將停止維護,曾獲華興與摯信聯合投資
今日晚間,新生代視頻通信App畫音公眾號發文,稱“親愛的用戶們,我
-
【聚看點】百度文心一言發布會開始彩排,李彥宏現身
據深廠消息,百度文心一言發布會開始彩排。Robin于今天下午出現在百
-
今日熱搜:阿聯酋G42入股字節?相關人士:無新融資行為和計劃
據媒體援引知情人士稱,阿聯酋人工智能和云計算公司G42最近幾個月通
-
全球短訊!博主揭上門修馬桶套路10秒被坑700元:天價疏通劑一次倒5斤
有網友反饋自己遭遇了修馬桶騙局,為了弄清楚其中的套路,3月14日,
精彩推薦
閱讀排行
精彩推送
- 老壇酸菜面銷售重返巔峰!土坑酸...
- 冀惠保和百萬醫療險的區別是什么...
- 全球觀點:請問眾安百萬醫療險是...
- 門店回應一點點奶茶喝出甲蟲:可...
- 315“投訴曝光”|近六成受訪者...
- 太平洋保險醫享無憂百萬醫療險要...
- 3·15“投訴曝光”|民航年度投...
- 泰康的百萬醫療險怎么樣?能保證...
- 環球熱點評!威馬危機仍在延續:...
- 穗歲康與百萬醫療險區別有哪些?...
- 3·15“隱藏式消費”|電視平臺...
- 50歲買百萬醫療險一年多少錢?被...
- 每日資訊:前兩月賺了8個億,消...
- 環球頭條:泰康百萬醫療險價格表...
- 315調查 | 用戶選出的醫美問題...
- 當前短訊!礦大校長回應校友1100...
- 女子疑吃自嗨鍋后食物中毒死亡,...
- 汕頭再現工人赤腳踩腌菜:工人邊...
- 普通鮑魚加硼砂泡出黃金鮑,企業...
- 網購按摩枕充電自燃女子新家被燒...
- 環球微動態丨高度還原概念車 起...
- 智己汽車首款量產無線充電樁、裝...
- 亮點十足,看哈弗二代大狗如何“...
- 平安e生保長期醫療險優缺點有哪...
- 天天熱資訊!陽光人壽臻鑫倍致終...
- 養老金總額怎么查詢?個人部分可...
- 全球報道:車險醫保外用藥需要買...
- 我,32歲已婚男,掉進植發貸款陷...
- 泰康百萬醫療險600萬值得買嗎?...
- 積極參與保險消費者權益保護工作...