報道:陳巍:GPT-4究竟會展現出怎樣的能力?
中新經緯3月16日電 題:GPT-4究竟會展現出怎樣的能力?
(相關資料圖)
作者 陳巍 中關村(000931)云計算產業聯盟、中國光學工程學會專家
3月14日,OpenAI發布了最新NLP(自然語言處理)大作“GPT-4”。GPT-4的技術報告里把OpenAI團隊作為唯一作者。參與項目的有數百人,堪稱新時代的AI登月工程。
能看明白圖梗的大型多模態模型
與ChatGPT稍有不同,GPT-4是一個大型多模態模型(輸入圖像和文本,文本輸出)。其中GPT是生成式預訓練模型的縮寫。大型多模態模型可以廣泛用于對話系統、文本摘要和機器翻譯。一般情況下,大型多模態模型包括額外的視覺語言模型組件(VLM)。
GPT-4實際上是在2022年8月完成訓練的,直到2023年3月14日才發布。在發布之前,OpenAI一直在對該模型進行對抗性測試和改進。GPT-4的內容窗口能支持多達32000個token(令牌)。
但更為有趣的是,GPT-4已經能看懂一些圖梗了,不再僅僅是對話助手。當然,這離大家期待的看懂視頻還有一段距離。
據OpenAI介紹,雖然目前GPT-4在現實場景中的能力可能不如人類,但在各種專業和學術考試上表現出明顯超越人類水平的能力,包括大家熟悉的GRE考試,堪稱考試小能手。
這對孩子們是不是一個壞消息?例如,GPT-4在模擬律師考試中,分數排在應試者的前10%左右。GPT-4也優于現有的其他語言模型。相比之下,GPT-3.5的得分則在倒數10%附近。如果GPT-4來做中國的高考卷,是不是能上北大清華了?
GPT-4技術特征和不足
與ChatGPT類似,GPT-4也是一種基于Transformer的大模型,支持多國語言,經過預訓練可以預測或自動生成文本。
OpenAI表示,對GPT-4而言,訓練后的對齊(Alignment)是提高性能和改善體驗的關鍵。從技術上看,人類反饋強化學習(RLHF)微調仍然是GPT-4的要點。考慮到LLM(第四代大型語言模型)領域的競爭格局和GPT-4等大型模型的安全隱患,OpenAI暫時還未公布GPT-4的模型架構、模型大小、訓練技術。
相對于GPT-3.5和其他大語言模型,GPT-4在復雜任務上表現出更可靠、更有創意,并且能夠處理更細微的指示的關鍵特征。GPT-4可以接受文本和圖像提示,并允許用戶指定任何視覺或語言任務。例如,GPT-4可以在給定由分散的文本和圖像組成的輸入的情況下反饋文本輸出(例如自然語言、代碼等)。在帶有文本和照片的文檔、圖表或屏幕截圖方面,GPT-4 也駕輕就熟。此外,GPT-4包括few-shot和思維鏈提示。對于公眾來說,圖像輸入仍然是僅供內部研究預覽,并不公開。而且,這次GPT-4直接整合入Bing搜索引擎之中。
GPT-4也有一些不足,例如仍然會一本正經地胡說八道,上下文連續對話輪次有限,并且無法從經驗中學習。因此如果不對GPT-4的使用進行安全性限制,GPT-4可能會產生大量的認知偏差、虛假信息,甚至侵犯個人隱私。另外,由于數據集時效的原因,GPT-4缺乏對2021年9 月之后的事件的了解。GPT-4有時會犯一些簡單的推理錯誤,也可能會像人類一樣在技術難題上出現錯誤,例如GPT-4可能在生成的代碼中引入安全漏洞。
訓練價值和安全性技術表現如何?
OpenAI表示,在過去2年的GPT-4研發中,超算和訓練技術表現出至關重要的價值。OpenAI與Azure的超算團隊一起,共同設計了針對大模型訓練的超級計算機,為GPT-4的訓練提供了關鍵的算力支撐和研發加速。OpenAI在GPT-4技術報告中,甚至把Supercomputing lead(超級計算領導)和Infrastructure lead(基礎設施領導)的排名放在了預訓練模型團隊的最前面。
OpenAI的團隊從理論基礎層面進行優化,改進了GPT-3.5的一些bug,使得GPT-4能夠前所未有地進行穩定高速的訓練。這方面可以看出OpenAI團隊的數學和計算理論功底。
從技術報告描述的模型訓練過程來看,GPT-4的訓練與GPT-3.5類似。包括SFT(有監督微調)的預訓練、基于RLHF(人類反饋強化學習)的獎勵模型訓練和強化學習的PPO(近端策略優化)算法微調。與之前的GPT模型不同的是,OpenAI使用基于規則的獎勵模型(RBRM) 在PPO微調期間向GPT-4提供額外的獎勵信號。
OpenAI投入了大量資源來提高GPT-4的安全性和一致性。包括引入專家進行對抗性測試和紅隊測試,模型輔助的安全流水線以及安全指標的改進。OpenAI引入的安全專家達到了50多人,覆蓋AI一致性風險、網絡安全、生物風險等領域。
與ChatGPT一樣,OpenAI使用強化學習和人類反饋 (RLHF) 來微調模型的行為,以產生更符合用戶意圖的響應。但當給定不安全的輸入時,模型可能會生成不良內容,例如提供有關犯罪的建議。另外,模型也可能對安全輸入變得過于謹慎,拒絕無害的請求。
GPT-4的安全流水線包括兩個主要部分:一組額外的安全相關 RLHF訓練提示,以及基于規則的獎勵模型(RBRM)。RBRM是一組zero-shot GPT-4 分類器。這些分類器在RLHF微調期間為GPT-4策略模型提供額外的獎勵信號,以正確的輸出行為為目標進行訓練,例如拒絕生成有害內容或不拒絕無害的請求。(中新經緯APP)
本文由中新經緯研究院選編,因選編產生的作品中新經緯版權所有,未經書面授權,任何單位及個人不得轉載、摘編或以其它方式使用。選編內容涉及的觀點僅代表原作者,不代表中新經緯觀點。
責任編輯:孫慶陽
編輯:郭晉嘉
責任編輯:hnmd003
相關閱讀
-
OPPO Find X6系列官宣3月21日發布 首搭暗光長焦攝像頭
鳳凰網科技訊(作者 屈彥超)3月16日消息,OPPO今日宣布將于3月21日下午兩點發布其全新旗艦手機OPPOFin...
2023-03-16
相關閱讀
-
報道:陳巍:GPT-4究竟會展現出怎樣的能力?
中新經緯3月16日電題GPT-4究竟會展現出怎樣的能力。能看明白圖梗的大型多模態模型。其中GPT是生成式預訓...
-
李彥宏展示百度 “文心一言”文學創作、數理推算等五大場景能力
【TechWeb】3月16日消息,百度于北京總部召開新聞發布會,主題圍繞新一代大語言模型、生成式AI產品文心...
-
紙黃金怎么交易開戶?紙黃金開戶需要多少錢?
紙黃金怎么交易開戶?紙黃金是一種個人憑證式黃金,是繼貴金屬黃金后的一個新的投資品種,投資者按銀行報...
-
東風加速新能源平臺建設,S2-E平臺首臺CTC樣車下線|環球精選
東風加速新能源平臺建設,S2-E平臺首臺CTC樣車下線3月16日,據東風汽車官微消息,東風汽車S2-E平臺首臺C...
-
銀行現行利率是什么意思?銀行現行活期存款利率是多少?
銀行現行利率是什么意思?銀行現行利率是指目前在一定時期內銀行借貸的利息與本金的比率,通常用百分比表...
-
買基金賺錢嗎?基金1000塊一天賺多少?
買基金賺錢嗎?基金有賺錢的可能,也有虧錢的可能,基金漲跌由投資標的決定,投資標的上漲,基金上漲,投...
-
國華保險是國家正規保險公司嗎?國華保險公司排名第幾?
國華保險是國家正規保險公司嗎?國華保險是國家正規保險公司,國華保險是由中國保險監督管理委員會批準設...
-
民營企業是什么意思?民營企業和私企有什么區別?
民營企業是什么意思?民營企業,簡稱民企、公司或企業類別的名稱,是指所有的非公有制企業。中華人民共和...
-
余額寶體驗金是什么回事?余額寶體驗金收益怎么提現出來?
余額寶體驗金是什么回事?余額寶體驗金是支付寶為了吸引用戶而推出的,其主要針對的是沒有開通余額寶的用...
-
微信支付密碼怎么改?微信支付密碼手勢怎么設置?
微信支付密碼怎么改?進入微信我的服務頁面選擇錢包進入支付設置選擇修改支付密碼輸入原始密碼依次輸入新...
-
退市的股票怎么辦?股票退市多久可以重組上市?
退市的股票怎么辦?股票退市后,股民的處理方式如下:1、重組后再上市:如果上市公司主動退市,股東可以...
-
股票名稱前加xd是什么意思?xd當天買入股票好嗎?
股票名稱前加xd是什么意思?股票名稱前加XD是什么意思?股票名稱前加XD,表示股票除息,購買這樣的股票后...
-
投資理財哪個銀行好?投資理財代中間業扣款是什么?
投資理財哪個銀行好?中國銀行、中國建設銀行、中國工商銀行、中國農業銀行、交通銀行這五大銀行理財產品...
-
補發養老金是怎么回事?哪5年退休的補發養老金?
補發養老金是怎么回事?1 養老金計發基數調整后補發養老金所謂養老金計發基數,其實是計算基礎養老金和...
-
交行分期利率多少?交行分期如何提前還款?
交行分期利率多少?1、交行信用卡分期的手續費率按金額計算。 500元以上,每月0 72%;6500元以上,每月0...
-
郵政銀行個人貸款需要什么條件?郵政銀行個人貸款利率是多少?
郵政銀行個人貸款需要什么條件?一、基礎資料貸款申請表;身份證(包括配偶)復印件;戶口薄復印件婚姻證明復...
-
小孩適合買哪種保險?小孩有沒有必要買重疾險?
小孩適合買哪種保險?1 少兒醫保:屬于最基本的保障,具有一定的福利性質,而且從孩子出生當天起的醫療...
-
跨省匯款一般多久到賬?跨省匯款手續費多少?
跨省匯款一般多久到賬?跨行跨省轉帳一般2小時內可到達收款人賬戶,但須在銀行的營業時間內完成。若是在1...
-
視點!交五險如果中途辭職怎么辦?五險具體指什么?
1、申請社保卡退卡或注銷社保卡。 2、到社保所在地社保局辦理社保關系轉移或個人社保賬戶注銷手續。 3、...
-
【世界熱聞】銀行養老金賬戶什么意思?有哪些開戶條件?
銀行養老金賬戶是指在中國銀行業監督管理委員會規定的銀行機構開立的專門用于存儲養老金資金的賬戶。個...
-
國華人壽終身壽險3年到了錢能取出嗎?能取多少錢?
是能取出來的,而且我們可以通過兩類渠道來提前取出錢,其一,是通過跟國華人壽保險公司提交退保申請,...
-
醫療保險怎么交在手機上?斷交有什么影響?|即時看
1、首先登錄微信,點擊我的菜單欄。2、在我的菜單欄中找到城市服務,點擊進入。3、在城市服務里面找到社...
-
企業養老賬戶里的賬戶余額是指什么?怎么查詢?
就是我們繳納職工養老保險之后的個人賬戶的累計額度,是按照職工繳納的社保養老費用總額+部分企業繳納的...
-
小楊哥、羅永浩帶貨,有千萬乃至過億粉絲也翻車,網紅不能無底線消耗個人信用_當前關注
央視“3·15晚會”曝光了直播帶貨背后的畸形水軍市場,還直指主播上演苦情戲坑騙老年人購買假保健品。這...
-
二手iPhone為何仍然很香?揭秘蘋果手機的回收和翻新
二手iPhone11。鳳凰網科技訊北京時間3月16日消息,如今,以舊換新已經成為了蘋果等手機制造商和運營商降...
-
藍色光標首獲數字人國家重點研發計劃項目
證券時報e公司訊,近日,“十四五”國家重點研發計劃項目“實時高逼真孿生數字人關鍵技術研發與應用示范...
-
資訊:印度人不愛便宜手機了?小米是這么丟掉市場頭名的
小米印度門店。三星電子在印度這個全球第二大手機市場上反超了小米。高端化趨勢
-
九山頂景區被315曝光后回應:已更換兜襠式安全帶
據鳳凰網消息,3月15日晚,針對2023年“3·15”晚會上曝光的景區高
-
開通個人養老金賬戶有什么弊端?能買哪些產品?_世界觀天下
開通個人養老金賬戶需要注意到下述的三大點弊端問題:其一這個個人賬戶的資金是不能隨意提前支取的,全...
-
城鄉居民養老保險交多少錢?選擇什么繳費檔次比較好? 環球要聞
不同地區是有不同的居民養老保險繳費檔次的,年交保費的范圍在每年100元到6000元之間,一般可以分為十多...
精彩推薦
閱讀排行
精彩推送
- 百萬醫療和意外險哪個比較重要?...
- 現在的社保要交多少年?交社保可...
- 每日短訊:社保個人交多少?需要...
- OPPO Find X6系列官宣3月21日...
- 【天天新視野】蘋果并不是ChatGP...
- 歡聚發布2022年Q4及全年財報: ...
- 國家網信辦:從嚴懲處涉網暴賬號...
- 將于年內發布 全新雪佛蘭探界者...
- 重疾險和意外險一年多少錢?有什...
- 平安百萬醫療險一年交多少錢?哪...
- 環球熱文:哪家的百萬醫療險最好...
- 環球快資訊:重疾險分組和不分組...
- 買了百萬醫療險還需要買意外險嗎...
- 美年健康1至2月營收同比增長44%...
- 瓜子宣布升級為第三方平臺
- 自動駕駛初創公司Gatik與美國零...
- 成立僅一年!蔚來旗下保險公司被...
- 拒絕內耗,小鵬汽車營銷體系大變...
- 美國國債是什么意思?我國為什么...
- 廣發卡積分兌換在哪里?廣發卡積...
- 貴金屬現貨是什么意思?貴金屬現...
- 蘋果24期免息分期有什么要求?蘋...
- 快捷支付解約交易是什么意思?快...
- 銀行保險存款六年可靠嗎?銀行保...
- 辭職后養老保險怎么辦?養老保險...
- 股票短線是多少天?股票短線選股...
- 無抵押貸款是真的嗎?無抵押貸款...
- 貸款治病銀行會貸嗎?貸款治病需...
- 美國印鈔票是哪個部門負責?美國...
- 異地醫療保險怎么報銷?可以轉移...