戴爾中國研究院首席科學家李三平:通用大模型不是戴爾的首選 全球熱資訊
財聯社 6 月 1 日訊(記者 徐賜豪)ChatGPT 問世后,各大公司爭相開發大模型,但作為老牌科技公司的戴爾似乎沒有太多動靜。
(資料圖)
本期《元宇宙之約》對話了戴爾科技集團中國研究院首席科學家李三平。據李三平透露,戴爾對自己的定位是核心基礎架構公司,通用大模型不是戴爾的首選,而是打造支撐數據密集、計算密集型人工智能應用的高性能算力平臺,同時基于企業內部的知識庫打造面向業務的語言模型。
現在越來越多公司創建大模型,李三平認為能否成功的關鍵是 " 是否擁有構造高質量數據集的能力 "。
大模型越來越強大后能否從技術的角度來規范管理大模型?李三平表示,技術算法上可以用強化學習讓大模型與人類對齊。
通用大模型不是戴爾的首選
目前還沒有看到戴爾發布自己的大模型,據您了解戴爾在大模型上持什么態度?
李三平:戴爾對自己的定位就是核心基礎架構公司。其實,我們有做大語言模型方面的研發工作:一是提供計算平臺來支撐大語言模型;二是戴爾會把機器學習或者人工智能技術用在自己的產品、服務和內部工作流程當中,比如用于優化產品性能或者優化客戶服務。
戴爾有像其他科技公司一樣開發通用大模型的計劃嗎?
李三平:現在大家都關注的通用大模型肯定不是戴爾的首選,像我們正在做的還是結合企業內部自己的知識庫打造面向自己業務的語言模型。
ChatGPT 的成功,對您會有什么啟發?
李三平:概率這種數學工具其實是對物理世界的一種近似表達或者近似建模。因為我們不可能獲得對整個物理世界的完整信息,所以基于我們所獲得的局部信息來進行一種近似建模。
現在語言模型利用這樣的一些數學方法也能在自然語言理解上表現超出普通人的能力。說明概率建模能力超出了我們之前對它的理解。
也就是說,通過單純計算的方式我們也有能力表達對物理世界的理解。所以說語言模型就是一種智能發展形式。
高質量的數據集是構建好大模型的基礎
有人將互聯網、智能手機以及 ChatGPT 視作三次技術浪潮,怎么判斷大模型是真正的技術浪潮而不是偽浪潮?
李三平:現在還不太好判斷大模型是真的浪潮還是假的浪潮,畢竟它是一個新興技術,初期大家肯定是對它期許特別高,媒體或者市場肯定會有過度炒作。我們其實要關心的是,這一輪泡沫之后,這個技術還剩下多少,是不是還在繼續扎扎實實的前進,還是說消失了。所以,我們需要時間來判斷真偽。
其實就像之前的互聯網、智能手機,也是經過了若干年的發展,逐漸成熟到大家接受的技術突破。甚至人們慢慢的就會認為,這是理所當然的,不再把它們認為是一種新興技術。這個時候也意味著,這個技術已經完全成熟進入到了我們的工作和生活中。
現在對大語言模型來說,它也需要這樣一個發展過程。
ChatGPT 引發了新一輪的科技互聯網競賽,哪些是真正的在做事,哪些是炒作呢?
李三平:從技術方向來說,目前大模型大家都在探索當中。說難聽一點,大部分技術探索最后探索著也就沒了。因為那個方向可能并不具備什么實際的意義或者這個問題本身并沒有那么大的價值。
國內現在很多的科技公司宣稱要做大模型,但根本閉口不談實實在在的細節問題,而只說我把大模型做到多好,確實有炒作嫌疑。
數據的數量現在不是一個特別難的問題,因為在互聯網環境下,我們能搜集到非常多語料,而且也有很多機構一直主動構建各種各樣的語料庫。但數據質量始終是一個難題。
我們如何通過技術方法獲得高質量的數據集,這是最根本的基礎。如果沒有這個就不可能做出高性能的大語言模型。
數據質量這個事情可能創新的東西不會太多,更多的是工程性的投入,你要是沒有足夠時間和人力投入,確實很難去解決。
與人類對齊訓練讓大模型符合人的預期
ChatGPT 出現后,很多知名企業家、人工智能領域的專家都說這是一場變革,您覺得它的出現對人工智能產業意味著什么?
李三平:大家都普遍認同的一個觀點是,ChatGPT 它屬于一種人機交互方式的變革,或者說人與技術交互方式的變革。
直接影響改變的是人類獲取信息的方式,給我們提供了能夠快速獲取跨領域知識的能力。那么我們個體能走多快、能走多遠,還是取決于自己的學習能力。
我覺得從技術角度來說,ChatGPT 肯定會鼓勵整個社區繼續沿著大模型的路徑,就是利用大規模算法、基于海量的多元化數據,然后通過機器自我學習的方式從數據中挖掘有價值的信息,從而產生更大的智能涌現。
未來的話存在更多不確定性。但是我們如果沿著這種大模型路徑繼續往前走,模型的性能越來越強隨即而來的就是對人工智能的監管。因為大模型的能力會引起很多擔憂,說明這種技術本身確實有實力去造出更強大的東西,有可能被用來做好事情,也有可能被用來做不好的事情。
這種擔憂我們是否能從技術角度去規范它,讓 GPT 或者聊天機器人能符合人類的預期,避免失控?
李三平:大語言模型對語言的理解能力甚至可以超越人類,那么我們怎么能讓它表述的答案符合人類的一些價值觀,其實從技術的角度有一個專有名詞——與人類對齊,就是說去對齊人類的價值觀。
大語言模型有時候會生成一些人類根本不會使用的表達方式,并不符合我們的一個期望。其實,OpenAI 花了非常多人力和時間在做和人類對齊、和人類的期望對齊的事情。
技術算法上的解決方法就是強化學習,讓模型去主動構建很多人類期望的表達方式。比如設置一些問題,讓人類回答,也讓模型回答,最后人類來評分,讓大模型去強化學習那些評分高的答案,去學習人類的表達標準。可能語言模型仍然會產生很多答案,我們可以用強化學習過濾掉那些不符合人類期望的答案。
責任編輯:hnmd003
相關閱讀
-
戴爾中國研究院首席科學家李三平:通用大模型不是戴爾的首選 全球熱資訊
財聯社6月1日訊(記者徐賜豪)ChatGPT問世后,各大公司爭相開發大模型,但作為老牌科技公司的戴爾似乎沒有
2023-06-01 -
Counterpoint:2023 年 Q1 中國智能手表出貨量降至 12 個季度以來最低水平
2023年第一季度,中國智能手表出貨量同比和環比均有所下降;與2022年相比,HLOS*智能手表的份額有所增加;
2023-06-01 -
13 代酷睿標壓處理器 +144Hz 高刷大屏,華碩無畏 15 2023 極速暢快 世界獨家
在這個快節奏的時代,我們都渴望找到一款完美的筆記本電腦,來幫助我們更好地完成各種任務。而華碩無畏1520
2023-06-01 -
助力 XR 生態繁榮,OPPO MR Glass 開發者版亮相 AWE 2023 世界快資訊
在2023年增強現實世界博覽會(AWE)上,OPPO帶來了其在XR領域的最新探索成果—OPPOMRGlass開發者版。OPPOMR
2023-06-01
相關閱讀
-
戴爾中國研究院首席科學家李三平:通用大模型不是戴爾的首選 全球熱資訊
財聯社6月1日訊(記者徐賜豪)ChatGPT問世后,各大公司爭相開發大模型,但作為老牌科技公司的戴爾似乎沒有
-
Counterpoint:2023 年 Q1 中國智能手表出貨量降至 12 個季度以來最低水平
2023年第一季度,中國智能手表出貨量同比和環比均有所下降;與2022年相比,HLOS*智能手表的份額有所增加;
-
13 代酷睿標壓處理器 +144Hz 高刷大屏,華碩無畏 15 2023 極速暢快 世界獨家
在這個快節奏的時代,我們都渴望找到一款完美的筆記本電腦,來幫助我們更好地完成各種任務。而華碩無畏1520
-
硅數股份:主營高性能數模混合芯片 客戶包括京東方、三星、蘋果等
《科創板日報》6月1日訊硅數股份科創板IPO申請日前獲受理。本次IPO,硅數股份擬募資15 15億元,用于高清顯
-
全球熱頭條丨30 吋的車載大屏幕來了,車企為何熱衷偽需求?
在手機行業,旗艦機不能標配三星OLED屏幕,通常會遭到網友們的口誅筆伐,因為三星OLED屏幕的素質有目共睹。
-
焦點熱文:一間水果店估值超百萬,在座每一位都有責任
圖片來源@視覺中國文|錦緞2023年1月19日,百果園(HK:02411)上市,水果連鎖零售第一股誕生了。這個賣水果的
-
【天天新要聞】7 個月開 3000 店,陸正耀能做出下一個瑞幸嗎?
這是一個史無前例的速度。對于庫迪咖啡的飛速增長,包括加盟評論創始人龍真在內的多位行業專家,都感到頗為
-
剛剛,馬斯克私人飛機已離開上海!訪華超 40 小時,馬斯克奪回“世界首富”頭銜
據飛常準APP顯示,上午11時23分,特斯拉CEO馬斯克的私人飛機(注冊號:N628TS)已經離開上海虹橋機場,前往
-
【獨家焦點】AI+ 辦公時代來臨,產業變革已開啟
AIGC技術在演進的過程中,逐漸形成了數字內容孿生、編輯、創作三大核心能力,為辦公軟件嵌入更多新功能提供
-
焦點關注:阿里云:已服務粵港澳近 75 萬付費客戶,加速大灣區高質量發展
6月1日,阿里云峰會·粵港澳大灣區在廣州舉行。阿里云首次公布了扎根粵港澳數字經濟發展成果:已服務粵...
-
中國二冶安全生產月活動正式啟動 環球微速訊
5月31日,中國二冶舉辦2023年“安全生產月”活動啟動儀式,對安全月活動進行安排部署。公司原副總經理劉...
-
中國二冶三項目榮獲“2022年度包頭市建設科技示范工程” 天天報道
日前中國二冶收到包頭市建筑業協會頒發的榮譽證書,中國二冶承建的米蘭春天房地產項目續建工程、大地熊(包
-
世界新資訊:中國二冶兩項目獲內蒙古自治區優質結構獎
5月25日,內蒙古自治區建筑業發布公告,中國二冶承建的年產4000噸高端制造性能稀土永磁材料及器件項目獲202
-
中交長安里實景示范區開放,以央企品質兌現理想生活
央廣網北京6月1日消息歷經時間的淬煉,5月30日,讓理想靠岸——西安中交長安里HE生活大劇暨實景示范區盛...
-
百強房企前5個月銷售額近3萬億元 6月份市場會好轉嗎?
百強房企前5個月銷售額近3萬億元6月份市場會好轉嗎?同策研究院研究總監宋紅衛向《證券日報》記者表示,房
-
什么是網絡協議?網絡協議怎么設置?
什么是網絡協議?網絡協議(Protocol)是一種特殊的軟件,是計算機網絡實現其功能的最基本機制。網絡協議的...
-
漏磁是什么意思?漏磁場形成的原因
漏磁是什么意思?漏磁指電器設備中由于繞組間或者繞組和鐵芯之間出現縫隙、裂紋等導致的磁通跑偏,影響設...
-
iphone連不上itunes怎么辦?ipad不連itunes怎么更新?
iphone連不上itunes怎么辦?方法1、網絡設置問題1、也有可能是手機里面網絡設置問題導致的,打開蘋果手機...
-
上海寺庫再被申請破產審查 母公司已累計被執行超2863萬元
中國網科技5月31日訊(記者張潤琪)據天眼查App顯示,5月31日,上海寺庫電子商務有限公司新增一則破產審查案
-
筆記本屏幕變暗是什么原因?筆記本屏幕變暗了怎么調回來?
筆記本屏幕變暗是什么原因?1 筆記本在使用過程中,不使用外接電源,電腦會自動調節屏幕亮度。2 筆記本...
-
波峰焊溫度一般設多少?波峰焊和回流焊的溫度區別
波峰焊溫度一般設多少?波峰焊溫度一般設定在90-110度,但要根據PCB板厚度、走板速度、預熱區長度等因素...
-
基金是股票型是什么意思?股票型基金適合長期持有嗎?
基金是股票型是什么意思?基金是股票型是指基金資產主要投資于股票,股票型基金規定基金投資于股票的比例...
-
如何炒紙黃金?炒紙黃金的最佳時間
如何炒紙黃金?紙黃金是各大銀行推出的一種憑證式黃金理財產品,以國際金價為參考按照銀行報價在賬面上買...
-
陽光百萬醫療險是真的嗎?一年多少錢?
是真的。陽光保險百萬醫療險是一款真實的保險產品,由陽光財產保險公司承保。該產品分為個人版和家庭版兩個
-
滴滴貨運開啟畢業搬家季,60多城同步上線優惠活動_實時
一年一度的畢業季即將到來,大學畢業生們準備踏上人生新征程。為給廣大畢業生提供更優惠貼心的服務,6月1日
-
四川人壽保險公司怎么樣?保什么?|天天熱門
作為一家知名的保險公司,四川人壽保險在產品設計、服務質量以及理賠速度等方面都表現出色。首先,四川人壽
-
每日訊息!匯豐人壽保險怎么樣?保什么?
匯豐人壽是香港匯豐銀行旗下的保險公司,在保險市場上具有一定的影響力。匯豐人壽保險的產品種類較為豐富,
-
百萬康愛醫療保什么?在哪里買?
在購買百萬康愛醫療保險時,消費者可以享受以下方面的保障:1 門診醫療保障:包括門診費用、門診手術等。2
-
環球速訊:養老保險繳費年限是多久?領取年限是多久?
至少15年。為了獲得養老保險的福利,企業員工需要繳納養老保險費用。根據現行規定,個人至少需要繳納15年的
-
滴滴貨運開啟畢業搬家季,60多城同步上線優惠活動-環球播資訊
鞭牛士報道 一年一度的畢業季即將到來,大學畢業生們準備踏上人生新征程。為給廣大畢業生提供更優惠貼
精彩推薦
閱讀排行
精彩推送
- 科大訊飛:大模型用戶數據和牌照...
- 搭載三電機 凱迪拉克凱雷德EV渲...
- 通用加拿大電池材料廠獲2.2億美...
- 【焦點熱聞】馬斯克參觀特斯拉上...
- 兩種版本可選 smart精靈#3將今...
- 運動感提升 2023款馬自達2官圖發布
- 薦股騙局是什么意思?薦股騙局為...
- 個人基金賬戶是什么意思?個人基...
- 民生銀行是國企還是私企?民生銀...
- 平安福終身壽險是什么意思?平安...
- 廣發信用卡額度一般是多少?廣發...
- 助學貸款還款怎么還?助學貸款還...
- 買抵押車違法嗎?買抵押車丟了報...
- 【全球熱聞】中國簽證申請量恢復...
- 一場鮮活生動有趣的科技盛宴——...
- 螞蟻集團2022可持續發展報告:20...
- 2023第二屆中國成都養老健康產業...
- 助力 XR 生態繁榮,OPPO MR ...
- 4/3 英寸大底手機最早后年登場...
- 世界觀天下!三個月,華為天才少...
- 焦點熱文:硅谷數模 IPO:客戶...
- 【當前獨家】京東電視影音 618...
- B 站音樂區,應該重新思考自身的定位
- 什么檔次!和我過一樣的兒童節
- 東風日產鈍刀沖鋒|世界資訊
- 航空紀念鈔有收藏價值嗎?航空紀...
- 環球快訊:天娛數科:目前「元趣...
- 如何破解“散亂污”企業監管難?...
- 治安管理處罰的程序適用什么的規...
- 熔斷機制是什么意思?熔斷機制有...