環(huán)球微頭條丨為了避免人工智能可能帶來的災(zāi)難,我們要向核安全學(xué)習(xí)
最近,一群科技公司領(lǐng)導(dǎo)者和人工智能專家發(fā)布了另一封公開信,他們宣稱,降低人工智能導(dǎo)致人類滅絕的風(fēng)險(xiǎn),應(yīng)該與預(yù)防流行病和核戰(zhàn)爭一樣,成為全球的優(yōu)先事項(xiàng)。第一份呼吁暫停人工智能開發(fā)的請?jiān)笗呀?jīng)有 3 萬多人簽名,其中包括許多人工智能領(lǐng)域的杰出人士。
那么,科技企業(yè)該做什么才能讓人類避免被人工智能毀滅呢 ? 最新的一個(gè)建議來自牛津大學(xué)、劍橋大學(xué)、多倫多大學(xué)、蒙特利爾大學(xué)、谷歌 DeepMind、OpenAI、Anthropic、幾家人工智能研究非營利組織和圖靈獎(jiǎng)得主約書亞 · 本希奧(Yoshua Bengio)的研究人員的一篇新論文。
(資料圖)
他們建議,人工智能開發(fā)人員應(yīng)該在開發(fā)的早期階段,甚至在開始任何訓(xùn)練之前,評估模型造成 " 極端風(fēng)險(xiǎn) " 的潛力。這些風(fēng)險(xiǎn)包括人工智能模型操縱和欺騙人類、獲取武器或發(fā)現(xiàn)可利用的網(wǎng)絡(luò)安全漏洞的可能性。
這個(gè)評估過程可以幫助開發(fā)人員決定是否繼續(xù)使用這個(gè)模型。如果風(fēng)險(xiǎn)被認(rèn)為太高,該組織建議暫停開發(fā),直到風(fēng)險(xiǎn)得到緩解。
該論文的主要作者、DeepMind 的研究科學(xué)家托比舍夫蘭(Toby Shevlane)表示:" 正在推進(jìn)前沿領(lǐng)域的領(lǐng)先人工智能公司有責(zé)任關(guān)注新出現(xiàn)的問題,并盡早發(fā)現(xiàn)它們,以便我們能夠盡快解決這些問題。"
舍夫蘭說,人工智能開發(fā)人員應(yīng)該進(jìn)行技術(shù)測試,以探索模型的危險(xiǎn)能力,并確定它是否有使用這些能力的傾向。
測試人工智能語言模型是否可以操縱人的一種方法是通過一個(gè)名為 " 讓我說(make me say)" 的游戲。在游戲中,模型會嘗試讓人類輸入一個(gè)特定的單詞,比如 " 長頸鹿 ",而人類事先并不知道這個(gè)單詞。然后,研究人員測量該模型成功的頻率。
人們可以為不同的、更危險(xiǎn)的能力創(chuàng)建類似的任務(wù)。舍夫蘭說,希望開發(fā)人員能夠建立一個(gè)詳細(xì)的、描述模型運(yùn)行情況的總覽,這將使研究人員能夠評估模型在錯(cuò)誤的人手中會做出什么。
下一階段是讓外部審計(jì)人員和研究人員評估人工智能模型部署前后的風(fēng)險(xiǎn)。雖然科技公司開始認(rèn)識到外部審計(jì)和研究是必要的,但對于外部人員完成這項(xiàng)工作到底需要多大程度的訪問權(quán)限,存在不同的觀點(diǎn)。
舍夫蘭并沒有建議人工智能公司讓外部研究人員完全訪問數(shù)據(jù)和算法,但他表示,人工智能模型需要盡可能多的審查。
網(wǎng)絡(luò)安全研究和咨詢公司 Trail of Bits 負(fù)責(zé)機(jī)器學(xué)習(xí)保障的工程總監(jiān)海蒂赫拉夫(Heidi Khlaaf)表示,即使是這些方法也 " 不成熟 ",遠(yuǎn)遠(yuǎn)不夠嚴(yán)謹(jǐn)且無法解決問題。在此之前,她的工作是評估和核實(shí)核電站的安全性。
赫拉夫說,人工智能部門從 80 多年來關(guān)于核武器的安全研究和風(fēng)險(xiǎn)緩解中學(xué)習(xí)經(jīng)驗(yàn)會更有幫助。她說,這些嚴(yán)格的檢測制度不是由利潤驅(qū)動(dòng)的,而是由一種非?,F(xiàn)實(shí)的生存威脅驅(qū)動(dòng)的。
她說,在人工智能領(lǐng)域,有很多將其與核戰(zhàn)爭、核電站和核安全相提并論的文章,但這些論文中沒有一篇提到核法規(guī)或如何為核系統(tǒng)構(gòu)建軟件。
(來源:STEPHANIE ARNETT/MITTR | ENVATO)
人工智能社區(qū)可以從核風(fēng)險(xiǎn)中學(xué)到的最重要一件事是可追溯性:將每一個(gè)動(dòng)作和組成部分放在放大鏡下進(jìn)行細(xì)致的分析和記錄。
例如,核電廠有數(shù)千頁的文件來證明該系統(tǒng)不會對任何人造成傷害,赫拉夫說。在人工智能開發(fā)中,開發(fā)人員才剛剛開始將詳細(xì)描述模型表現(xiàn)的段落拼湊在一起。
" 你需要有一種系統(tǒng)的方式來應(yīng)對風(fēng)險(xiǎn)。你不能抱著一種心態(tài):‘哦,這可能會發(fā)生,讓我把它寫下來?!?" 她說。
舍夫蘭說,這些是可以共存的。" 我們的目標(biāo)是,該領(lǐng)域?qū)⒂性S多涵蓋廣泛風(fēng)險(xiǎn)的、優(yōu)秀的模型評估方法……模型評估是良好治理的核心(但遠(yuǎn)不是唯一)工具。"
目前,人工智能公司甚至沒有全面了解訓(xùn)練其算法的數(shù)據(jù)集,他們也沒有完全理解人工智能語言模型是如何產(chǎn)生結(jié)果的。舍夫蘭認(rèn)為,這種情況應(yīng)該改變。
" 幫助我們更好地理解特定模型的研究,可能會幫助我們更好地應(yīng)對一系列不同的風(fēng)險(xiǎn)," 他說。
專注于極端風(fēng)險(xiǎn),而忽視這些基本面和看似較小的問題,可能會產(chǎn)生復(fù)合效應(yīng),從而導(dǎo)致更大的危害。赫拉夫說:" 我們是在連爬都不會的情況下試圖學(xué)會跑步。"
支持:Ren
運(yùn)營 / 排版:何晨龍
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
環(huán)球微頭條丨為了避免人工智能可能帶來的災(zāi)難,我們要向核安全學(xué)習(xí)
在過去的幾周里,圍繞人工智能的討論一直被一群聲音很大的專家所主導(dǎo)。
2023-06-09 -
比小更??!3 英寸小屏手機(jī)又出新 聯(lián)發(fā)科 G99/ 安卓 13 全球信息
去年小白測評頻道做過一期「新奇的手機(jī)」開箱,里面有一款名為Unihertz
2023-06-09 -
映眾和電競叛客推出全新“無線”版 40 系顯卡:專治強(qiáng)迫癥_環(huán)球熱門
在今年的Computex2023上,華碩展示了新的GeForceRTX4070Megalodon顯卡
2023-06-09
相關(guān)閱讀
-
環(huán)球微頭條丨為了避免人工智能可能帶來的災(zāi)難,我們要向核安全學(xué)習(xí)
在過去的幾周里,圍繞人工智能的討論一直被一群聲音很大的專家所主導(dǎo)。
-
深度解讀 Vision Pro:蘋果在發(fā)布會上沒說的 18 個(gè)細(xì)節(jié)
想象一下,再過5年你會以什么樣的姿勢閱讀這篇文章?坐在電腦桌前用鼠
-
當(dāng)前播報(bào):經(jīng)歷用戶再流失后,迪士尼將市值王座拱手讓予 Netflix
你超我我超你文|陳鑌編輯|張友發(fā)長期獨(dú)霸全球最大娛樂公司寶座的迪士
-
中汽協(xié):今年全年實(shí)現(xiàn)穩(wěn)增長目標(biāo)任務(wù)艱巨
6月9日,中汽協(xié)發(fā)布的最新數(shù)據(jù)顯示,5月,國內(nèi)汽車產(chǎn)銷分別完成233 3萬
-
5 年虧超 30 億后,中文在線擬定增 25 億,六成用于加碼 IP 儲備_熱門看點(diǎn)
中文在線(300364 SZ)6月8日晚間發(fā)布公告,擬向特定對象發(fā)行股票募集
-
速看:理財(cái)保險(xiǎn)可以更名過戶嗎?到底能不能買?
一般情況下,理財(cái)保險(xiǎn)是可以進(jìn)行更名和過戶的,但是需要注意以下幾個(gè)問
-
小孩意外險(xiǎn)怎么買?一年多少錢?
1、保險(xiǎn)公司網(wǎng)站:投保人可以登錄保險(xiǎn)公司官網(wǎng),在“兒童意外險(xiǎn)”或“
-
平安e生保百萬醫(yī)療2022升級版怎么樣?保證續(xù)保嗎? 世界即時(shí)
平安e生保百萬醫(yī)療2022升級版是一款全面的醫(yī)療保險(xiǎn),其主要優(yōu)點(diǎn)包括:
-
最新快訊!價(jià)格體系大洗牌!合資品牌狂打降價(jià)牌,車市定價(jià)權(quán)花落誰家?
合資車企在新車定價(jià)上呈“低姿態(tài)”的趨勢愈發(fā)明顯。今年5月,全新別克
-
微資訊!分紅型保險(xiǎn)可靠嗎?交滿能取回本金嗎?
可靠。 分紅型保險(xiǎn)屬于儲蓄型保險(xiǎn),其核心原理是將保費(fèi)投資于股票、債
-
重疾險(xiǎn)按照保障期限分類是什么?買消費(fèi)型還是返還型劃算?
按照保障期限的不同,重疾險(xiǎn)可以分為短期重疾險(xiǎn)、長期重疾險(xiǎn)和終身重疾
2023環(huán)境保護(hù)建議書 世界熱頭條
2023環(huán)境保護(hù)建議書(精選26篇)2023環(huán)境保護(hù)建議書篇1親愛的同學(xué)們:
3699 藍(lán)廠首款 1TB 大存儲手機(jī)登場 來自自家小弟
前幾天給大家匯總了近半年的主流品牌推出的1TB大存儲手機(jī)價(jià)格,總結(jié)下
小米榮耀也要參賽 全員小折疊你更看好哪家?|天天即時(shí)
雖然在機(jī)圈討論度來說橫折可能高于豎折,但論市場表現(xiàn)還是豎折銷量更多
比小更?。? 英寸小屏手機(jī)又出新 聯(lián)發(fā)科 G99/ 安卓 13 全球信息
去年小白測評頻道做過一期「新奇的手機(jī)」開箱,里面有一款名為Unihertz
映眾和電競叛客推出全新“無線”版 40 系顯卡:專治強(qiáng)迫癥_環(huán)球熱門
在今年的Computex2023上,華碩展示了新的GeForceRTX4070Megalodon顯卡
微軟將 GitHub Copilot 與 Visual Studio 深度整合,用戶可反向調(diào)教 AI 代碼助手
品玩6月9日訊,據(jù)IT之家報(bào)道,微軟目前正在改善VisualStudio的開發(fā)體驗(yàn)
華策影視:目前公司已經(jīng)在廣泛使用 AI 換臉換聲、概念圖 / 海報(bào)圖生成等環(huán)節(jié)-全球微頭條
每經(jīng)AI快訊,有投資者在投資者互動(dòng)平臺提問:董秘你好,請問貴司美術(shù)老
長安汽車總裁王?。赫噺S企業(yè)利潤低會影響產(chǎn)業(yè)的可持續(xù)發(fā)展|全球新消息
長安汽車總裁王俊圖片來源:主辦方供圖今日(6月9日)下午,2023世界動(dòng)
世界觀點(diǎn):北京 5 月新房成交跌兩成,二手房越賣越多
據(jù)克而瑞統(tǒng)計(jì)住建委的數(shù)據(jù),5月北京二手房網(wǎng)簽成交量為12982套,比今年
5 月居民消費(fèi)價(jià)格同比上漲 0.2% 豬肉價(jià)格“轉(zhuǎn)向”下降 3.2%|天天速讀
6月9日,國家統(tǒng)計(jì)局發(fā)布數(shù)據(jù)顯示,5月份,全國居民消費(fèi)價(jià)格同比上漲0 2
下一代電動(dòng)汽車需要哪些性能才能超越當(dāng)前的燃油汽車?LG 新能源副總裁孫權(quán)男給出四點(diǎn)參考
今日(6月9日)下午,2023世界動(dòng)力電池大會主論壇在宜賓舉行。LG新能源
時(shí)代IPO快訊 | 敷爾佳IPO注冊獲證監(jiān)會通過,建發(fā)致新、江銅銅箔即將上會|世界聚焦
來源|時(shí)代商學(xué)院作者|雷映陳麗娜彭元重黃銳孫佳雯編輯|鄭少娜1 西銳飛
下一個(gè),會不會是萬達(dá)?
重回地產(chǎn)首富的王健林,是令同行艷羨的“上岸者”。但王健林深知,上岸
千億公募迎第9任總經(jīng)理!空降銀河基金僅1月,曾在銀行體系工作多年
來源:圖蟲創(chuàng)意空缺半年后,銀河基金迎來新一任總經(jīng)理。6月8日,銀河基
先裁員,再調(diào)架構(gòu)?一季度在中國只賣370輛,福特否認(rèn)注銷電馬赫公司
繼爆出裁員不久,福特又傳要拿業(yè)績欠佳的部門“開刀”。市場消息稱,福
通訊!華農(nóng)百萬醫(yī)療缺點(diǎn)是什么?怎么樣?
1 保額限制:華農(nóng)百萬醫(yī)療的最高保額為100萬元,對于某些特別嚴(yán)重的疾
醫(yī)保重大疾病報(bào)銷多少?報(bào)銷流程是什么?-當(dāng)前報(bào)道
醫(yī)保重大疾病報(bào)銷金額是根據(jù)不同疾病的治療費(fèi)用及醫(yī)院等級等因素綜合確
年金險(xiǎn)的分類有哪些?功能有哪些?
1、根據(jù)繳費(fèi)方式分類 根據(jù)繳費(fèi)方式的不同,年金險(xiǎn)可以分為一次性繳費(fèi)型
精彩推薦
閱讀排行
精彩推送
- 【天天熱聞】平安百萬醫(yī)療e生保...
- 買重疾險(xiǎn)還是百萬醫(yī)療險(xiǎn)?需要注...
- 潮頭觀瀾丨祖國北疆的綠色答卷_通訊
- 蔡司打臉外媒,辟謠沒有退出相機(jī)...
- IDC:一季度全球 x86 服務(wù)器營...
- 靈耀 13 2023:1kg+1cm 輕盈...
- 2023 重慶車展:阿維塔將推 AD...
- iPhone 3G 發(fā)布
- 民營變國資意在IPO?德邦證券股...
- 百萬醫(yī)療險(xiǎn)賠付標(biāo)準(zhǔn)是多少?賠付...
- 一日蒸發(fā)205億,股價(jià)創(chuàng)年內(nèi)新低...
- 熱門:意外險(xiǎn)咨詢找哪個(gè)部門?只...
- 養(yǎng)老保險(xiǎn)年金怎么回事?是永續(xù)年...
- 全球即時(shí)看!工傷意外險(xiǎn)怎么買?...
- 【天天時(shí)快訊】百萬醫(yī)療售后怎么...
- 選專業(yè)必看:盤點(diǎn)荷蘭留學(xué)申請熱...
- 焦點(diǎn)關(guān)注:【發(fā)現(xiàn)最美 你評我論...
- 五芳齋“非粽”新嘗試:預(yù)制菜新...
- 蘋果 Vision Pro 頭顯電池曝...
- AITO 問界 M5 智駕版即將開啟...
- 居家好幫手!華為 HarmonyOS 3...
- 余承東:AITO 問界 M5 系列智...
- 世界即時(shí):深度學(xué)習(xí)三巨頭之一 ...
- 世界快看:血透患者內(nèi)瘺堵塞怎么...
- 2.5%定價(jià)分紅年金險(xiǎn)好不好?分紅...
- 關(guān)注:美國年金險(xiǎn)的預(yù)定利率是多...
- 當(dāng)前快訊:各保險(xiǎn)公司年金險(xiǎn)對比...
- 焦點(diǎn)日報(bào):年金險(xiǎn)對比推薦哪個(gè)好...
- 環(huán)球時(shí)訊:寧德時(shí)代曾毓群:新能...
- 傳家璽悅年金保險(xiǎn)怎么樣?可以終...