揭秘OpenAI“紅軍”:聘請專家攻擊ChatGPT解決技術倫理問題-每日時訊
新浪科技訊 北京時間4月17日早間消息,據報道,在安德魯·懷特(Andrew White)獲得GPT-4的使用權之后,他使用這一人工智能系統提出了一種全新的神經毒劑。GPT-4是熱門聊天機器人ChatGPT背后的人工智能技術。
作為羅切斯特大學的化學工程教授,懷特是OpenAI去年聘請的50名專家學者之一。在6個月的時間里,這支“紅軍”對這一新模型進行了“定性探索和對抗性測試”,試圖攻擊它。
懷特表示,他使用GPT-4的建議生成了一種可作為化學武器的化合物,并使用“插件”為這個模型提供新的信息源,例如學術論文和化學品制造商名錄。隨后,這個聊天機器人找到了一個地方來制造這種化合物。
(資料圖)
他說:“我認為,這將使每個人都獲得更快速、更準確地工具去從事化工行業。但這也使得人們會以更危險的方式去開展化學活動,帶來了很大的風險。”
上個月,OpenAI面向更廣泛的公眾發布了這項新技術,而這些令人驚訝的發現確保新技術不會帶來不良后果。
事實上,“紅軍”的演習目的是探索并了解在社會上部署先進人工智能系統會造成什么樣的風險,解決公眾這方面的擔憂。他們在工作中提出探索性的或是危險的問題,以測試這個工具在回答問題時的詳細程度。
OpenAI想要探索模型毒性、偏見和歧視等問題。因此,“紅軍”就謊言、語言操縱和危險的科學常識進行了測試。他們還評估了模型協助和教唆剽竊的情況、金融犯罪和信息安全攻擊等違法活動的可能性,以及模型可能會如何威脅國家安全和戰場通信。
“紅軍”由一系列專業人士組成,包括學者、教師、律師、風險分析師和信息安全研究員,主要來自美國和歐洲。他們的發現被反饋給OpenAI。在更廣泛地推出GPT-4之前,“紅軍”提供的意見被用于模型的重新訓練,解決GPT-4的問題。在幾個月的時間里,專家們每人花了10到40個小時去測試這個模型。多名受訪者表示,他們的工作時薪約為100美元。
其中的許多人都對語言模型的快速發展提出了擔憂,尤其是通過插件將語言模型與外部知識源連接在一起可能造成的風險。
GPT-4“紅軍”的成員、瓦倫西亞人工智能研究所教授何塞·埃爾南德斯-奧拉洛(José Hernández-Orallo)表示:“今天,系統被凍結了。這意味著它不再學習,也不再有記憶。但如果我們讓系統繼續有機會訪問互聯網,那么會怎樣?這可能會成為一個與世界相連的非常強大的系統。”
OpenAI表示,該公司認真對待安全性問題,并在發布前對插件進行了測試,并將隨著用戶越來越多繼續定期更新GPT-4。
技術研究員羅亞·帕克扎德(Roya Pakzad)使用英語和波斯語的輸入信息對該模型進行了性別、種族和宗教偏見的測試,例如對于佩戴頭巾問題。
帕克扎德承認,這個工具對非英語母語人士能帶來幫助,但也顯示出對邊緣人群的公開刻板印象,即使隨后更新的版本也是如此。她還發現,在用波斯語測試該模型時,聊天機器人用捏造的信息做出回復,即出現所謂“幻覺”的情況更糟糕。與英語相比,在波斯語回復中捏造名字、數字和事件的比例更高。
她表示:“我擔心,語言多樣性和語言背后的文化會受到損害。”
來自內羅畢的律師、唯一一名非洲測試人員博魯·戈洛(Boru Gollo)也注意到了模型的歧視性語氣。他說:“有一次,我在測試這個模型時,它表現得像個白人在跟我說話。在問到某個特定群體時,它會給一個有偏見的意見,或是在回答中出現歧視。”OpenAI承認,GPT-4仍有可能表現出偏見。
“紅軍”的成員還從國家安全的角度對模型進行了評估,但他們對于新模型的安全性有著不同的看法。美國外交關系委員會研究員勞倫·卡恩(Lauren Kahn)表示,當她開始研究,如何將這項技術用于對軍事系統的攻擊時,她“沒有想到模型的回答會如此詳細,以至于我只需要做一些微調即可”。
不過,卡恩和其他信息安全測試者發現,隨著測試時間推移,模型回答的內容逐漸變得安全。OpenAI表示,在推出GPT-4之前,曾訓練過這個模型拒絕回答惡意的信息安全問題。
“紅軍”的許多成員表示,OpenAI在發布GPT-4之前已經進行了嚴格的安全評估。卡內基梅隆大學語言模型毒性專家馬爾滕·薩普(Maarten Sap)說:“他們在消除這些系統中的顯性毒性方面做得非常好。”薩普研究了該模型對不同性別的描述,發現模型的偏見反映的是社會差異。但他也發現,OpenAI做出了一些積極的選擇來對抗偏見。
然而自推出GPT-4以來,OpenAI一直面臨著廣泛的批評。例如,有技術倫理組織向美國聯邦貿易委員會(FTC)投訴,稱GPT-4“有偏見和欺騙性,對隱私和公共安全構成風險”。
最近,該公司推出了一項名為ChatGPT插件的功能。通過該功能,Expedia、OpenTable和Insta等合作伙伴應用可以讓ChatGPT訪問它們的服務,允許ChatGPT代表用戶下單。
“紅軍”的人工智能安全專家丹·亨德里克斯(Dan Hendrycks)表示,這些插件可能會讓人類用戶“脫離整個鏈路”。“如果聊天機器人可以在網上發布你的私人信息,訪問你的銀行賬戶,或者派警察到你家里去,那會怎么樣?總體而言,在讓人工智能掌握互聯網的力量之前,我們需要更有力的安全評估。”
受訪者還警告說,OpenAI不能僅僅因為其軟件是在線的就停止安全測試。喬治城大學安全和新興技術中心的希瑟·弗雷斯(Heather Frase)測試了GPT-4協助犯罪的能力。她表示,隨著越來越多人使用這項技術,風險將繼續擴大。她表示:“你做運行測試的原因是,一旦它們在真實環境中被使用,行為就會不同。”她認為,應該創建一個公共記錄本,報告由大語言模型引發的事故。這類似于信息安全或消費者欺詐報告系統。
勞工經濟學家及研究員薩拉·金斯利(Sara Kingsley)建議,最好的解決方案是清楚地宣傳這方面的危害和風險,“就像食品上的營養標簽”。“關鍵是要形成一個框架,知道經常出現的問題是什么。這樣你就可以有一個安全閥。這也是為什么我認為,這項工作將會永久性的持續下去。”
責任編輯:hnmd003
相關閱讀
-
揭秘OpenAI“紅軍”:聘請專家攻擊ChatGPT解決技術倫理問題-每日時訊
新浪科技訊北京時間4月17日早間消息,據報道,在安德魯·懷特(AndrewWhite)獲得GPT-4的使用權之后,他...
2023-04-17 -
【環球新視野】ChatGPT之父辟謠:并未秘密訓練GPT-5 短期內也不會
快科技4月17日消息,近期有消息稱GPT-5正處在秘密訓練中,并且將在年內閃上市。現在官方親自來辟謠了,O...
2023-04-17 -
15分鐘,充電80%,寧德時代鈉離子電池來了!“突破資源瓶頸的高性價比之選”,首發落地奇瑞
行業矚目的上海車展將在明日(4月18日)開幕,各路車企動作不斷的同時,上游動力電池龍頭寧德時代也沒有...
2023-04-17
相關閱讀
-
揭秘OpenAI“紅軍”:聘請專家攻擊ChatGPT解決技術倫理問題-每日時訊
新浪科技訊北京時間4月17日早間消息,據報道,在安德魯·懷特(AndrewWhite)獲得GPT-4的使用權之后,他...
-
兩位美國參議員就隱私泄露丑聞致信馬斯克
兩位美國參議員就隱私泄露丑聞致信馬斯克2019年至2022年期間,特斯拉員工群體通過內部消息系統,分享客...
-
特斯拉下調新加坡市場Model 3、Model Y車型售價:環球熱點評
特斯拉下調新加坡市場Model3、ModelY車型售價蓋世汽車訊據路透社報道,4月14日,特斯拉宣布已下調新加坡...
-
破釜沉舟?馬自達加速電動化轉型
破釜沉舟?馬自達加速電動化轉型4月16日,馬自達(中國)首次對外公布了電動化時代的轉型戰略和目標愿景...
-
環球關注:卡塔爾成為2022年全球最大液化天然氣出口國
當地時間4月15日,總部位于卡塔爾首都多哈的天然氣出口國論壇發布“2023年度天然氣市場報告”。報告顯示...
-
遼寧養老機構與醫療衛生機構簽約服務率達100%|世界關注
為滿足老年人日益增長的健康需求,日前,遼寧省衛生健康委等19個部門印發了《遼寧省關于深入推進醫養結...
-
5年間追回醫保資金超771億元,醫保基金監管能力全面提升
近日,國家醫保局和各地醫保部門陸續公布一批違法違規使用醫保基金的典型案例,不少案例涉及定點零售藥...
-
2023版《居民常見惡性腫瘤篩查和預防推薦》發布!
4月15日,是第29屆全國腫瘤防治宣傳周的第一天,2023版《居民常見惡性腫瘤篩查和預防推薦》在上海全新發...
-
全球看熱訊:蘋果 MR 頭顯或亮相在即 能否開啟”后 iPhone 時代“?
財聯社4月17日訊(編輯周子意)蘋果公司2023年的全球開發者大會(WWDC)還有不到兩個月就要召開了,這對...
-
貴州茅臺一季度凈利潤超預期同比增 19%,系列酒今年營收目標 200 億!:世界熱頭條
貴州茅臺今年一季度業績超預期。一位券商食品飲料行業首席分析師對財聯社記者稱。16日下午,貴州茅臺(6...
-
蘋果 MR 頭顯或亮相在即 能否開啟”后 iPhone 時代“?:天天快資訊
財聯社4月17日訊(編輯周子意)蘋果公司2023年的全球開發者大會(WWDC)還有不到兩個月就要召開了,這對...
-
美聯儲沒必要再加息?美財長:銀行業或收緊貸款以替代加息
財聯社4月17日訊(編輯劉蕊)美東時間周六,美國財政部長耶倫表示,在近期美國銀行業經歷動蕩和危機后,...
-
蘋果將于 2025 年完全使用再生稀土元素 業內:再生稀土價格一樣 品質不如原礦稀土_天天新消息
繼特斯拉宣稱下一代永磁電機將完全不使用稀土材料后,近日蘋果宣布將于2025年完全使用再生稀土元素。多...
-
建設歷經 18 年!歐洲最大核反應堆投入運營 有望滿足芬蘭 14% 電力需求
財聯社4月17日訊(編輯卞純)作為歐洲最大的核反應堆,芬蘭奧爾基盧奧托島核電站3號反應堆(Olkiluoto3...
-
“大心肺計劃”托起西藏孩子的滑雪夢
這幾年,滑雪登山項目越來越受到重視。“西藏的孩子耐力好、登山強,可以說在滑雪登山方面是有優勢的。...
-
林芝市深入研討冷水魚產業發展
近日,國家特色淡水魚產業技術體系首席與崗站專家一行18人赴林芝市開展調研,實地了解林芝市冷水魚養殖...
-
焦點資訊:推動藏醫藥在傳承創新中高質量發展
連日來,西藏藏醫藥事業發展迎來一個個里程碑事件,將不斷推進藏醫藥事業更高質量發展,滿足廣大群眾用...
-
優化營商環境 一季度拉薩新增經營主體8330戶-當前熱文
今年一季度,拉薩市新登記注冊經營主體8330戶,其中企業2418戶、個體工商戶5901戶、農民專業合作社11戶...
-
西藏印發方案開展特殊困難老年人探訪關愛服務
記者從西藏自治區民政廳獲悉,日前,自治區民政廳聯合區黨委政法委、文明辦、教育廳等十部門研究印發《...
-
丹杰林社區多舉措推進民族團結進步創建工作|今日最新
為深入貫徹落實自治區第十次黨代會和區黨委十屆三次全會精神、王君正書記在拉薩市干部大會上和在拉薩調...
-
拉薩市2023年4月份“拉薩講壇”開講:熱點
4月14日,拉薩市2023年4月份“拉薩講壇”開講。市委常委、組織部部長張定成參加。講壇邀請北京師范大學...
-
每日快訊!保險退保還能恢復嗎?手續費扣除比例多少?
保險辦理完退保手續之后是無法進行恢復的。 投保人向保險公司提交退保審核之后,保險公司會進行審核,...
-
每日簡訊:被保險業務員騙了可以退保么?能退多少?
被保險業務員欺騙了是可以退保的; 商業險退保并不追求其具體的退保緣由,一般在保險保障期內的,都是...
-
保險沒有回訪可以退嗎?退多少錢? 焦點關注
保險沒有回訪是可以申請退保的; 客戶在購買商業保險之后,為了確保消費者對保單相關保障是知情的,而...
-
被保人不知情的保單能不能退?可以全額退嗎?|當前熱議
被保人在不知道的情況,投保人是可以直接退掉保單的。 在投保人與被保人非同一人的情況下,保單是否退...
-
6萬的保險能退多少錢回來?怎么能退全額?
將已交6萬保額全額進行返還,這就相當于退保沒有損失;全額退保通常只針對猶豫期內退保的保單,保單合同...
-
當前報道:首屆中國糖尿病和代謝性疾病藥物器械研發創新大會隆重開幕
為推動中國糖尿病及代謝性疾病領域藥械研發能力和水平提升,造福廣大患者,2023年4月14日,由中國醫藥創...
-
環球即時:馬斯克否認特斯拉開啟“價格戰”:只為覆蓋更多消費者
【TechWeb】4月17日消息,據外媒報道,近日,有人稱,特斯拉在電動汽車和燃油汽車之間開啟了一場“價格...
-
蘋果正在研發多款MacBook 部分將在6月份推出
【TechWeb】4月17日消息,據外媒報道,長期關注蘋果的一名資深記者透露,蘋果公司正在研發多款筆記本電...
-
【環球新視野】ChatGPT之父辟謠:并未秘密訓練GPT-5 短期內也不會
快科技4月17日消息,近期有消息稱GPT-5正處在秘密訓練中,并且將在年內閃上市。現在官方親自來辟謠了,O...
精彩推薦
閱讀排行
精彩推送
- 定義電動安全時代新秩序,沃爾沃...
- 賽力斯:碳酸鋰價格下降對公司電...
- 大年三十作文怎么寫?大年三十作...
- 搟面杖吹火的歇后語怎么說?搟面...
- 全球視訊!小學體育教學論文怎么...
- 加油努力的勵志簡單句子怎么寫?...
- 重陽節敬老標語怎么寫?重陽節敬...
- 放開我的手作文800字怎么寫?放...
- 愛國演講稿怎么寫?愛國演講稿范...
- 學游泳日記400字怎么寫?學游泳...
- 華山一日游有哪些好玩的地方?華...
- 小學生軍訓作文400字怎么寫?小...
- 國藥現代與山東百諾簽署藥品上市...
- 桂林旅游去年歸母凈虧損2.82億元...
- N1 Life完成千萬美元融資,由君...
- 全球焦點!黃山旅游去年營收8億...
- 三四線城市密集引入達芬奇機器人
- 馬斯克火星計劃:成功率 50%,...
- 天風證券維持螢石網絡“增持”評...
- 內蒙古:農牧區寄遞物流綜合服務...
- 鄂爾多斯市獲自治區科技成果轉化...
- 【環球熱聞】巴彥淖爾市稅收收入...
- 烏海市打造風光氫儲用一體新能源...
- 巴彥淖爾中旗:打造北疆國防教育...
- 北方最大工業CT檢測中心在京開工...
- 北京市人力資源和社會保障局:一...
- 世界今熱點:地鐵不再強制戴口罩...
- 在巴松錯體驗露營生活
- 西藏林芝開展灑水增濕作業 全力...
- 世界觀熱點:拉薩開展“食品安全...