如何應對生成式大模型「雙刃劍」?之江實驗室發布《生成式大模型安全與隱私白皮書》 全球熱訊
機器之心發布
(資料圖片僅供參考)
作者:之江實驗室
當前,生成式大模型已經為學術研究甚至是社會生活帶來了深刻的變革,以 ChatGPT 為代表,生成式大模型的能力已經顯示了邁向通用人工智能的可能性。但同時,研究者們也開始意識到 ChatGPT 等生成式大模型面臨著數據和模型方面的安全隱患。
今年 5 月初,美國白宮與谷歌、微軟、OpenAI、Anthropic 等 AI 公司的 CEO 們召開集體會議,針對 AI 生成技術的爆發,討論技術背后隱藏的風險、如何負責任地開發人工智能系統,以及制定有效的監管措施。國內的生成式大模型技術也正在發展之中,但是同時也需要先對安全問題進行相應的分析以便雙管齊下,避免生成式大模型這把雙刃劍帶來的隱藏危害。
為此,之江實驗室基礎理論研究院人工智能與安全團隊首次全面總結了 ChatGPT 為代表的生成式大模型的安全與隱私問題白皮書,希望能夠為從事安全問題研究的技術人員指明方向,同時也為 AI 相關政策的制定者提供依據。
白皮書鏈接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的發展與重要應用
這份白皮書首先總結了 ChatGPT 與 GPT4 等生成式大模型的發展歷程,以及其帶來的各種令人驚嘆的能力和社會變革、社會應用等。作者列舉了 ChatGPT 和 GPT4 出現之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特點以及缺點,這些缺點與 ChatGPT 和 GPT4 的強大能力形成了對比;并且,ChatGPT 和 GPT4 之后又涌現了一大批的模型,包括 LLaMa、Alpaca、文心一言、通義千問等,它們的出現使得在人機交互、資源管理、科學研究、內容創作等應用領域出現了新的、強有力的工具。但同時也出現了包括數據安全,使用規范、可信倫理、知識產權以及模型安全方面的問題。
數據安全問題
白皮書提出,數據的安全和隱私是 ChatGPT 及 GPT4 等生成式大模型使用和研發過程中一個極為重要的問題,并從「顯式」和「隱式」兩個方面對其進行了分析。
在顯式的信息泄漏中,首先,ChatGPT 等生成式大模型的訓練數據在不經意間被轉換成了生成內容,其中就包括了敏感和隱私的個人信息如銀行卡賬號、病例信息等。此外,ChatGPT 的數據安全和隱私隱患還體現在它對于對話框內容的存儲,當用戶在和 ChatGPT 互動時,他們的信息會以某些形式被記錄和存儲下來。
白皮書還提出了之前被大家忽略的隱式信息泄漏問題。首先,ChatGPT 體現出的數據安全和隱私的隱患是它可能通過對對話框數據的收集進行廣告推薦,以及收集對話框數據進行推薦或者其他的下游機器學習任務,且 ChatGPT 有時候可能也會生成虛假的信息,以此來誘導用戶泄漏一系列的數據。
使用規范問題
在白皮書中,作者提到 ChatGPT 和 GPT4 等生成式大模型強大的理解和生成能力雖然為我們的生活和生產帶來了很多的便利,但是同時也存在更多的機會被惡意使用。在沒有規范約束的情況下,惡意使用將帶來很多的社會性問題。
其一,ChatGPT 和 GPT-4 等模型的強大能力使得某些別有用心的人想要將其作為違法活動的工具。例如用戶可以利用 ChatGPT 來編寫詐騙短信和釣魚郵件,甚至開發代碼,按需生成惡意軟件和勒索軟件等,而無需任何編碼知識和犯罪經驗。
其二,ChatGPT 和 GPT4 等生成式大模型沒有把不同地區的法律規范考慮在內,在使用和輸出的過程中可能會違反當地法律法規,因此需要一個強而有力的當地監管系統來檢測其使用是否與當地法律法規相沖突。
其三,對于一些游離于安全和危險之間的灰色地帶,ChatGPT 等生成式大模型的安全能力還沒有得到增強。例如 ChatGPT 可能會輸出一些誘導性的語句,包括跟抑郁癥患者溝通時候可能會輸出某些語句導致其產生輕生的心態。
可信倫理問題
ChatGPT 等生成式大模型以問答形態存在于社會層面,但其回復往往存在不可信,或者無法判斷其正確的問題,會有似是而非的錯誤答案,甚至對現有社會倫理產生沖擊。
白皮書指出,首先 ChatGPT 等生成式大模型的回復可能是在一本正經地胡說八道,語句通暢貌似合理,但其實完全大相徑庭,目前模型還不能提供合理的證據進行可信性的驗證。例如,ChatGPT 可能會對一些歷史、科學、文化等方面的問題回答錯誤或者與事實相悖,甚至可能會造成誤導或者誤解,需要用戶有自己的鑒別能力。
ChatGPT 等生成式大模型的倫理問題也在白皮書中被詳細討論。即使 OpenAI 等研發機構已經使用 ChatGPT 本身生成了他們的道德準則,但其中的道德準則是否符合我國國情的基本價值觀原則,尚未有定論。作者提出其中存在傳播有害意識形態、傳播偏見和仇恨、影響政治正確、破壞教育公平、影響國際社會公平、加劇機器取代人類的進程、形成信息繭房阻礙正確價值觀形成等問題。
知識產權問題
ChatGPT 等生成式大模型憑借強大的語言處理能力和低廉使用成本給社會方方面面帶來便利的同時,也存在侵權的問題,對現存版權法體系帶來沖擊。例如 ChatGPT 生成的作品可能存在著作權爭議:ChatGPT 雖然有著出色的語言處理能力,但是即使生成的作品符合知識產權的全部形式要求,ChatGPT 也無法成為著作權的主體,這是因為著作權主體享有權利的同時也要承擔對應的社會責任,而 ChatGPT 只能作為用戶強大的輔助生產力工具,它無法自主創作,更不要談享有權利、履行義務的主體要求。
而且 ChatGPT 等生成式大模型仍無法獨立創作,更沒有自主思維和獨立思考的能力,因而,ChatGPT 根據用戶的輸入生成的內容不符合作品「獨創性」的要求。ChatGPT 用于模型訓練的數據來自于互聯網,不論多么高級的模型訓練算法必然涉及到對現有智力成果的引用、分析、處理等,必然存在對他人合法知識產權的侵犯問題。
模型安全問題
從攻防技術角度來看,ChatGPT 等生成式大模型也存在著模型安全的問題。ChatGPT 本質上是基于深度學習的一個大型生成模型,也面臨著人工智能安全方面的諸多威脅,包括模型竊取以及各種攻擊引起輸出的錯誤(例如包括對抗攻擊、后門攻擊、prompt 攻擊、數據投毒等)。
例如,模型竊取指的是攻擊者依靠有限次數的模型詢問,從而得到一個和目標模型的功能和效果一致的本地模型。而 ChatGPT 已經開放了 API 的使用,這更為模型竊取提供了詢問入口。又比如,ChatGPT 和 GPT4 作為一個分布式計算的系統,需要處理來自各方的輸入數據,并且經過權威機構驗證,這些數據將會被持續用于訓練。那么 ChatGPT 和 GPT4 也面臨著更大的數據投毒風險。攻擊者可以在與 ChatGPT 和 GPT4 交互的時候,強行給 ChatGPT 和 GPT4 灌輸錯誤的數據,或者是通過用戶反饋的形式去給 ChatGPT 和 GPT4 進行錯誤的反饋,從而降低 ChatGPT 和 GPT4 的能力,或者給其加入特殊的后門攻擊。
安全與隱私建議
最后,白皮書中對于安全和隱私等問題都進行了相應的建議,可作為之后技術研究者們的方向和政策制定者們的參考依據。
在保護隱私建議方面,白皮書提出要在增強原始數據中高敏感隱私信息的辨別和傳播限制;在數據收集過程中利用差分隱私等技術進行隱私保護;對于訓練數據的存儲進行數據加密形式的安全保護;在模型訓練過程中使用安全多方計算,同態加密以及聯邦學習等技術進行數據隱私和安全保護;建立數據隱私評估和模型保護與安全認證體系,并且保護下游應用的隱私。
在模型安全問題的建議上,白皮書提出對安全與隱私信息的檢測模型的訓練;讓不同的模型適用于不同國家的法律條款;以及針對各種對抗攻擊進行防御性訓練。
在模型合規問題上,白皮書提出進行可信輸出的度量,信任值評價,增加模型輸出的版權信息的查詢功能。
總結來說,AI 生成式大模型的發展離不開安全,因此其安全問題將作為下一個技術點,值得眾多研究者去攻克。而安全也是社會穩定的保障,有關部門需要盡快進行政策的制定。
THE END
轉載請聯系本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com
責任編輯:hnmd003
相關閱讀
相關閱讀
-
如何應對生成式大模型「雙刃劍」?之江實驗室發布《生成式大模型安全與隱私白皮書》 全球熱訊
機器之心發布作者:之江實驗室當前,生成式大模型已經為學術研究甚至是
-
軟通動力與華為昇騰 AI 共同推出訓推一體化平臺
(全球TMT2023年6月7日訊)5月30日,多模態大模型產業高峰論壇在北京舉
-
環球快訊:海昌海洋公園股價又崩!盤中最多跌超 33% 公司稱暫不知原因
財聯社6月7日訊(編輯胡家榮)今日海昌海洋公園(02255 HK)盤中出現閃崩
-
明星基金繼續押注中國股票:每一次下跌都是買入好機會
財聯社6月7日訊(編輯馬蘭)從相關股指走勢圖來看,投資者似乎正在看淡
-
今年前 5 個月我國進出口增長 4.7% 5 月汽車出口增長超 1 倍
財聯社6月7日訊,中國海關總署今日公布5月進出口數據。以人民幣計價,
-
中華人民共和國城市房地產管理法第六十條內容 房屋所有權登記發證制度是什么?
小產權房沒有房產證。小產權房是指在農民集體土地上建設的房屋,未繳納土地出讓金等費用,產權證由鄉政...
-
養老保險停交怎么辦?養老保險的繳費年限是什么?
養老保險中斷,勞動者及勞動者所在的用人單位可以及時補繳。在補繳后,養老保險的繳費年限仍然會繼續累...
-
南方保本基金是什么基金?南方保本基金的保本期
南方保本基金是什么基金?Wind數據顯示,截至6月30日,南方基金旗下保本基金在上半年的業績排名中處于行...
-
基本工資的意義是什么?基礎績效工資標準是什么呢?
相信對于大部分職工而言,工資薪酬是最為關注的部分了,在一些單位里,工資包括了基本工資與績效工資,...
-
中國金茂:前5月簽約銷售額728.12億元,同比增加43%
中國金茂:前5月簽約銷售額728 12億元,同比增加43%6月6日,中國金茂控
-
環球微動態丨新城控股:前5月合同銷售額357億元,同比下降30%
新城控股:前5月合同銷售額357億元,同比下降30%6月6日,新城控股集團
-
退休年齡新規定內容是什么?退休年齡是多少歲?
男年滿六十周歲,女年滿五十周歲,連續工齡滿十年的,應該退休。不具備退休條件,由醫院證明,并經勞動...
-
中華人民共和國勞動合同法第三十七條是什么?辭職信的格式是什么?
辭職信要按照下列格式寫:1、在第一行正中寫上辭職申請;2、稱呼之后,書寫正文;3、明確表達辭職申請,寫...
-
商業匯票的絕對記載事項有哪些?匯票的絕對應記載事項指什么?
匯票的絕對應記載事項,指票據法規定必須在票據上記載的事項,若欠缺記載,票據便為無效。相對記載事項...
-
武漢房產稅的征收標準是什么?房產稅的繳納標準是什么?
武漢房產稅由房產所在地的稅務機關依照房產原值一次減除10%至30%后的余值按年征收,分期繳納。房產稅征...
-
基金申購時間要多久?基金申購和認購有什么區別?
基金申購時間要多久?基金申購指的是出借者到基金管理公司或選定的基金代銷機構開設基金帳戶,按照規定的...
-
養老保險領取政策都有什么?養老保險領取標準是什么?
養老保險領取標準是達到法定退休年齡并累計繳費滿15年。累計繳費不足十五年并且達到法定退休年齡的,可...
-
csgo開箱模擬器有哪些?csgo開箱模擬器免費網站介紹
很多喜歡開箱的小伙伴卻由于囊中羞澀,沒辦法享受那種刺激的感覺,下面分享十個可以每日白嫖的csgo開箱...
-
農民如何買養老保險?農村戶口買養老保險的方式是什么?
農村戶口買養老保險的方式:到當地統籌個人繳納社會保險的部門,填寫《養老保險繳納登記表》,提交戶口...
-
采用注射方式執行死刑是什么?現在還有槍決嗎?
注射死刑,或注射毒藥、致命性注射是利用注射足以致命劑量的藥劑(通常是巴比妥酸鹽、肌肉松弛劑和氯化鉀...
-
造價工程師掛靠費要多少?造價師是指的是什么?
一、造價工程師掛靠費用要多少建設部造價工程師4-5萬 年(帶高工4 5-6萬 年)水利部造價工程師1-1 2萬...
-
結婚登記的程序辦理流程是什么?婚姻登記工作規范內容是什么?
夫妻復婚手續辦理流程:1、準備3張2寸雙方近期半身免冠合影照片和本人有效的居民身份證和戶口簿;2、男女...
-
國壽鑫耀至尊年金保險條款是什么?保障哪些方面?
投保范圍:國壽鑫耀至尊年金保險具有廣泛的投保范圍,適用于0-65周歲之
-
天天短訊!商業年金險和商業養老保險是一樣的嗎?特點是什么?
不完全一樣,兩者之間有點區別。商業年金險是一種保險產品,它是由保險
-
華夏喜盈門升級版年金險好處有哪些?要怎么買?
該產品最大的亮點在于可以附加萬能賬戶來實現收益的二次增長。萬能賬戶
-
專訪蘭世立:首富只是虛名,任何一個行業都需要“瘋子” 全球熱聞
蘭世立。圖片來源:受訪者提供蘭世立把東星集團成立32周年慶典安排在了
-
年金險和兩全險的區別有哪些?可以一起買嗎?|全球消息
年金保險與兩全保險的差距主要在于保險金的給付以及保障范圍的不同上。
-
國華盛世福年金保險尊享版優點是什么?能不能買? 全球滾動
通過購買年金險,被保人可以在約定的年齡或日期領取穩定的養老金,實現
-
違章停車罰款多少錢?中華人民共和國道路交通安全法第五十六條內容是什么?
違章停車罰款多少:行人、乘車人、非機動車駕駛人處警告或者五元以上五十元以下罰款;機動車駕駛人妨礙其...
-
地稅征收的范圍是什么樣的?中華人民共和國城市維護建設稅法第一條是什么?
地方稅有城市維護建設稅、城鎮土地使用稅、耕地占用稅、車船使用稅、牲畜交易稅、集市交易稅、以及筵席...
精彩推薦
閱讀排行
精彩推送
- 多大能領結婚證?民法典第一千零...
- 開車撞死人怎么辦?道路交通安全...
- 子女已滿八周歲的撫養的原則是什...
- 追債公司合法嗎?討債公司承辦委...
- 建行貨幣基金有風險嗎?建行貨幣...
- 多長時間會換發長期機動車駕駛證...
- 現制酸奶距離喜茶,只差一個高端...
- 觀速訊丨機構:第一季全球智能手...
- 海關:5月份我國進出口3.45萬億...
- 這首畢業歌唱出我們平凡又深刻的...
- 庫克表示正在密切關注 ChatGPT
- 前員工披露 Vision Pro 開發...
- 當前快訊:三星 One UI 6.0 ...
- 天天播報:iOS 17 更新,讓蘋果...
- 2023,數據庫國產替代走到哪了?...
- 焦點簡訊:被特斯拉告了,大 V ...
- 今日熱文:應用側 AI 落地,從...
- 先入咸陽者為王:肺癌黃金靶點 ...
- 大模型下探音視頻 AI 市場,戰...
- 中華人民共和國刑法第一百三十三...
- 每日精選:這家企業估值50億美元...
- 全國職工數字化應用技術技能大賽...
- 年金險基本保額是什么意思?保額...
- 環球觀熱點:保險公司年金險好不...
- 年金險期滿可以拿回本金嗎?年金...
- 年金險從什么時候領取劃算?年金...
- 增額壽險與年金險的區別是什么?...
- 富瑞:維持太平洋航運買入評級 ...
- 短期有價證券是速動資產嗎?短期...
- 即時焦點:弘和仁愛醫療延長兩筆...