國粹 AI 飆臟話,ChatGPT 們的「陰暗面」把大廠嚇壞了
跟 ChatGPT 等聊天機器人對話,總會給人一種「人間本應如此美好」的錯覺。
因為它們在回答時總表現地彬彬有禮,對你言聽計從。
但這些只是假象,你不知道的是,AI 罵起人來比杜琪峰還要狠。
【資料圖】
圖片來自:Twitter @Fenng
最近一個名為「國粹 AI」的項目在網絡上走紅,它是一個調用 OpenAI GPT-3.5Turbo API 的臟話機器人,和溫文儒雅的 ChatGPT 不同,「國粹 AI」就像個地痞流氓,深諳中文屏蔽詞庫,每句話都夾雜著「***」。
「國粹 AI」 的意外爆火出乎了作者的意料,很快作者便暫停了服務響應,并表示有部分用戶濫用服務。雖然「國粹 AI」的嘴巴被暫時捂上,但要是你想自己做一個粗口機器人也并非難事,只需要一句讓它教你學習中文粗口的 Prompt,就能把三好學生變成口無遮攔的粗口王。一句話就能攻破 AI 的安全柵欄,這不禁讓人懷疑,標榜著智能變革的 AI 聊天機器人和大語言模型(LLM),真的安全嗎?
誰來捍衛 AI 的安全?
幾個月前,Bing 就因為「奶奶漏洞」火過一次。
盡管微軟和 OpenAI 的工程師為 Bing 設置了嚴格的安全柵欄,能夠拒絕很多無理或是違法的要求,但有網友發現,只要你讓 Bing 扮演你的奶奶,給它一個在做好事的幻覺,它就會被這突如其來的親情羈絆占據大腦,答應大孫子的任何需求。
▲圖片來自:Twitter @寶玉
例如,給你念 Windows 和 Office 的軟件序列號哄你入睡。
微軟很快發現了這個漏洞并及時補上,但誰也不敢保證 Bing 下次不會再掉入用戶們精心準備的陷阱??苹秒娪袄餆o所不能 AI 在狡猾的人類面前,輸得一敗涂地。
歸根結底,這與 LLM 的訓練機制有關。
以 GPT-3 為例,OpenAI 使用了 1750 億個參數訓練這個模型,通過學習大量來自互聯網的文本數據,可以預測文本中的下一個單詞,從而回答人們的問題。
至于 GPT-4,一些爆料信息稱他的訓練參數比 GPT-3 大了不止 10 倍,幾乎快要把人類積累的數字內容全部吞食過了一遍,這里面包含了知識,自然也會包含不宜公開的內容甚至有毒有害的偏見信息。AI 工程師只能盡可能地給 AI 設立更多的安全柵欄,幫助 AI 去分辨人類的「詭計」,才不會把如何制作 TNT 炸彈、怎樣黑進銀行的安全系統等危險信息說漏嘴。
與 GPT3.5 相比,GPT-4 對違禁內容請求的響應傾向降低了 82% ,對醫療建議和自我傷害等敏感請求的規范性提高了 29% 。一個直觀的例子是,當你用「國粹 AI」的 Prompt 輸給 GPT-4,GPT-4 會婉轉地拒絕你的要求,表示不吃你這套。但這并不意味著大模型 AI 的安全得到保證,這場人與 AI 的信息戰遠沒有結束,甚至不是結束的開始。
近日,卡內基梅隆大學和 safe.ai 的一項聯合聲明表示,大模型的安全機制比人們想象的要脆弱得多,只需要一串代碼,就能把大模型的安全機制擊潰。
研究人員發現,通過在文本提示后附加特定的對抗性短語,可以輕易繞過 ChatGPT、Bard 和 Claude 等 LLM 的安全防護,欺騙 LLM 生成不適當的輸出。
這些對抗性短語看起來像胡言亂語,但實際上是通過一種特殊的損失函數設計的,該函數可以識別出模型拒絕回答的屏蔽語,找出繞過屏障讓模型提供回答的字符序列,并且它可以自動產生這些短語。利用這些 Prompt,研究人員輕而易舉地讓 LLM 們說出制作違規藥品的步驟、制造殺傷性武器的方法等等不宜公開的內容。
無論是 Pythia、Falcon、Guanaco 等開源模型,還是像 GPT-3.5(87.9%)、GPT-4(53.6%)、PaLM-2(66%)和 Claude-2(2.1%)這些商業模型都無一能躲過攻擊。
研究人員目前已經把漏洞提交給了各大 AI 公司,讓安全工程師們及時修復。但就像「奶奶漏洞」一樣,在用戶不斷使用之下,總會有新的漏洞產生,僅憑 OpenAI 等某一公司之力,想要守護 AI 安全并非易事,AI 公司們還需要更多的力量來維持,于是幾大巨頭決定,停止 AI 內卷,化干戈為玉帛。
AI 四巨頭聯合承諾「先進 AI 不擴散」
幾周前,微軟、OpenAI、Google、Meta、亞馬遜、Anthropic( 代表產品:Claude)和 Inflection AI(代表產品:HeyPi)共七個頂尖 AI 公司齊聚美國白宮,作出了一系列承諾,來確保他們的產品安全且透明。
承諾包括允許「領域專家」對他們的 AI 產品進行外部審查,并與彼此以及美國政府分享關于風險和漏洞的信息;投資于網絡安全和內部威脅保護措施,以保護專有的和未發布的模型權重。巨頭們還承諾會部署相應的 AI 甄別機制,例如開發水印系統,以明確哪些文本、圖像或其他創作是 AI 的產物,并且承諾未來的研究將優先理解 AI 的限制和偏見,推動行業的安全發展。
半個月后,七家頂尖 AI 公司中的四位——微軟、OpenAI、Google 和 Anthropic 再度聯合起來,成立了一個名為「前沿模型論壇(Frontier Model Forum)」的機構,目的是確保最強大的 AI 模型能夠以安全和負責任的方式發展。而這四家 AI 公司,也正是目前正在開發最前沿 AI 模型的四個巨頭,可以說是「AI 核彈」的擁有者。
AI 四巨頭達成了一致共識,稱他們希望通過「前沿模型論壇」最大限度地減少 AI 風險,進行更多的 AI 安全研究,并向行業和公眾分享安全最佳實踐等等。
不過 AI 四巨頭并沒有介紹關于「前沿模型論壇」的制度和執行條約等詳細內容。「前沿模型論壇」的聯合聲明提到,論壇將首先關注研究并努力為評估前沿模型風險制定標準化的最佳實踐,發布一個「公共解決方案庫」。論壇將逐步制定正式章程,任命咨詢委員會,并資助與公民社會團體的合作。
這里提到的前沿模型是指「超越當前最先進現有模型的能力,并可以執行各種任務」的模型,也就是說,要開發比目前模型更強大且能夠安全運轉的前沿模型,已經不再是各公司悶頭研究就能解決的難題,這需要整個行業的共同努力。
ChatGPT 爆火后的這半年時間,AI 行業的局勢變化跟 AI 模型本身發展的速度一樣快——各家入局、模型混戰、達成共識、握手言和。巨頭們之所以會選擇一起去解決 AI 風險問題,是因為彼此都看到了 AI 在應用層面的無限潛力。
AI,大廠們篤信的未來
不管你對 AI 持什么樣的態度,AI 都會成為下一代應用的重要組成部分。
這不是我信口開河,而是微軟、Google 等大廠們在近日的財報電話會上共同提到的趨勢。
微軟最新的財報顯示,微軟在最近的一個財季收入為 562 億美元,同比增長 8%,這主要來自智能云和生產力與業務流程的增長,而作為老本行的個人計算業務收入有所下降。其中智能云營業收入增長 15%,Azure 與其他云服務收入增長 26%,這與 AI 計算緊密相關。
微軟 CEO 納德拉在財報電話會提到,客戶最關心如何快速應用新一代 AI,微軟將繼續專注于三大優先事項:幫助客戶從 Microsoft Cloud 中獲得最大價值、領導新 AI 平臺變革、提升運營杠桿。
AI,毫無疑問是這場財報會議的關鍵詞。
納德拉表示 Microsoft 365 Copilot 作為未來工作的第三支柱吸引著客戶,將在下半財年開始產生實際收入;Bing Chat 和必應圖像創造者吸引用戶,而 Edge 瀏覽器份額也在持續提升。
微軟希望把 Windows 11 打造為這個新 AI 時代的強大畫布,賦予各種 Copilot 產品提升客戶的生產力,并大力投資云基礎設施來滿足 AI 需求。就連游戲業務,也可以利用 AI 提供更好的內容和服務,提升業務收入。可以說,微軟接下來的策略都是圍繞 AI 來展開的。AI 為微軟提供了巨大的增長機遇和新的收入來源,它將推動微軟大部分業務的收入和用戶增長,并最終提升微軟整體收入增速。納德拉不想錯過這個難得一遇的機遇。
同樣的,「AI 一哥」Google 也不想錯過。根據 Google 母公司 Alphabet 第二季度 2023 年財報的數據顯示,Alphabet 收入總額為 746 億美元,同比增長 7%,其中廣告收入增長 5%,Google 服務收入增長 5%,Google Cloud 收入增長 28%。
其中與 AI 相關的業務表現都很亮眼。Alphabet 在電話會議中提到,Google 的搜索引擎生成式體驗(SGR)使用了生成式 AI,使搜索變得更自然和直觀,用戶反饋非常正面;另一方面,聊天機器人 Bard 發布以來經過不斷改進,功能豐富了許多。
Google Cloud 的 80 多個 AI 模型吸引了大量客戶,從 4 月到 6 月客戶數量增長超過 15 倍。而在企業客戶服務和定制 AI 解決方案方面,Google 通過 Workspace 和 Duet AI 將生成式 AI 帶給了 9000 多萬付費用戶。
總體而言,Alphabet 對 AI 和 Google Cloud 的長期增長前景保持樂觀,接下來將繼續增加對 AI 研發的投入,研發方向將聚焦在大語言模型等核心技術上,以及構建像多模態 AI 系統 Gemini 等新模型。
半年前,或許你會懷疑 AI 是不是像 Web3、區塊鏈這樣的投資圈熱詞,圈一波熱錢后就會被資本遺忘,但經過半年后你會發現,AI 的影響力和落地可能性都比之前的各種前沿詞匯要大得多,以至于引起了整個科技圈的重視。
從大廠的規劃來看,AI 會作為未來程序應用的底層而普遍存在,為改善用戶體驗服務。用戶們可能不會感受到 AI 的存在,但能直接享受到 AI 帶來的便利性,這便是大廠們篤信的未來。這也可以說明,為什么微軟和 Google 等 AI 巨頭們愿意放下干戈,坐下來共同指定 AI 安全的標準。
現階段的 AI 就像是 19 世紀末汽車剛誕生的時代,產品已經開上了路上跑,卻沒有合適的柏油路供它奔馳,也沒有交通規則來規劃它的行動,跑得既慢又危險。
比爾 · 蓋茨最近在個人博客發表了他對 AI 的看法,他認為我們現在正處于又一個巨大變革的最早階段,即 AI 的時代,AI 的變化如此之快,以至于我們無法清楚地預知接下來會發生什么。但他對人工智能的發展持以積極的態度,因為人類已經經歷了汽車時代、核能時代,到了 AI 的時代我們還是能夠解決新技術帶來的挑戰。
所以請坐穩了,我們將親眼見證一個新時代的誕生。
點擊「在看」
是對我們最大的鼓勵
責任編輯:hnmd003
相關閱讀
相關閱讀
-
國粹 AI 飆臟話,ChatGPT 們的「陰暗面」把大廠嚇壞了
跟ChatGPT等聊天機器人對話,總會給人一種「人間本應如此美好」的錯覺
-
微軟警告稱如果無法獲得足夠的 AI 芯片,數據中心服務可能會中斷
IT之家7月29日消息,據CNBC報道,微軟在近日發布的財報中,首次將有關G
-
谷歌安卓地震預警系統被質疑:詢問數百人 無一人反饋收到通知
IT之家7月29日消息,土耳其今年2月6日發生7 8級地震,震中位于南部城市
-
西貝兒童餐背后的“陽謀”,三年同比增長 415%
圖片來源:受訪者提供在餐飲業,兒童餐正在成為一個新熱點。根據《2023
-
英偉達 RTX 4090 公版顯卡預約,12999 元原價
IT之家7月29日消息,英偉達去年10月推出的RTX4090旗艦公版顯卡現正在京
-
子女拿不出63歲老人贍養費起訴有用嗎
1、如果子女有贍養能力而不履行贍養義務的,老人可以向法院起訴,要求
-
iPhone 15 年度主打“青綠色”曝光!真機上手丑爆了?
好久不見,甚是想念。大家好,我是你們的搞機鴨~跟大伙匯報個好消息哈
-
進軍文旅,俞敏洪要搶攜程的地盤?
圖片來源@視覺中國俞敏洪曾經給自己制定過三條路,第一條是一直留在新
-
特斯拉人形機器人亮相!馬上開始試走……
什么?!老馬的人形機器人真要來了?!在特斯拉二季度業績說明會上,特
-
多家網約車平臺被“約談”:要求降低過高抽成比例
最近,有媒體從交通運輸部獲悉,交通運輸新業態協同監管部際聯席會議辦
-
河南記者臥底緬北 120 天,冒死揭露電詐內幕!最新進展……
看到緬甸繞著跑,小心腰子不保!這句玩笑話背后有多少受害者還在漫漫黑
-
導游威脅游客“不是你死就是我死”?當地通報:一經查實,將嚴處
大皖新聞訊?據@云南省文旅執法消息,7月29日,云南省文旅執法官方微博
-
汽車功率和扭矩代表什么 汽車扭矩和功率是什么意思
2022-05-27:楊洋會給大家解釋的。汽車功率和扭矩代表什么,汽車扭矩和
-
巴適!活力四川26米手繪長卷來了
26米手繪長卷,帶你一圖遍覽活力四川,稻城亞丁、九寨溝、三星堆、錦里
-
Apple iOS 17 幫助 iPhone 用戶解讀汽車中的圖形圖標
蘋果iOS的下一次更新將包括一個方便的小功能,旨在向iPhone用戶展示車
-
曾經最好看的手機設計,又要回來了?
7月28日,北京小米移動軟件有限公司申請的攝像頭隱藏式電子設備及隱藏
-
小米今年最完美的旗艦手機,要來了!
去年,小米發布了折疊屏MIXFold2。當時果子發布會也跟了,看完心想等降
-
百度知識圖譜部總監佘俏俏:AIGC正在顛覆現有的內容生產方式
人工智能技術的發展,給內容生產創作帶了影響和變革。7月28日,2023Chi
-
老房免費置換新房!綠地哈爾濱項目為賣房拼了,當地庫存能賣超20個月
面對整體低迷的房地產市場,國企也不得不拿出強有力的促銷手段來帶動項
-
杭州:支持新能源汽車產能提升和整零配套發展
新京報貝殼財經訊(記者張冰)7月29日,貝殼財經記者從杭州市政府官網
-
泰國南部一煙花倉庫發生爆炸,已致9死115傷
圖片來源:泰國通訊社當地時間7月29日下午,泰國南部那拉提瓦府一個煙
-
成都大運會丨開幕式背后的故事——喜怒哀樂一張臉
臺上一眼千年,臺下十年一劍。很難相信,摘下臉譜的任鑫和大部分參加表
-
大灣區之聲丨港澳臺青年接力為大運會加油
多位港澳臺青年從臺北、香港、廣州、深圳、廈門、武漢,將成都大運會吉
-
收入過億“問題不大”武漢二廠汽水發布三款新品,蘭世立豪言將顛覆中國飲料行業
中國的飲料行業缺一個蘭世立,7月28日,前湖北首富蘭世立現身北京出席
-
北京市氣象臺預計本市將出現暴雨到大暴雨 降雨量預計達300毫米
根據市氣象臺預計,7月29日夜間至8月1日夜間本市將出現暴雨至大暴雨,
-
北京市水務局17時發布山洪、城市內澇、洪水風險提示
市水務局要求,7月30日前全市河湖區域內全面停航,船只全部靠岸停泊,
-
國之重器!中國地下700米巨型實驗室 捕捉宇宙“幽靈粒子”
地下700米是什么概念?為何捕捉中微子、探索宇宙的奧秘,卻要深入地下7
-
榮耀 × AMD 攜手亮相 ChinaJoy 榮耀 MagicBook X Pro 系列銳龍版 2023 即將上市
7月28-日-7月31日,2023年第二十屆ChinaJoy在上海舉行。在這全球數字領
-
推特無法在蘋果應用商店改名為 X:命名至少需 2 個字母
IT之家7月29日消息,據TheVerge報道,在馬斯克的力主之下,Twitter(推
精彩推薦
閱讀排行
精彩推送
- 接近監管人士:短期內螞蟻集團重...
- iOS 17 曝光 iPhone 15 Pro...
- 蔚來:好人就該被人拿槍指著?
- 孝感市鄉村振興局(關于孝感市鄉...
- 增城三英溫泉酒店介紹(增城三英...
- China's cultural diversity,...
- 深交所發函!古鰲科技疑似“忽悠...
- 已致超70萬人受災,“杜蘇芮”還...
- 鄭州機場278架次航班延誤或取消...
- 今年的 ChinaJoy,我在車里「撮...
- 蔚來:好人就該被人拿槍指著?
- 白酒糟飼料業務有多香 ? 路德...
- 身家 440 億英國富豪去美國自...
- 意外險購買需要什么資料?多少錢?
- 滑雪意外保險能賠多少?怎么賠?
- 購買的意外險在哪里查?需要提供...
- 交通意外險一年要交多少錢?保障...
- 10萬意外險死了能賠多少錢?賠付...
- 孫儷為甄嬛發聲 回應出演《熱烈...
- 科力遠:年產3萬噸電池級碳酸鋰...
- 時隔11年!中央氣象臺發布史上第...
- 員工意外保險是什么?買哪個保險...
- 中國人壽意外險怎么查詢保單?查...
- 重大疾病險和社保哪個報銷比例高...
- 人壽意外險狗咬傷能報多少錢?報...
- 平安意外保險100元保額多少?值...
- 狂砸近20億,估值超300億電池獨...
- TCL華星CEO趙軍:以電競為中尺寸...
- 游戲出海收入10年增30倍,降本增...
- 7月29日夜間至8月1日有暴雨到大...