本想用 AI 來打敗 AI,結果不小心翻車了。。。 當前速訊
不久前,一張馬斯克嬰兒時期的照片在外網被瘋狂轉發。
起因是一名博主在推特上發了張圖,并配文 " 據報道,埃隆 · 馬斯克正在研究一種抗衰老配方,但結果失控了。 "
【資料圖】
但只要稍微用心辨別,就能看出來這是成年馬斯克的臉直接移植上去的, AI 味兒太沖了。
自打這 AI 大模型成熟以后,各種 AI 生成的內容就在網絡上迅速泛濫。
像什么川建國同志退休后的生活;
還有 " 馬斯克投資 AI 失敗,賣燒烤還債 "" 馬斯克在廣州城中村擺攤的日子 "" 馬斯克 kiss 女機器人 " 。各種梗圖層出不窮,開局一張圖,內容全靠編的情況是愈演愈烈。而在文本領域,不少學生借著 AI 寫論文、寫作業,甚至于莫言也坦言,給余華的頒獎詞是 ChatGPT 幫忙寫的。
那么問題來了, AI 生成的內容滿天飛,我們要怎么去區分到底哪些是 AI 創作的,哪些是人類創作的呢?
前段時間 AI 詐騙 430 萬的案子大家都還心有余悸,再這么任由 AI" 狂飆 " 下去,下一個受害者可能很快就會出現。
其實吧,現在市面上也出現了不少反 AI 工具,專門用來檢測 AI 生成的內容。不過,這些工具真的就靠譜嗎?
為此,世超專門找了幾個檢測工具,測試了一波。
首先是 AI 圖像檢測。
世超分別找了 Umm-maybe 、 Illuminarty 、 AI or Not這三個討論度比較高、甚至是號稱準確率在 95% 的檢測工具,方便做一個對比。其中 Illuminarty 和 Umm-maybe 測試結果顯示的是概率, AI or Not 則是直接給回答。本以為 AI 檢測工具是個 " 火眼金睛 " ,但沒想到在馬斯克 " 返老還童 " 的那張圖片上,就開始翻車了。
Illuminarty 和 AI or Not 的態度都很明確,這明顯就是由 AI 生成的。
但輪到 Umm-maybe ,畫風就變了。
它告訴我,這張圖片是人類創作的概率為 81% 。
我尋思這肉眼都能瞧出來是 AI 干的好事,這怎么還能檢測不出來呢。為了看看是不是偶爾的 bug ,我又多試了幾次。
這張奧黛麗赫本在《 羅馬假日 》里的電影截圖, Umm-maybe 給了個模棱兩可的答案,概率是一半一半。
剩下的一個站 AI ,一個站人類。至少從馬斯克和赫本這兩張圖片的測試結果來看,除了 AI or Not 之外,其他兩個 AI 檢測工具的判定都不太準確。不過,打臉的時刻總是來得很快。
當我以為 AI or Not 稍微靠點兒譜的時候,它卻說這張金角大王拿著漢堡的 AI 圖片,是人類生成的。
你以為這就完了?更離譜的還在后頭。這張梅西踩縫紉機的 AI 照片, Umm-maybe 給出的人類創作概率為 89% 。
這有點過于荒謬了。。。還有這張人跟巨型老虎合影的照片,肉眼就能看出來是 AI 生成的吧。
結果除了 Umm-maybe ,其余都認為這是人類創作的,甚至 Illuminarty 還覺得 AI 生成的概率只有 1.5% 。
總結一下,在 AI 圖片的檢測上,世超總共測試了 10 張不同的圖片, 8 張由 AI 生成, 2 張由人類創作。排除掉了 2 項有爭議的結果后, AI or Not 和 Umm-maybe 的準確率都是 67% ,而 Illuminarty 的準確率為 50% 。
也就是說,這三個 AI 圖像檢測工具的準確度并不算高。咱們再來看看文本的檢測情況。
同樣,還是選用了 3 個比較熱門的檢測工具:GPTZero 、 Sapling 以及 Copyleaks 。
世超先讓 ChatGPT 生成了一段關于椰汁的廣告文案,再依次用工具進行測試。
但一上來就給我整不會了。我原封不動從 ChatGPT 那邊粘貼過來的文案, GPTZero 竟然說是可能完全由人類編寫。
而 Sapling 給出結果也一樣,這段文字由 AI 生成的概率為 0 。只有 Copyleaks ,把全文都標紅了,咬死這是 AI 寫的。三個工具里有兩個都檢測不出來這是 ChatGPT 寫的,是不是有點太過分了。。。不信邪的我,又讓 ChatGPT 以魯迅的風格寫了一篇《 火鍋日記 》。
Copyleaks 依舊穩定發揮, GPTZero 這回倒是學聰明了,只有 Sapling 還在死死堅持那就是人寫的。為了測試這些工具對于人類創作的反應,我又節選了一段《 活著 》里的內容。
可能是余華老師的《 活著 》過于出名,幾個工具在這一關上倒是沒有踩坑。
前前后后測試了好幾次,除了 Copyleaks 的正確率相對比較高之外,剩下的感覺都不是特別聰明的樣子,而且 Sapling 還出現了對中文不太友好的情況。
其實吧,無論是圖像還是文字檢測,都是靠著 AI把人類創作和機器生成區分出來。
換句話說,就是用魔法來打敗魔法。
只是不同的訓練模型,所用的數據集不同,分類的指標也不同。不過,這次的測試結果大家應該也看到了, AI 檢測工具的效果并沒有想象中那么好。
世超覺得問題,可能就出在這訓練數據上。
像上文提到的 AI or Not ,它的數據集范圍就只有 Stable Diffusion 、 Midjourney 、 Dall-E 、 GAN 和 Generated faces 生成的圖像,如果超出了這個范圍,誤判也是常有的事兒。
雖然可以利用視覺算法,將輸入圖像的分辨率、清晰度等局部細節跟 AI 圖像的特征進行比對。但攔不住 AI 進化的速度太快了,像之前備受吐槽的 " 六指戰士 "Midjourney 每更新一版,對于細節的刻畫也就更逼真。
這文本呢,也是類似的情況。就比如說這 GPTZero ,要想知道文字到底是不是由 AI 生成的,需要看兩個指標,一個叫困惑度,一個叫突發性。
困惑度指的是 AI 模型在看到這段文字時,會不會覺得很難懂,像什么 " 依托答辯 " 之類的諧音梗, AI 不一定能夠看懂,困惑度越高,就證明內容越有可能是人類創作的。而突發性,指的就是句子結構的變化程度。
畢竟人類跟 AI 不同,在寫東西的時候句式可能一會兒長一會兒短,追求的就是一個變化多端, AI 則更傾向于使用統一的句式。
但 AI 在不斷的進化中,無論是在困惑性還是突發性上,生成的內容越來越接近人類。
更何況現在的 AI 大模型一天一個樣,等 AI 檢測追上來, AI 生成的內容早不知道飆到哪去了。
但凡人類有什么風吹草動, AI 就馬上能內化到自己的模型里。照這么下去, AI 生成的東西只會越來越難以辨別。
所以眼下,咱們能做的就是寄希望于技術大牛們,趕緊想辦法讓 AI 檢測工具實現" 彎道超車 "。
而這場由 AI 掀起的風浪,終究或許也只有 AI 知道怎么去平息了。
責任編輯:hnmd003
相關閱讀
相關閱讀
-
本想用 AI 來打敗 AI,結果不小心翻車了。。。 當前速訊
不久前,一張馬斯克嬰兒時期的照片在外網被瘋狂轉發。起因是一名博主在
-
iPhone 15 系列新配色曝光,蘋果再次打響色彩戰
去年九月,蘋果在秋季新品發布會上帶來了全新iPhone14系列,其中iPhone
-
深圳證監局點名部分券商:研報業務內控不到位,對從業人員疏于管理 環球播資訊
7月4日,深圳證監局發布了2023年第2期證券期貨機構監管通訊。在本期通
-
當前速讀:新能源車正開著,電池掉了!網友:滿格電瞬間沒了!最新回應……
近日,一則新能源汽車疑似行駛途中電池包脫落的視頻在社交平臺熱傳,引
-
流水的“互聯網老公”,鐵打的女性消費-環球動態
圖片來源@視覺中國文|商業數據派,作者|黃小藝,編輯|劉雨琦姐狗文學,
-
2023 上半年車企的追求:安全、續航、低成本
圖片來源@視覺中國文|電車通市面上對電動車的質疑聲沒有停過,但比發展
-
“巨型泡面桶”遭瘋搶,被炒至 1999 元!深圳市監局回應
近日,山姆泡面桶炒至500元仍遭瘋搶網紅泡面桶被炒至1999元引發關注。7
-
海天味業-海天味業集團官網 全球觀熱點
1、現已擁有醬油、蠔油、醋、調味醬等八大品類,合計200余個規格品種。
-
上市銀行“發錢季”,40家銀行分紅5877億!買銀行理財,不如買銀行股? 環球簡訊
上市銀行進入分紅季,多家銀行派發大額現金紅包。7月4日,齊魯銀行(60
-
環球視點!ESPN評足壇十大右后衛:阿什拉夫居首,坎塞洛第7、英格蘭4人上榜
ESPN評足壇十大右后衛:阿什拉夫居首,坎塞洛第7、英格蘭4人上榜,曼城,
-
【時快訊】龍皇集團(08493)根據一般授權發行3456萬股
智通財經APP訊龍皇集團08493發布公告該公司于2023年7月3日根據一般授權
-
世界短訊!電動汽車需求低于預期,大眾埃姆登工廠減產裁員
IT之家7月4日消息,大眾汽車正在削減其位于德國西北部埃姆登工廠的電動
-
7月4日基金凈值:萬家興恒回報一年持有期混合A最新凈值0.9918,漲0.36%_世界視訊
7月4日,萬家興恒回報一年持有期混合A最新單位凈值為0 9918元,累計凈
-
李斌再投20億自制電池,盈利的蔚來近在眼前遠在天邊-今日訊
近日,電動車企業蔚來正式成立了屬于自己的電池制造公司。據企查查APP
-
[風險]光一退(300356):公司股票進入退市整理期交易第三次風險提示公告-當前獨家
證券代碼:300356證券簡稱:光一退公告編碼2023-083號光一科技股份有限
-
每日短訊:云南昭通多地遭遇強對流天氣 緊急避險轉移群眾8350人
昭通市防汛指揮部第一時間啟動新一輪強降雨防汛Ⅳ級應急響應,就搶險避
-
來了!你們要的“二手手機”推薦|全球熱議
引入大家好,我是鍵盤俠說。本期視頻給大家推薦一期2000元以內,可以
-
6 月:比亞迪繼續“一打十”,理想首破 3 萬輛|世界看熱訊
小伙伴們,6月新能源銷量出爐啦,作為號稱史上最卷的一個月,咱們來看
-
為什么要出一臺 15 寸 的 MacBook Air?上手體驗告訴你
這次WWDC大家的關注點都在VisionPro上,其實蘋果悄無聲息發布的MacBook
-
剛曝光的驍龍 8 Gen 2 旗艦,設計太騷了
此前爆料稱,realme真我正在準備推出新款高端機型,搭載驍龍8Gen2。現
-
焦點熱門:乘聯會:預估 6 月新能源乘用車廠商批發銷量 74 萬輛,同比增長 30%
IT之家7月4日消息,乘聯會綜合預估6月乘聯會新能源乘用車廠商批發銷量7
-
當前快訊:經合組織:英國是唯一一個通脹仍在上升的主要經濟體
財聯社7月4日訊(編輯牛占林)經濟合作與發展組織(OECD)最新數據顯示,
-
當前速看:“藥店四小龍”哪家強?大參林一季度最賺錢,定增 30 億再擴軍
本文來源:創業圈作者:何秀蘭文|記者何秀蘭邁入萬店時代,大參林(603
-
2023 世界人工智能大會倒計時兩天!一起來看大模型、人形機器人、智能駕駛……還有大獎獎金等你來角逐!|環球通訊
《科創板日報》7月4日訊(記者黃心怡)2023世界人工智能大會(WAIC2023
-
乘聯會:6 月新能源乘用車廠商批發銷量同比預增 30%
中新經緯7月4日電4日,乘聯會網站披露,預估6月新能源乘用車廠商批發銷
-
電子商務行業類別代碼_電子商務屬于什么專業類別_環球資訊
1、來源電子商務學習網《電子商務專業考公務員考試屬于什么專業類別》
-
五糧液是第一大股東!這家袖珍銀行沖刺香港上市,資產只有804億|天天熱消息
經過擴股增資、選聘會計師事務所和聯席保薦機構等一系列準備動作后,宜
-
8萬人小城迎46億投資,國內單體最大碳酸鋰項目在新疆若羌投產 今日看點
若羌,是塔克拉瑪干、庫木塔格、庫魯克三大沙漠環繞下的寶貴綠洲,是古
-
【獨家焦點】萬達電影預計上半年扭虧,電影扎堆上映,優質內容才能贏得觀眾
圖片來源:圖蟲電影市場回暖了?7月3日,萬達電影(002739 SZ)發布202
-
注冊資本創記錄!瑞眾人壽565億超越平安,營銷員:“照單全收”華夏保險保單
來源:視覺中國被接管三年后,華夏保險“變身”瑞眾人壽。7月3日,國家
精彩推薦
閱讀排行
精彩推送
- 各地持續優化對農服務 加大科技...
- 全球速看:伊朗成為新成員!上合...
- 盧偉冰官宣小米 MIX Fold3 已...
- 「小白」iQOO 11S 測評:200W...
- 字節、網易相繼入局,AI 之后大...
- “盜竊”而來的 3000 億單詞?...
- 300 元的旗艦小屏機用起來怎么...
- 當前快報:理想汽車CEO李想:7月...
- 天天熱訊:合成飛機大作戰什么時...
- “金牌ADC”喻文波退出亞運電競...
- 今年市衛健委明確24件為民辦實事項目
- 亞運測試賽激戰正酣 老場館“微...
- 天天視點!中國人權研究會在日內...
- 比魅族懂宣傳,Nothing Phone ...
- 3799 元起,iQOO 11S 發布:...
- 蘋果 iPhone 15「新」配色綠色...
- 榮耀趙明:千帆競渡,打破蘋果一...
- 全球看點:國家原子能機構:IAEA...
- 精選!再見巴黎!內馬爾獲三年6...
- 48家券商7月金股出爐!計算機、...
- 優酷回應將注入阿里影業:不屬實
- 診所突發火情,達達快送大連小哥...
- 新時代北京的精氣神|接訴即辦 ...
- NothingPhone2 真機上手 灰色...
- 緊抱華為大腿,失去“靈魂”的賽...
- 全球微動態丨iQOO 11S 評測:...
- iQOO 11S 首發:不只是電競旗...
- 用 AI,挑戰北京「地獄級」路線...
- 東方甄選首次在App直播:將在抖...
- 熱推薦:淡妝濃抹總相宜的宜是什...