今日快看!識別「ChatGPT 造假」,效果超越 OpenAI:北大、華為的 AI 生成檢測器來了
機器之心專欄
機器之心編輯部
AI 造假的成功率很高,前幾天「10 分鐘騙 430 萬」還上了熱搜。在最熱門的大語言模型上,研究人員最近探索了一種識別方法。
(資料圖片)
隨著生成式大模型的不斷進步,它們生成的語料正逐步逼近人類。雖然大模型正在解放無數文書的雙手,它以假亂真的強勁能力也為一些不法分子所利用,造成了一系列社會問題:
來自北大、華為的研究者們提出了一種識別各式 AI 生成語料的可靠文本檢測器。根據長短文本的不同特性,提出了一種基于 PU 學習的多尺度 AI 生成文本檢測器訓練方法。通過對檢測器訓練過程的改進,在同等條件下能取得在長、短 ChatGPT 語料上檢測能力的可觀提升,解決了目前檢測器對于短文本識別精度低的痛點。論文地址:https://arxiv.org/abs/2305.18149代碼地址 ( MindSpore ) :https://github.com/mindspore-lab/mindone/tree/master/examples/detect_chatgpt
代碼地址 ( PyTorch ) :https://github.com/YuchuanTian/AIGC_text_detector
引言
隨著大語言模型的生成效果越發逼真,各行各業迫切需要一款可靠的 AI 生成文本檢測器。然而,不同行業對檢測語料的要求不同,例如在學術界,普遍需要對大段完整的學術文本進行檢測;在社交平臺上,需要對相對簡短而較為支離破碎的假消息進行檢測。然而,既有檢測器往往無法兼顧各式需求。例如,主流的一些 AI 文本檢測器對較短的語料預測能力普遍較差。
對于不同長度語料的不同檢測效果,作者觀察到較短的 AI 生成文本可能存在著一部分歸屬上的「不確定性」;或者更直白地說,由于一些 AI 生成短句同時也常常被人類使用,因而很難界定 AI 生成的短文本是否來自于人或 AI。這里列舉了幾個人和 AI 分別對同一問題做出回答的例子:
由這些例子可見,很難對 AI 生成的簡短回答進行識別:這類語料與人的區別過小,很難嚴格判斷其真實屬性。因此,將短文本簡單標注為人類 / AI 并按照傳統的二分類問題進行文本檢測是不合適的。針對這個問題,本研究將人類 / AI 的二分類檢測部分轉化為了一個部分 PU(Positive-Unlabeled)學習問題,即在較短的句子中,人的語言為正類(Positive),機器語言為無標記類(Unlabeled),以此對訓練的損失函數進行了改進。此改進可觀地提升了檢測器在各式語料上的分類效果。
算法細節
在傳統的 PU 學習設定下,一個二分類模型只能根據正訓練樣本和無標記訓練樣本進行學習。一個常用的 PU 學習方法是通過制定 PU loss 來估計負樣本對應的二分類損失:
其中,表示正樣本與正標簽計算的二分類損失;表示將無標記樣本全部假定為負標簽計算的二分類損失;表示將正樣本假定為負標簽計算的二分類損失;表示的是先驗正樣本概率,即正樣本在全部 PU 樣本中的預估占比。在傳統的 PU 學習中,通常將先驗設置為一個固定的超參數。然而在文本檢測的場景中,檢測器需要處理各式長度不同的文本;而對于不同長度的文本而言,其正樣本在所有和該樣本相同長度的 PU 樣本中的預估占比也是不同的。因此,本研究對 PU Loss 進行了改進,提出了長度敏感的多尺度 PU(MPU)loss 損失函數。
具體地,本研究提出了一個抽象的循環模型對較短文本檢測進行建模。傳統的 NLP 模型在處理序列時,通常是一個馬爾可夫鏈的結構,如 RNN、LSTM 等。此類循環模型的這個過程通常可以理解為一個逐漸迭代的過程,即每個 token 輸出的預測,都是由上一個 token 及之前序列的預測結果和該 token 的預測結果經過變換、融合得到的。即以下過程:
為了根據這個抽象的模型進行先驗概率的估計,需要假定該模型的輸出為某個句子為正類(Positive)的置信度,即判定為人說出的樣本的概率。假設每個 token 的貢獻大小為句子 token 長度的反比,是非正(Positive)即無標記(Unlabeled)的,且為無標記的概率遠遠大于為正的概率。因為隨著大模型的詞匯量逐漸逼近人類,絕大部分詞匯會同時出現在 AI 和人類語料中。根據這個簡化后的模型和設定好的正 token 概率,通過求出不同輸入情況下模型輸出置信度的總期望,來得到最終的先驗估計。
通過理論推導和實驗,估計得到先驗概率隨著文本長度的上升而上升,最終逐漸穩定。這種現象也符合預期,因為隨著文本變長,檢測器可以捕捉的信息更多,文本的 「來源不確定性」也逐漸減弱:之后,對于每個正樣本,根據其樣本長度得到的獨特先驗對 PU loss 進行計算。最后,由于較短文本僅有部分 " 不確定性 "(即較短文本也會含有一些人或者 AI 的文本特征),可以對二分類 loss 和 MPU loss 進行加權相加,作為最終的優化目標:
此外需要注意的是,MPU loss 適配的是長度較為多樣的訓練語料。倘若既有的訓練數據單質化明顯,大部分語料為大段冗長的文本,則無法全面發揮 MPU 方法的功效。為了使得訓練語料的長度更多樣化,本研究還引入了一個在句子層面進行多尺度化的模塊。該模塊隨機遮蓋訓練語料中的部分句子,并對余下句子在保留原有順序的前提下進行重組。經過訓練語料的多尺度化操作,訓練文本得到了長度上的極大豐富,從而充分利用了 PU 學習進行 AI 文本檢測器訓練。
實驗結果
如上表所示,作者先在較短的 AI 生成語料數據集 Tweep-Fake 上檢驗 MPU loss 的效果。該數據集中的語料均為推特上較為短小的語段。作者又在傳統的語言模型微調基礎上將傳統二分類 loss 替換為含有 MPU loss 的優化目標。改進之后的語言模型檢測器效果較為突出,超過了其它基線算法。作者又對 chatGPT 生成文本進行了檢測,經過傳統微調得到的語言模型檢測器在短句上表現較差;經過 MPU 方式在同等條件下訓練得到的檢測器在短句上表現良好,且同時能夠在完整語料上取得可觀的效果提升,F1-score 提升了 1%,超越了 OpenAI 和 DetectGPT 等 SOTA 算法。如上表所示,作者在消融實驗中觀察了每個部分帶來的效果增益。MPU loss 加強了長、短語料的分類效果。作者還對比了傳統 PU 和 Multiscale PU(MPU)。由上表可見 MPU 效果更勝一籌,能更好地適配 AI 多尺度文本檢測的任務。總結
作者通過提出基于多尺度 PU 學習的方案,解決了文本檢測器對于短句識別的難題,隨著未來 AIGC 生成模型的泛濫,對于這類內容的檢測將會越來越重要。這項研究在 AI 文本檢測的問題上邁出了堅實的一步,希望未來會有更多類似的研究,把 AIGC 內容進行更好的管控,防止 AI 生成內容的濫用。
THE END
轉載請聯系本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com
責任編輯:hnmd003
相關閱讀
-
今日快看!識別「ChatGPT 造假」,效果超越 OpenAI:北大、華為的 AI 生成檢測器來了
機器之心專欄機器之心編輯部AI造假的成功率很高,前幾天「10分鐘騙430萬」還上了熱搜。在最熱門的大語言模
2023-06-02 -
GPT-4 變笨引爆輿論!文本代碼質量都下降,OpenAI 剛剛回應了降本減料質疑
大模型天花板GPT-4,它是不是……變笨了?先是少數用戶提出質疑,隨后大量網友表示自己也注意到了,還貼...
2023-06-02 -
富士通發布 AI 平臺 FujitsuKozuchi|當前動態
品玩6月2日訊,富士通發布AI平臺FujitsuKozuchi,將面向全球企業用戶提供一系列AI(人工智能)與ML(機器學
2023-06-02
相關閱讀
-
今日快看!識別「ChatGPT 造假」,效果超越 OpenAI:北大、華為的 AI 生成檢測器來了
機器之心專欄機器之心編輯部AI造假的成功率很高,前幾天「10分鐘騙430萬」還上了熱搜。在最熱門的大語言模
-
每日視訊:B站一季度凈虧損同比收窄72% CEO回應“UP主停更潮”
B站重申了對2023年全年收入展望,預計在240億元至260億元人民幣之間。
-
2023 谷歌研究學者計劃名單公布:清華姚班、北大等多位校友在列
機器之心報道編輯:陳萍、小舟2023年谷歌研究學者計劃共涉及16個領域,多位華人學者獲獎。2023年谷歌研究學
-
對話榮耀趙明:根據需求定制自研芯片戰略,對大模型將“慎之又慎” 聚焦
如果你也喜歡不客觀實驗室,希望和我們一起探討數碼相關的選題,請私信不客觀,我們將回復您加群的方式,期
-
GPT-4 變笨引爆輿論!文本代碼質量都下降,OpenAI 剛剛回應了降本減料質疑
大模型天花板GPT-4,它是不是……變笨了?先是少數用戶提出質疑,隨后大量網友表示自己也注意到了,還貼...
-
余額寶贖回轉入是什么意思?余額寶贖回到賬時間
余額寶贖回轉入是什么意思?余額寶贖回轉入的含義是我們之前通過余額寶購買了某項基金產品,而當我們賣出...
-
環球熱門:教育部和各省(區、市)開通2023年高考舉報電話
央視網消息:近日,教育部統一公布了教育部以及各省(區、市)2023年的高考舉報電話,歡迎廣大考生、家長及
-
意外險短期怎么樣?保費是多少?_當前快訊
意外險短期相對于其他形式的意外險,具有以下幾個優點:1、靈活性高:意外險短期通常可以根據被保險人的需
-
當前消息!太平共享盛世年金保險E款可靠嗎?有哪些保障?
可靠。太平共享盛世年金保險E款由太平壽險推出,是一款正規的商業年金險產品。太平壽險作為中國知名的保險
-
天天訊息:保險公司的年金險可以買嗎?有什么風險?
保險公司的年金險是一種可以幫助客戶規劃養老生活的保險產品。其基本原理是客戶在繳納一定費用后,保險公司
-
合眾穩盈長紅養老年金保險(A)款有什么優點?有什么缺點?_環球快看點
保證收益:合眾穩盈長紅養老年金保險(A)款具有固定保證利率,可以確保您在投資過程中獲得穩定的收益。彈性
-
增額增值壽險買哪個好?在哪買?
對于購買增額增值壽險這一問題,我們需要從以下幾個方面考慮。1 保障內容。由于增額增值壽險結合了投資理念
-
27億重金注資固態電池,上汽集團究竟為了啥?|熱文
27億重金注資固態電池,上汽集團究竟為了啥?整個5月,關于固態電池的消息不斷。包括上汽集團、馬車動力、
-
速遞!5月阿維塔11大定訂單2,366臺
5月阿維塔11大定訂單2,366臺2023年6月2日,阿維塔科技宣布,首款情感智能電動轎跑SUV阿維塔11,5月大定訂單
-
RCEP對15個簽署國全面生效
2023年6月2日,《區域全面經濟伙伴關系協定》(RCEP)對菲律賓正式生效,標志著RCEP對東盟10國和澳大利亞、
-
2023年暑期檔電影總票房突破1億元
據貓眼專業版數據,6月1日14時06分,2023年暑期檔電影總票房(含預售)突破1億元。《哆啦A夢:大雄與天空的
-
西門子醫療加碼光子計數CT-全球視訊
西門子醫療正在德國福希海姆(Forchheim)建造一家新工廠,用于生產半導體晶體材料,總投資額高達8000萬歐
-
富士通發布 AI 平臺 FujitsuKozuchi|當前動態
品玩6月2日訊,富士通發布AI平臺FujitsuKozuchi,將面向全球企業用戶提供一系列AI(人工智能)與ML(機器學
-
聯想郝常杰:以開放融合態度支持國產高性能計算生態發展-環球速訊
在建造高性能計算系統的時候,聯想一直秉承開放融合的態度,不僅支持傳統的X86架構,還完成了對飛騰、海光
-
小米汽車再換陣:前麥格納高管黃振宇接管供應鏈
文|李安琪編輯|楊軒李勤為確保明年一季度交付節點,老汽車人開始陸續擔綱小米汽車的核心崗位。近日,36氪
-
蘋果數據顯示 iOS 16 普及率超過 80% iPadOS 16 超過 70% 世界看熱訊
【TechWeb】6月2日消息,據外媒報道,按慣例,蘋果公司在下周的全球開發者大會上,將推出iPhone、iPad等各
-
當前消息!36 氪專訪華瑞指數云:SDS 進入 2.0 時代,漸進式迭代以 10 年為周期
整理|Ricky作者|王與桐軟件定義存儲(SDS),并不是個新概念,但是在創投圈子卻還是年輕的。該概念發展至今
-
蘋果零售鏈大動作:四年內亞太擬新開 15 家店 上海有望再開一家-觀焦點
財聯社6月2日訊(編輯黃君芝)據報道,蘋果公司(AppleInc )正在制定擴大和加強其零售連鎖店的計劃,旨在
-
嚴打“賣慘”虛假助農 抖音新規禁止公益類賬號變現 新消息
中新經緯6月2日電為促進公益行業更好發展,針對有賬號試圖以助農助困助殘為由編造不實場景、實施虛假公益等
-
天天熱頭條丨A 股三大股指集體高開 保險、貴金屬板塊領漲
中新經緯6月2日電2日,A股三大股指集體高開,上證指數漲0 24%,深證成指漲0 36%,創業板指漲0 33%。兩市超2
-
德意志銀行警告:歐美企業違約潮已迫在眉睫!-環球即時
財聯社6月2日訊(編輯馬蘭)德意志銀行本周發布了年度違約研究報告,報告指出,由于過去一年激進的加息政策
-
占便宜上癮!印度 5 月俄油采購量再創記錄|觀點
財聯社6月2日訊(編輯卞純)印度上個月搶購了創紀錄數量的俄羅斯石油,與此同時,自沙特的石油進口量降至28
-
《四部醫典》入選《世界記憶名錄》 全球信息
“2014年《四部醫典》開始申報第四批《中國檔案文獻遺產名錄》時,便已經為申報《世界記憶名錄》做準備...
-
失業保險申領成功后多久能領到?在哪里查詢?
找到當地就業局或人社部門,提交申請材料,提交申請材料后,相關部門會進行審核和認定,確認是否符合領取失
-
快看:4001234567是什么保險公司的電話?有什么作用?
經過查詢,這個電話號碼屬于中國人民保險公司的客服熱線電話。作為我國最大的保險公司之一,中國人民保險擁
精彩推薦
閱讀排行
精彩推送
- 螞蟻保險重大疾病理賠多少?理賠...
- 商業保險報銷多久到賬?怎么報銷?
- 百萬醫療怎樣賠付?需要哪些材料...
- 中歐基金經理桑磊:基金投資中,...
- 四年級解方程100道題帶過程及答...
- 賽力斯:5月新能源汽車銷量8562...
- 鋅錳電池是碳性還是堿性?鋅錳電...
- 無線傳輸是什么意思?無線傳輸速...
- 電機防爆等級怎么區分?電機防爆...
- 什么是風光互補?風光互補發電系...
- 人體有個“止咳開關”!沒事按一...
- 可編程是什么意思?可編程是怎么...
- 什么是NetBIOS協議?netbios應不...
- 杭州蕭山希爾頓花園酒店正式開業...
- 環球今亮點!增109.4% 比亞迪5...
- 國際首部《卵巢組織凍存移植技術...
- 微軟與初創公司 CoreWeave 簽...
- 出門問問港交所 IPO 欲沖“ A...
- 對話中關村科金張杰:通用大模型...
- 星環科技:AI 領域布局比較早 ...
- 解鎖第二人生,國內首個網紅“ ...
- MDI文件是什么?mdi文件用什么打開?
- 今日關注:快樂“六一” 與您“...
- 拉薩市實驗幼兒園開展親子文藝匯演
- 2023年首屆西藏自治區數字教育大...
- 快捷方式病毒有幾種?文件夾快捷...
- 隱藏文件是什么意思?win7怎么顯...
- 流氓軟件卸載了還有危險嗎?如何...
- 光電池是怎樣將光能轉換成電能的...
- 納指etf受匯率的影響嗎?納指etf...