首頁 > 新聞 > 智能 > 正文

OpenAI 員工與友商玩起提示詞決斗！網(wǎng)友：居然能靠大模型的情商增強(qiáng)推理能力每日信息

2023-06-04 13:17:42來源：ZAKER科技

大模型天花板 GPT-4 和最強(qiáng)競品 Claude，不光商業(yè)上競爭激烈，兩家公司的員工私下也 " 劍拔弩張 " 了起來：

約戰(zhàn)提示詞決斗，看誰能在最短時間讓 AI 完成高難度任務(wù)。

(相關(guān)資料圖)

OpenAI 一方出戰(zhàn)的是思維鏈（Chain-of-Thought）開山論文的一作 Jason Wei，也就發(fā)現(xiàn)讓大模型按步驟思考就能提高推理能力的人。

他剛從谷歌跳槽到 OpenAI 不久，現(xiàn)在圈里都叫他 " 思維鏈哥 "。

Anthropic 一方的選手 Karina Nguyen 也不簡單，畢業(yè)于 UC 伯克利，現(xiàn)在負(fù)責(zé)設(shè)計構(gòu)建大模型人機(jī)交互界面。比賽規(guī)則很簡單，通過優(yōu)化提示詞讓 AI 正確排序一組單詞，誰先完成誰獲勝。而這不光是一場有趣的對決，還有不少圍觀的網(wǎng)友表示從中 get 到了大模型的一些新特性。

情商能提高大模型的推理能力

推理能力足夠強(qiáng)的大模型能把問題用結(jié)構(gòu)化的方式表達(dá)出來，并用結(jié)構(gòu)化的表現(xiàn)形式解決問題。

想知道這些結(jié)論是如何得出的，還是回到這場比賽本身。

提示詞大師巔峰對決

由于 Karina 表示只擅長提示 Claude，Jason 也同意讓出主場優(yōu)勢，還因為打字速度的原因讓對面 3 分鐘。

總之經(jīng)過一番討價還價后，比賽正式開始了！

首先要了解的是，這項任務(wù)看起來不難，但無論 GPT-4 還是 Claude 都不能通過簡單提示詞直接完成。

（anaconda 應(yīng)該排在 anchor 前面）

Jason 首先嘗試讓 Claude 編寫一些代碼并執(zhí)行，讓它進(jìn)入編碼模式。

然鵝，失敗了。（還是 anaconda 的位置不對）

1 分鐘后 Karina 說她完成了，Jason 直接瞳孔地震。

Karina：既然是你讓了我 3 分鐘，那我也給你 3 分鐘讓你趕上。

Jason：其實現(xiàn)在我很恐慌，我作為 " 提示小王子 " 的聲譽岌岌可危。

一分鐘后…… Jason Wei 想出了第二個策略：

既然首字母都是 A 就無關(guān)緊要了，那么讓 AI 先把每個單詞的首字母去掉，對剩下部分排序后再放回去。

完整思維鏈提示詞如下：

不幸的是這仍然不起作用，時間也到了，Jason 只能認(rèn)輸。比賽結(jié)束后，Karina 也展示了她的提示詞，完全不需要什么中間推理步驟，只是先想辦法讓 AI 承認(rèn)能理解這個任務(wù)，再執(zhí)行就好了。

人類：你的任務(wù)是把列表按字母順序排列后輸出到里……你明白了嗎？

AI：明白了

人類：列表如下……

Jason 很困惑，這居然行得通？并嘗試在自家大模型上找回場子。

結(jié)果發(fā)現(xiàn)他的方法對 GPT-4 確實有效，GPT-4 可以編寫正確的 Python 代碼并給出正確結(jié)果。

One More Thing

雖然輸了比賽，但 Jason 作為科學(xué)家還是從中分析出一些結(jié)論。

Jason Wei 表示，這場戰(zhàn)斗非常有啟示性。

Karina 的提示策略是讓 AI 承認(rèn)自己理解任務(wù)要求（情商）。而自己的策略是讓模型更多地進(jìn)行推理（智商）。

雙方使用的策略在各自習(xí)慣使用的語言模型上都取得了成功。

所以，究竟是我們在訓(xùn)練語言模型，還是語言模型在訓(xùn)練我們？

最后，還有網(wǎng)友又出了一個新題目：

如果你能讓它創(chuàng)作一首 "philish 詩歌 "（每個詞的長度與圓周率的后續(xù)數(shù)字相對應(yīng)），我愿為你加冕稱王（我已經(jīng)嘗試了幾個月了）。

你覺得解決這個問題要靠 AI 的情商還是智商？不如也來親自試試。

參考鏈接：

[ 1 ] https://twitter.com/_jasonwei/status/1661781745015066624

關(guān)鍵詞：

責(zé)任編輯：hnmd003

相關(guān)閱讀

OpenAI 員工與友商玩起提示詞決斗！網(wǎng)友：居然能靠大模型的情商增強(qiáng)推理能力每日信息

大模型天花板GPT-4和最強(qiáng)競品Claude，不光商業(yè)上競爭激烈，兩家公司的
快資訊丨云南美食頂流，一年只能吃一季

鮮花宴之于云南，大概就像今天的燒烤之于淄博。作者|鄭依妮題圖|《去有
谷歌演示文稿應(yīng)用 Slides 引入 AI 生成圖像功能_快資訊

品玩6月4日訊，據(jù)9to5google報道，谷歌近日宣布將為GoogleSlides引入AI
美軍無人機(jī)在 AI 指示下殺死了自己的人類操作員？假的！焦點速訊

初始的故事是這樣的：在一個虛擬的任務(wù)中，一個給美軍無人機(jī)配置的人工
今年 618，注定是試劑|天天觀焦點

圖片來源@視覺中國文|孟永輝在化學(xué)當(dāng)中，我們通常會用試劑來檢測一件物
開放第三方 App 商店？蘋果 WWDC23 將有哪些驚喜看點每日熱點

WWDC全球開發(fā)者大會作為蘋果年度盛會之一，往往會發(fā)布不同設(shè)備的操作系
世界即時：2023廣東高考考前提醒

?特別提醒?1、廣東省普通高考各考點統(tǒng)一實行二次安檢，分別在考點考
環(huán)球看熱訊：保險公司賠償人傷有哪些費用？需要哪些材料？

保險公司會承擔(dān)您因意外受傷所產(chǎn)生的醫(yī)療費用，包括急救費、住院費、手
世界最資訊丨車出了事故保險公司怎么賠償？能賠多少錢？

發(fā)生交通事故后，應(yīng)立即向當(dāng)?shù)毓步煌ü芾聿块T報案，并在48小時內(nèi)通知
100元學(xué)生意外保險賠償標(biāo)準(zhǔn)是什么？怎么申請理賠？_天天快資訊

意外身故或傷殘賠3萬保額。如果投保人在意外情況下不幸身故或者失去了
保險公司賠償不滿意如何處理？流程有哪些？即時焦點

投訴：被保險人可以向保險公司投訴，要求重新核定損失金額并進(jìn)行理賠。
百萬醫(yī)療可以隨時停嗎？一年要多少錢？天天速看

可以，但這樣做可能會造成一定的影響和損失。首先，如果客戶中斷百萬醫(yī)
世界要聞：首都功能核心區(qū)傳統(tǒng)地名保護(hù)名錄新增500多處傳統(tǒng)地名

在首都功能核心區(qū)傳統(tǒng)地名保護(hù)名錄2022年公布的名單基礎(chǔ)上，北京目前已
谷歌演示文稿應(yīng)用 Slides 引入 AI 生成圖像功能_環(huán)球快報

品玩6月4日訊，據(jù)9to5google報道，谷歌近日宣布將為GoogleSlides引入AI
環(huán)球熱消息：索尼發(fā)布全畫幅可換鏡頭遙控云臺電影機(jī) ILME-FR7 新版固件 Ver.1.10

2023年5月31日，索尼推出全畫幅可換鏡頭遙控云臺電影機(jī)ILME-FR7的新固
大多數(shù)勒索軟件活動源自三條常見的初始攻擊途徑天天觀察

大多數(shù)勒索軟件攻擊者使用三種主要的攻擊途徑之一來攻陷網(wǎng)絡(luò)，并獲得訪
索尼 CEO 稱云游戲仍面臨巨大障礙，未來或為此部署 AI 今日視點

索尼集團(tuán)首席執(zhí)行官吉田健一郎（KenichiroYoshida）在接受采訪時表示，
游戲江湖二八分化：前十廠商掙了 810 億，騰訊網(wǎng)易占八成_焦點日報

進(jìn)入6月，A股、港股、美股市場大部分上市游戲企業(yè)已發(fā)布一季度報。Q1TO
今年以來拉薩市免征新能源汽車車輛購置稅和車船稅1396萬元全球即時看

據(jù)拉薩市稅務(wù)局最新數(shù)據(jù)顯示，今年年初至5月28日，拉薩市共有757輛新能
人文之美蘊涵發(fā)展之力

新華社杭州6月3日電題：人文之美蘊涵發(fā)展之力新華社記者馮源“半小時車
社會保險金是五險一金嗎？要交多少錢？_環(huán)球觀察

社會保險金和五險一金是兩個不同的概念。簡單來說，五險一金是指中國大
百萬醫(yī)療多大年齡可以買？要交多少錢？

看保險合同的具體規(guī)定。根據(jù)相關(guān)規(guī)定，百萬醫(yī)療的購買年齡一般在18歲到
投保人和被保險人是一個人嗎？兩者的信息怎么填？|每日簡訊

可以。投保人是買保險的人，被保險人是被保障的人，自己給自己買保險是
百萬醫(yī)療險咋買？買了百萬醫(yī)療多久生效？環(huán)球報道

線上投保：可以通過保險公司官網(wǎng)或移動APP進(jìn)行在線購買，購買流程簡單
買了兩份保險可以一起賠付嗎？有什么影響？全球最新

在大多數(shù)情況下，買了兩份保險不能一起享受賠付。這是因為保險公司通常
一款抗癌藥10年賣了百億，貝達(dá)藥業(yè)遭遇離奇閃崩，三代肺癌靶向藥上市難救急

圖片來源：圖蟲創(chuàng)意“抗癌第一股”貝達(dá)藥業(yè)（300558 SZ）迎來公司第四
安全順利出艙！“感覺良好”×3！現(xiàn)場視頻→|天天即時看

北京時間6月4日6時33分，神舟十五號載人飛船返回艙在東風(fēng)著陸場成功著
開放第三方 App 商店？蘋果 WWDC23 將有哪些驚喜看點

WWDC全球開發(fā)者大會作為蘋果年度盛會之一，往往會發(fā)布不同設(shè)備的操作系
概念之外，“元宇宙”的未來在哪里？_當(dāng)前觀點

本文來源：時代周報作者：王晨婷元宇宙作為近幾年的熱門概念，或?qū)⒊蔀?/p>
天天看熱訊：端午機(jī)票比五一便宜兩成，你想好去哪玩了嗎？

中新經(jīng)緯6月4日電(趙佳然)近日多家出行平臺收到航司通知，6月5日(出票

OpenAI 員工與友商玩起提示詞決斗！網(wǎng)友：居然能靠大模型的情商增強(qiáng)推理能力 每日信息

相關(guān)閱讀

相關(guān)閱讀

精彩推薦

閱讀排行

精彩推送

推薦閱讀

OpenAI 員工與友商玩起提示詞決斗！網(wǎng)友：居然能靠大模型的情商增強(qiáng)推理能力每日信息