首頁 > 新聞 > 智能 > 正文

奇跡涌現(xiàn),屬于 AI 的大時代意外降臨 焦點觀察

2023-04-15 13:13:07來源:ZAKER科技  

品玩實錄 | 北京網(wǎng)絡文化產(chǎn)業(yè)發(fā)展大會暨北京數(shù)字文化發(fā)展論壇

演講人 | 駱軼航


【資料圖】

演講主題 | 探索 ChatGPT 背后的產(chǎn)業(yè)邏輯

頭圖 | 源于 Midjourney 由品玩制作

我最近有時候我覺得很累,過去我很少出現(xiàn)信息過載的狀況,我認為我每天讀的東西基本都能給消化掉,但最近我經(jīng)常覺得信息過載,而所有的信息過載都是來自 ChatGPT。通過這樣的信息過載,但這個過程其實也是一個讓人既興奮又焦慮的這樣的一個過程。ChatGPT 的出現(xiàn)震驚了世界。尤其是最近兩個月,人機交互的機器人帶給大家的一個非常大的變化。

一個屬于人工智能的大時代突然就來了

首先,這是人工智能與人機交互基點臨近的以此突破。上次人工智能對大家的顛覆和影響,還是 2016 年的 AlphaGo。它在韓國擊敗了李世石,之后又打敗了柯潔。但之后幾年,關(guān)于人工智能到底能夠多么像人類、人工智能能夠替我們做什么之類的爭論就慢慢平息下來。因為像下圍棋這些事都不足以真正撼動我們作為一個人與機器在大部分場景之下的交互方式。

但是我們每個人都在說話,我們中很多人每天都在生成文字,甚至很多人賴以為生。所以我們看到 ChatGTP 和類似于 Midjourney 這樣的東西在過去幾個月展現(xiàn)出的能力。基于自然語義的人工智能的這種能力的涌現(xiàn)之后,人們會直觀感受到這種能力的驚艷。

這對于人的挑戰(zhàn)是非常深遠的,讓我們非常有壓迫感。我覺得這個其實是人類文明發(fā)展到今天,我們非常意想不到的這樣一個時刻就突然來了。

然后他是我們自然語言達模型的普及應用一個開端,以及神經(jīng)網(wǎng)絡處理 natural language processing(NLP)的一個最高的水準。

過去這么多年我們做過很多事情,然后很多公司都在搞各種各樣的大模型,包括 NLP 用于其他的很多領(lǐng)域,比如自動駕駛、客服機器人等。它們做了很多的事情,但從來沒有一個像 ChatGPT 這樣的東西。它其實是神經(jīng)網(wǎng)絡的處理的一個最高的水準,每一個獨立的個體都可以用,它是一個非常有意思的開端。

在 GPT 4 它發(fā)布之后,只同時配套發(fā)布了一篇論文。當時我覺得天哪,怎么回事?這樣一個成果難道就只值一篇論文嗎?還是你自己隱藏了很多東西?

后來一想的確到了這個階段,論文研究不是最重要的,工程是最重要的。

什么是工程?就是你用多少條的芯片、多少算力,多少臺服務器,用怎樣的這種基于約束的調(diào)優(yōu)和這種調(diào)參的模式,早期建模怎么去做?一次次的反復的嘗試,這種不斷去做調(diào)優(yōu)調(diào)參這樣的一個過程。

它是一個工程學的實踐,它不是靠我們做了多少基礎(chǔ)研發(fā)的突破,它是不斷的試出來,所以所以這個事特別有意思。就工程實踐這件事情,第一個靠錢,第二個靠意志力,第三個靠團隊,也就是靠人。

有人形容這個事像是煉丹,你喂的那些藥草就像語料,火爐的熔爐就是建模模型。加火的過程就是訓練指令集調(diào)參調(diào)優(yōu)的過程。這中間不斷嘗試的一個過程,非常的像煉丹。

我覺得寫 Prompt 這事像念咒,我不太會煉丹,但我現(xiàn)在正在學會去念咒。煉丹的過程,其實上是人工智能工程實現(xiàn)的一個奇跡。

這也是工業(yè)革命以來人類生產(chǎn)力最強大的一個效率革命。過去經(jīng)常說人類已經(jīng)經(jīng)歷了四次產(chǎn)業(yè)革命。第一次是蒸汽機,第二次是電力,第三次是計算機革命,第四次當前年代的智能革命。

但我認為 18 世紀末開啟的蒸汽機革命一直到 20 世紀中期開啟的信息革命是一個階段。而智能革命其實是一個新的階段。大語言模型的廣泛應用,讓人們意識到人們的經(jīng)驗、智力、智能在很多時候可能也是不夠用的,可能也是需要一個更強大的東西與人去配合去工作。

我們?nèi)ハ胄矢锩@個事情,它極大的提升了我們的效率,也能夠激發(fā)我們在創(chuàng)造力方面的能力。他會創(chuàng)造一些新的工作機會,或者讓人們?nèi)ブ匦碌卣J識自己的社會價值和商業(yè)價值。

最近我們公司要搞一個 prompt day 活動。讓所有人去分成兩個組,圖片組和文字組,可能會請幾個人命題,讓團隊來參與生成內(nèi)容。我們現(xiàn)在內(nèi)部有很多團隊都開始接觸 AI 內(nèi)容生成。比如視頻團隊,他們現(xiàn)在也開始用 Midjourney 畫畫了。然后要聞團隊也開始用這個東西寫一些微博的推廣文案,寫一些快速的要聞。商務團隊,市場團隊現(xiàn)在已經(jīng)在用它去寫一些文案,跟客戶進行溝通了。當然做深度報道和深度內(nèi)容的團隊,暫時這個東西還替代不了。

我們搞這個東西,不是要嚇唬大家,我們要讓大家知道這個事能夠提高多少效率,激發(fā)我們多干多少事情。能夠探索我們作為個體能提升多少生產(chǎn)力,我覺得這是非常有意義的事情。我認為她的確是重新定義職業(yè)腦力勞動和體力勞動之間的關(guān)系。

中國為什么需要自己的 ChatGPT 公司?

為什么中國需要自己的大語言模型產(chǎn)品。文心一言已經(jīng)發(fā)布了,阿里達摩院也帶來了通義千問,接下來幾周還會有很多類似的產(chǎn)品推出。中國為什么需要自己的 ChatGPT 公司,他們不做行不行?不做會不會死?

我覺得這個事情其實也是我近期思考比較多的東西。

首先我認為自然語言大模型的本質(zhì)是基于語言的文化話語權(quán)。大家都知道這個世界上尤其是互聯(lián)網(wǎng)上的主要內(nèi)容,90% 以上的內(nèi)容是英文內(nèi)容,中文內(nèi)容只占其中非常少一個比例。

這就意味著無論是 OpenAI 的 GPT 也好,谷歌的 Bard 也好,還是其他的大語言模型也好。都是基于英文以及自己特定預料語料構(gòu)建起來的一個模型。建模的過程既是選擇語料、調(diào)優(yōu)和調(diào)參的過程,也是他們在這個過程當中形成一個自然語言模型的價值觀的過程。

它是基于語言的文化話語權(quán),這也意味著基于英語語言的文化霸權(quán),有可能會通過人工智能和人機交互機器人的方式得到進一步的強化。

所以全球自然語義處理框架不僅需要中文語義基礎(chǔ)和中國語料,也需要中國價值體系與中國解決方案。

前不久其實我接受過一個調(diào)研,問我們怎么能夠把大語言模型做好。當時我說首先要在語料庫上下功夫,我們要訓練好的優(yōu)質(zhì)的高質(zhì)量的中文語料。

其次,我認為應該形成一個更互動的產(chǎn)學研結(jié)合的方式。公司有動力去做模型,而高校有研究人才和研發(fā)資源,然后政府有集中這樣的資源,為這個事情把握方向的這樣一個能力。

最后就是說我們要訓練好的中文語料,我們也要訓練英文語料,把英文語料通過我們的模型調(diào)優(yōu)調(diào)參訓練成輸出的方式,成為帶有我們的價值體系和解決方案的東西。

再一個,我認為大語言模型背后是芯片軟件和云計算構(gòu)成的系統(tǒng)。中國是世界上除了美國幾乎唯一有能力獨立開發(fā)的國家。當然要承認,我們算力可能不如人家,系統(tǒng)能力不如人家,投的錢不如人家多。

但從另外一個維度來看,這個世界上有沒有第三個國家的科研機構(gòu)、企業(yè)能夠跳出來講我們來做自己的大模型?沒有,是不喜歡嗎?其實就是因為這個東西不是所有的國家都有能力去做的。

芯片我們現(xiàn)在肯定是不是最強的,我們肯定是相對落后的,而且現(xiàn)在隨著一些這種不合理的制裁,就這個領(lǐng)域我們可能還要再繼續(xù)的落后下去一段時間。但是云計算這個領(lǐng)域中國的實力是擺在這里的,我們既然有能力去做,有能力哪怕是世界上的老二,我們就沒有理由不去做這件事情。

我認為自然語言大模型的圣杯之戰(zhàn)是中美科技實力競爭的一個重要的維度。我認為人文社會科學就是文化觀念的輸出,它的載體是語言,到最后本身就是語言的符號化和數(shù)學化,其實也是會讓它走向桂冠的這樣一個過程,這個東西其實我們現(xiàn)在形成的就是一種自然語言的這種模型的研究。這個也是基于前面這個點上非常重要的一個維度。

最后一個,是我們文化安全、數(shù)據(jù)安全、國家安全發(fā)展安全的重要保障。主要是所謂的安全發(fā)展。

自然語言大模型激發(fā)的數(shù)據(jù)再生產(chǎn)將創(chuàng)造前所未有的數(shù)據(jù)價值。我們中國過去這么多年積累下來的各個產(chǎn)業(yè)的垂直產(chǎn)業(yè)的數(shù)據(jù),沉浸在各個行業(yè)的公司服務器和數(shù)據(jù)中心。那么這些數(shù)據(jù)有的是死的數(shù)據(jù),但也有很多活的數(shù)據(jù),它是可以拿出來被再研究和被用來人機交互和人機溝通的數(shù)據(jù)。

其次就是就是基于垂直產(chǎn)業(yè)的人工智能的發(fā)展邏輯與通用人工智能的化學反應。我前不久寫過一篇文章,叫《是誰拖了中國 ChatGTP 的后腿》,我把責任主要扣到了中國的 VC 的身上。我為什么這么講?如果我們回到 2016 年那個時間節(jié)點,中國和美國在這種人工智能的基礎(chǔ)的一些東西上面其實水平差距沒有那么大的。但當時的一些做大語言模型的初創(chuàng)團隊基本都拿不到很多的投資。

這個文章出來之后很多投資人都表示反對,說這個東西是投多少錢都見不了底,但這些人現(xiàn)在也都去投這個東西。

我想講一個基本的邏輯,通過我們做煉丹的過程產(chǎn)生這種人機交互和對話生成的結(jié)果,其實是可以支持更多小模型和小場景發(fā)展垂直的人工智能產(chǎn)業(yè)發(fā)展模型。我們現(xiàn)在會用到很多的小模型,和機器人產(chǎn)生對話,但這些對話目前還是太小了。

但如果我們?nèi)ハ耄腔诖蟮哪P偷恼Z料分析、調(diào)參最后形成的人機交互的成果,它是不是有可能真的能夠幫你解決更具體、更切實,更能夠幫助你的一些問題。

國內(nèi)最近有兩個趨勢,第一個就是類似于像文心一言,包括像阿里達摩院這樣的機構(gòu),他們這樣的巨頭公司及其下屬機構(gòu)在推出自然語言大模型的測試。此外,他們也正在積極的在去做一些基于產(chǎn)業(yè)、基于垂直領(lǐng)域結(jié)合的一些東西。其他比如科大訊飛也好,京東也好,他們也在試圖基于打的一些平臺上的數(shù)據(jù)去做一些更大的模型,實現(xiàn)一些更具體的場景。

這點我們有自信,中國人在做原生產(chǎn)品上可能不是最強的,但是我們落到產(chǎn)業(yè)、落到場景上可能會產(chǎn)生一個更好的成果。

那么這個東西既然這么重要,它會反向激發(fā)中國在半導體、云計算操作系統(tǒng)等自主關(guān)鍵領(lǐng)域的創(chuàng)新。如果我們這種自然語言大模型起來了,其實它會反向的去激發(fā)很多在半導體領(lǐng)域,在云計算領(lǐng)域,在操作系統(tǒng)里的這種進化和升級,對我們基礎(chǔ)的這種架構(gòu)的數(shù)據(jù)相應是一個非常有意義的事情。

最后我特別想講的一個點,它將推動更廣泛意義上的數(shù)字平等,而不是更廣泛的不平等。大語言模型給了很多人機會,他比你學編程要容易,他給了很多的機會讓人們?nèi)?chuàng)造更好的東西。當所有人的當一個事情彌合了人們更多的知識差異和技能差異的時候,其他會推動更廣泛意義上的數(shù)字平等,而不是制造更不平等。

最后還想多說一句話的話,就是說還是想給中國的 LLM 領(lǐng)域和產(chǎn)業(yè)鼓一把勁,這個領(lǐng)域能夠誕生出很多的新的機會,如果我們把它當做是下一次工業(yè)革命去看待的話,它可能意味著更多的東西。

關(guān)鍵詞:

責任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

推薦閱讀