今日聚焦!對(duì)話 Zilliz 星爵 :向量數(shù)據(jù)庫(kù)是大模型的「記憶體」
大模型在以「日更」進(jìn)展的同時(shí),不知不覺也帶來一股焦慮情緒:估值 130 億美元的 AI 寫作工具 Grammarly 在 ChatGPT 發(fā)布后網(wǎng)站用戶直線下降;AI 聊天機(jī)器人獨(dú)角獸公司 Character.AI 的自建大模型在 ChatGPT 進(jìn)步之下,被質(zhì)疑能否形成足夠的競(jìng)爭(zhēng)壁壘 ......
ChatGPT Plugins 插件發(fā)布之后,更多創(chuàng)業(yè)者開始擔(dān)憂大模型的技術(shù)進(jìn)步會(huì)把自己卷入「打擊射程」,瞬時(shí)抹掉自己所在領(lǐng)域的技術(shù)積累和優(yōu)勢(shì)。
我們好像陷入了大模型所帶來的「WTF 綜合癥」——在過山車般的技術(shù)加速度中,人們會(huì)在「what the fuck」的驚訝和「what"s the future」的思索之間,反復(fù)橫跳。
(資料圖)
冷靜下來思考,在底層大模型的國(guó)產(chǎn)化浪潮以及應(yīng)用層的紅紅火火之外,大模型領(lǐng)域還有什么是值得被關(guān)注的?
向量數(shù)據(jù)庫(kù)(Vector database)在我們與行業(yè)人士的各種交流中屢被提及。它被看做 AI Infra 中的關(guān)鍵一環(huán),這種專門用于存儲(chǔ)、索引和查詢嵌入向量的數(shù)據(jù)庫(kù)系統(tǒng),可以讓大模型更高效率的存儲(chǔ)和讀取知識(shí)庫(kù),并且以更低的成本進(jìn)行 finetune(模型微調(diào)),還將進(jìn)一步在 AI Native 應(yīng)用的演進(jìn)中扮演重要作用。
向量數(shù)據(jù)庫(kù)之于大模型的價(jià)值和意義究竟是什么?它會(huì)不會(huì)被大模型本身的進(jìn)步吞掉?
圍繞著大模型的軟件開發(fā)范式將會(huì)被如何構(gòu)建?向量數(shù)據(jù)庫(kù)能發(fā)揮的作用是什么?
帶著這些問題,極客公園找到了 Zilliz 創(chuàng)始人 & CEO 星爵進(jìn)行交流。Zilliz 成立于中國(guó)上海,總部在美國(guó)硅谷,于 2019 年開源了全球首個(gè)向量數(shù)據(jù)庫(kù)產(chǎn)品 Milvus,它在 GitHub 上獲得了超過 1.8 萬顆 Star,在全球擁有超過 1000 家企業(yè)用戶,成為目前全球最流行的開源向量數(shù)據(jù)庫(kù)。而早在 2022 年,Zilliz 就完成了累計(jì)超過 1.03 億美金的 B 輪融資,估值達(dá)到驚人的 6 億美金。
圖|Zilliz 在 SIGMOD ’ 21 發(fā)表的論文,Milvus 是全球真正意義的第一款向量數(shù)據(jù)庫(kù)產(chǎn)品在大模型熱潮之前,整個(gè)向量數(shù)據(jù)庫(kù)市場(chǎng)一年只有幾億美元。直到去年 ChatGPT 推出,如 killer app(殺手級(jí)應(yīng)用)一般拉高了市場(chǎng)天花板,也讓大模型和向量數(shù)據(jù)庫(kù)開始真正出圈。
在今年 3 月的 NVIDIA GTC 大會(huì),黃仁勛首次提及向量數(shù)據(jù)庫(kù),并強(qiáng)調(diào)對(duì)于構(gòu)建專有大型語言模型的組織而言,向量數(shù)據(jù)庫(kù)至關(guān)重要,而 Zilliz 也被官宣是 NVIDIA 的向量存儲(chǔ)的官方合作伙伴。緊接著,OpenAI ChatGPT plugins 發(fā)布的官方文章中,Milvus 和 Zilliz Cloud 同時(shí)作為首批插件合作伙伴被提及,成為唯一一家開源項(xiàng)目與商業(yè)化云產(chǎn)品同時(shí)入選的向量數(shù)據(jù)庫(kù)公司。而在近一個(gè)月之內(nèi),向量數(shù)據(jù)庫(kù)迎來了融資潮,Qdrant 、Chroma 和 Weaviate 紛紛獲得融資;而 Pinecone 也正式官宣了新的 1 億美金 B 輪融資,估值達(dá)到了 7.5 億美元 ......
圖| Zilliz 創(chuàng)始人 & CEO 星爵從 3 月 到 5 月,我們與星爵一起見證了向量數(shù)據(jù)庫(kù)從默默無聞到成為行業(yè)大熱的完整過程,并和他陸續(xù)探討了大模型的演化、向量數(shù)據(jù)庫(kù)的價(jià)值和意義,以及 AI Native 應(yīng)用演進(jìn)等一系列問題。
以下是對(duì)話精選,由極客公園整理:
01 大模型和小模型的混合時(shí)代
極客公園:在你看來大模型是什么?
星爵:大模型是一個(gè)智能處理器,是一個(gè)大腦。傳統(tǒng)處理器是人工去編排電路,而大模型是用神經(jīng)網(wǎng)絡(luò)去編排電路。
大模型未來發(fā)展會(huì)更加強(qiáng)大,一方面會(huì)有中央處理的大模型,像 ChatGPT 的云端大腦,后面有數(shù)萬塊 GPU,它會(huì)奔著更大規(guī)模、更強(qiáng)能力的方向發(fā)展,但它的缺點(diǎn)也很明顯,能耗和成本也比較高;另外一個(gè)維度,它會(huì)往更高的效率、更低的能耗比方向走,會(huì)有小模型出來,像 Dolly 模型(注:Databricks 發(fā)布的擁有 120 億參數(shù),類 ChatGPT 開源模型),每個(gè)人手提一個(gè)「大腦」。
極客公園:這個(gè)結(jié)論是怎么得出來的?
星爵:我是站在人類的科技發(fā)展史去看的,而不是大模型本身。
大模型本質(zhì)是開啟了人類智能計(jì)算的一個(gè)時(shí)代,但是計(jì)算能力一定會(huì)分化的,不可能說只有一個(gè)。
人類的計(jì)算最終都是從大分化成小的,「大」不見得是一個(gè)適合所有產(chǎn)品的需求。計(jì)算機(jī)最開始是主機(jī)時(shí)代,是在大機(jī)房里面的大型機(jī),而現(xiàn)在 ChatGPT 本質(zhì)也是如此。對(duì)于這種計(jì)算方式來說,缺點(diǎn)明顯,響應(yīng)很慢,吞吐率也不高。
出現(xiàn)小型化的趨勢(shì)是因?yàn)楣δ艿男枨笤诜只绻阋k公,你買一個(gè)上網(wǎng)的筆記本電腦就可以了,不需要一個(gè)超級(jí)計(jì)算機(jī)。
極客公園:會(huì)像主機(jī)到微機(jī)的時(shí)代演變,有清晰的階段劃分嗎?還是說會(huì)是一個(gè)大模型和小模型混合的時(shí)代?
星爵:從大模型到小模型的大量涌現(xiàn),這個(gè)演進(jìn)其實(shí)就花了 6 個(gè)月,人類文明的進(jìn)化已經(jīng)變得更快了?,F(xiàn)在如果你想跑一個(gè)微軟出的 Deep Speed Chat 這種小模型,在筆記本上就行。
你可以認(rèn)為小模型就相當(dāng)于現(xiàn)在的 PC,大模型是現(xiàn)在的超級(jí)計(jì)算機(jī)。
我覺得大模型和小模型兩者會(huì)并存下去。需求分化的本質(zhì)背后,并不是一個(gè)技術(shù)問題,而是資源如何最優(yōu)化配置的問題。如果說集中式的管理是最優(yōu)的話,那么一定會(huì)做集中式的。
極客公園:大模型和向量數(shù)據(jù)庫(kù)是什么關(guān)系?大多數(shù)向量數(shù)據(jù)庫(kù)公司其實(shí)在大模型熱潮出現(xiàn)前就有了,比較好奇大模型給向量數(shù)據(jù)庫(kù)帶來了什么?
星爵:在我看來,大模型是新一代的 AI 處理器,提供的是數(shù)據(jù)處理能力;那么向量數(shù)據(jù)庫(kù)提供就是 memory,是它的存儲(chǔ)。
向量數(shù)據(jù)庫(kù)之前應(yīng)用比較分散,ChatGPT 的出現(xiàn),讓向量數(shù)據(jù)庫(kù)迎來了 killer app 時(shí)刻,一下子把行業(yè)的天花板拉高了幾個(gè)數(shù)量級(jí),把向量數(shù)據(jù)庫(kù)面向的開發(fā)者從幾萬提升到全球幾千萬。就像過去做移動(dòng)開發(fā)和應(yīng)用開發(fā),可能大家都會(huì)人手一個(gè) MongoDB 數(shù)據(jù)庫(kù),以后也會(huì)人手一個(gè)向量數(shù)據(jù)庫(kù)。
極客公園:目前大模型發(fā)展非常迅猛,會(huì)不會(huì)把向量數(shù)據(jù)庫(kù)提供的價(jià)值直接被吞到大模型的體系里?
星爵:不管是大模型還是小模型,它本質(zhì)上是對(duì)全世界的知識(shí)和運(yùn)行規(guī)則的一個(gè)編碼,是對(duì)我們?nèi)祟愃袛?shù)據(jù)的一個(gè)壓縮。
但很難真的把所有數(shù)據(jù)放到大模型里面。比如有一種觀點(diǎn),ChatGPT 是一個(gè)相當(dāng)高效的壓縮編碼方式,但它并不是無損壓縮,并不能擁有所有知識(shí),這個(gè)過程必然帶來熵減和信息損失。如果把所有信息都編碼到神經(jīng)網(wǎng)絡(luò)里面去,那么神經(jīng)網(wǎng)絡(luò)就會(huì)變得特別臃腫,參數(shù)規(guī)模會(huì)巨大無比,從而導(dǎo)致運(yùn)行緩慢。所以不能全放進(jìn)去,這意味著它可能需要外部的存儲(chǔ)。
在計(jì)算機(jī)結(jié)構(gòu)中也有類似的情況:CPU 里會(huì)有一個(gè)片上存儲(chǔ) SRAM,一般會(huì)做得比較小,因?yàn)槠洗鎯?chǔ)的價(jià)格比內(nèi)存 DRAM 要貴 100 倍,比磁盤要貴 1 萬倍。神經(jīng)網(wǎng)絡(luò)就是大模型的片上存儲(chǔ),更大規(guī)模的模型擁有更多的片上存儲(chǔ)。但是用神經(jīng)網(wǎng)絡(luò)來存儲(chǔ)數(shù)據(jù)是相當(dāng)昂貴的,會(huì)導(dǎo)致網(wǎng)絡(luò)規(guī)模的急劇增大,所以大模型也需要一種更高效的數(shù)據(jù)存儲(chǔ)方式,這就是神經(jīng)網(wǎng)絡(luò)外的片外存儲(chǔ),向量數(shù)據(jù)庫(kù)就是它的片外存儲(chǔ)。如果運(yùn)行時(shí)發(fā)現(xiàn)有信息不知道,就到向量數(shù)據(jù)庫(kù)里面來取。而向量數(shù)據(jù)庫(kù)的存儲(chǔ)成本比存到神經(jīng)網(wǎng)絡(luò)的成本要低 2 到 4 個(gè)數(shù)量級(jí)。
極客公園:你拿硬件做了類比,但是我們也可以看到有芯片公司是在做存算一體的架構(gòu),存儲(chǔ)和計(jì)算放在一起。
星爵:本質(zhì)上每一種計(jì)算都需要存儲(chǔ),計(jì)算和存儲(chǔ)是兩個(gè)最基本的抽象,但它們是可以相互轉(zhuǎn)化的,可以用存儲(chǔ)換計(jì)算,也可以用計(jì)算換存儲(chǔ)。在達(dá)到一個(gè)更好地投入產(chǎn)出比的過程中,需要有一個(gè)平衡。
人類的第一個(gè)計(jì)算機(jī)就是存算一體的,后來為什么要分開?因?yàn)樾屎统杀?。為什么說大模型不能夠完全取代向量數(shù)據(jù)庫(kù),這是因?yàn)橄蛄繑?shù)據(jù)庫(kù)的存儲(chǔ)成本比大模型要低一個(gè) 1 千倍到 1 萬倍,就看你要不要這么做而已。歷史上,存儲(chǔ)永遠(yuǎn)比計(jì)算便宜,計(jì)算也在降價(jià),但你發(fā)現(xiàn)存儲(chǔ)一直更便宜。
極客公園:但這個(gè)邏輯其實(shí)是硬件的邏輯,軟件也會(huì)如此嗎?
星爵:軟件和硬件是相輔相成,互為支撐的。軟件里為什么要把中間計(jì)算過程保存下來,不重算一次?為什么要做緩存,要保存中間結(jié)果?因?yàn)楸4媸菫榱松偎?,少算的原因是用空間換時(shí)間,用存儲(chǔ)換計(jì)算資源,這在軟件里面是最經(jīng)典的一種設(shè)計(jì)模式。之所以軟件這么設(shè)計(jì),也是硬件特性所決定的:存儲(chǔ)比計(jì)算要更便宜。
02 重新理解向量數(shù)據(jù)庫(kù)的價(jià)值
極客公園:最近有個(gè)玩笑說,上一波投 AIGC 的 VC 公司基本上都后悔了,意思是在大模型之下很多應(yīng)用層公司的壁壘都被抹掉了。私域數(shù)據(jù)會(huì)不會(huì)是構(gòu)成競(jìng)爭(zhēng)力的核心,向量數(shù)據(jù)庫(kù)是不是可以在這個(gè)方向起作用?
星爵:幫助用戶管理私域數(shù)據(jù),確實(shí)是目前向量數(shù)據(jù)庫(kù)提供的核心應(yīng)用場(chǎng)景。很多公司和個(gè)人不愿意讓大模型拿到自己的數(shù)據(jù)。
那么我們?cè)趺礃永孟蛄繑?shù)據(jù)庫(kù)和 OpenAI 這種大模型廠商交換數(shù)據(jù)呢?首先說一點(diǎn),大模型本身是可以將互聯(lián)網(wǎng)上的公域數(shù)據(jù)都爬到,對(duì)于私域數(shù)據(jù)可以用向量數(shù)據(jù)庫(kù)先做好編排,轉(zhuǎn)成向量數(shù)據(jù)庫(kù)里的向量。現(xiàn)在要從私域數(shù)據(jù)的知識(shí)庫(kù)里要找到問題的回答,可以利用向量數(shù)據(jù)庫(kù)的相似查找能力,精確定位到庫(kù)里的相關(guān)數(shù)據(jù),然后把這幾個(gè)信息編成一個(gè) prompt。
盡管 prompt 的容量理論上可以無限,但這樣效率太低,并且也難以實(shí)現(xiàn)。通過以上這樣的方式就可以很容易控制是 2000 個(gè) tokens,或者 8000 個(gè) tokens,把它傳給大模型給出一個(gè)答案。所以說,通過向量數(shù)據(jù)庫(kù)可以用私域數(shù)據(jù)和大模型做一個(gè)增強(qiáng)和互補(bǔ)。
極客公園:大模型不會(huì)把私有數(shù)據(jù)都拿走?
星爵:國(guó)外這一波 AI 起來之后還有一個(gè)特別好的點(diǎn),就是把隱私數(shù)據(jù)保護(hù)都搞清楚了。
為什么有那么多開發(fā)者敢用,那么多百億美金的公司愿把自己的服務(wù)接到 OpenAI 里面去,就是 OpenAI 已經(jīng)保證 prompt 只能作為 input(輸入),不能存、不能訓(xùn)練、不能學(xué)習(xí)。要不然我把數(shù)據(jù)都給你了,你學(xué)完以后把我踢掉怎么辦。國(guó)外已經(jīng)在公有數(shù)據(jù)和私有數(shù)據(jù)之間劃出了一個(gè)很大邊界。我相信中國(guó)最后也會(huì)立法,走到這一步的。
極客公園:向量數(shù)據(jù)庫(kù)在大模型中還有什么應(yīng)用?
星爵:短期還有一種應(yīng)用方式,用向量數(shù)據(jù)庫(kù)給大模型更新數(shù)據(jù)。
其實(shí)這也是個(gè)成本的考慮,模型的 finetune(微調(diào))更新的成本,是遠(yuǎn)大于使用向量數(shù)據(jù)庫(kù)數(shù)據(jù)做存儲(chǔ)。
不管是大模型還是小模型的 finetune 都比較慢。除非你做一個(gè)超級(jí)無敵計(jì)算機(jī),實(shí)時(shí)獲取新數(shù)據(jù),也實(shí)時(shí)更新模型,但沒必要。像 ChatGPT 訓(xùn)練所用的數(shù)據(jù)是截止到 2021 年 9 月,后面的事情它就不知道了,會(huì)給出錯(cuò)誤答案。所以通過用向量數(shù)據(jù)庫(kù)給大模型更新數(shù)據(jù),也是可以一定程度上解決大模型「胡言亂語」的問題。
極客公園:Zilliz 還推出了 GPTCache,要給 ChatGPT 做緩存層。這個(gè)怎么理解?
星爵:緩存也是個(gè)很好的應(yīng)用場(chǎng)景。我們認(rèn)為全球的 CDN 和緩存會(huì)有重做一次的機(jī)會(huì)。未來 AI 的公共場(chǎng)景中信息交換的方式會(huì)發(fā)生變化,會(huì)向更智能,更偏向語義這個(gè)方向轉(zhuǎn)變,并且消化的是更加非結(jié)構(gòu)化的數(shù)據(jù)。以前的 CDN 是基于精確條件的查詢,現(xiàn)在可以基于一些近似條件的查詢。未來需要一個(gè)更智能的一個(gè) CDN,更智能的一個(gè)緩存。
極客公園:最近很火的 AutoGPT 和向量數(shù)據(jù)庫(kù)也有關(guān)聯(lián),向量數(shù)據(jù)庫(kù)在其中扮演了什么角色?
星爵:向量數(shù)據(jù)庫(kù)是 AutoGPT 中最為核心的組件之一。我們的產(chǎn)品 Milvus 已經(jīng)接入到了 AutoGPT 中,這給我們帶來了很大的流量。你可以這樣理解,AutoGPT 等于 ChatGPT 加上向量數(shù)據(jù)庫(kù)。通過向量數(shù)據(jù)庫(kù)讓 AutoGPT 具備了長(zhǎng)期記憶能力,它知道之前搜的是什么,把歷史全部記進(jìn)去了,不然每次查詢是沒有上下文的。
極客公園:斯坦福大學(xué)和谷歌聯(lián)手發(fā)布的論文《Generative Agents: Interactive Simulacra of Human Behavior》也引起了行業(yè)強(qiáng)烈關(guān)注,實(shí)驗(yàn)構(gòu)建了一個(gè)虛擬小鎮(zhèn),小鎮(zhèn)有 25 個(gè)有「記憶」的虛擬人,他們可以結(jié)合自己的「人設(shè)」,在社交活動(dòng)中產(chǎn)生不同的決策和行為,這讓我們看到了現(xiàn)實(shí)版的《西部世界》構(gòu)建的可能性。這個(gè)實(shí)驗(yàn)里面非常重要的是虛擬人的記憶機(jī)制,向量數(shù)據(jù)庫(kù)能做嗎?
圖|虛擬小鎮(zhèn)星爵:能。AutoGPT 加一個(gè)人物的頭像,就可以打造一個(gè)最簡(jiǎn)單的智能 Avatar。以后各種智能體都要有個(gè)記憶,而記憶是向量數(shù)據(jù)庫(kù)來提供,這個(gè)想象空間蠻大的。那它可能是個(gè)什么機(jī)會(huì)呢?還真不好去定義,人類歷史上首次出現(xiàn)擁有獨(dú)立記憶體的虛擬人,這是一個(gè)歷史性的機(jī)會(huì),對(duì)向量數(shù)據(jù)庫(kù)的需求會(huì)有幾萬倍的增長(zhǎng)。
這本質(zhì)上還是使用向量數(shù)據(jù)庫(kù)作為大模型的 memory,應(yīng)用在了虛擬智能體這個(gè)場(chǎng)景。我覺得慢慢地大家在達(dá)成共識(shí),只要做大模型的應(yīng)用,就會(huì)用向量數(shù)據(jù)庫(kù)來做記憶體。
極客公園:大模型要想處理復(fù)雜任務(wù),首先要有記憶能力,然后基于記憶(上下文)做推理,而向量數(shù)據(jù)便是記憶體。那是只有向量數(shù)據(jù)庫(kù)就夠了,還是需要再加一些其他的?
星爵:基本就夠了。因?yàn)樗写竽P秃?AI 里面的數(shù)據(jù)交換都是用向量。這個(gè)本質(zhì)上是說片外跟片內(nèi)的存儲(chǔ)數(shù)據(jù)的交換格式是統(tǒng)一的。這也就是說為什么不能拿 Oracle 去做智能體的記憶;ChatGPT 也沒有選 MongoDB,也沒有選 Oracle,因?yàn)樗鼈兌际遣贿m合大模型的。
極客公園:是不是可以這樣理解,把大模型看成是一個(gè)基于自然語言編程的新型計(jì)算機(jī),向量數(shù)據(jù)是它最原生的數(shù)據(jù),向量數(shù)據(jù)庫(kù)是它最原生的數(shù)據(jù)庫(kù),這其實(shí)是一個(gè)完整的體系?
星爵:是的。神經(jīng)網(wǎng)絡(luò)的確是向量,因?yàn)樗械男畔鬏敹际窍蛄?,每一層的參?shù)也都是向量。所以能看成是個(gè)以向量(embedding)為基礎(chǔ)架構(gòu)的一套新的計(jì)算體系結(jié)構(gòu)。
這個(gè)體系結(jié)構(gòu)簡(jiǎn)單說來就是「CVP Stack」。其中「C」是 ChatGPT 這類大模型,負(fù)責(zé)向量的計(jì)算;「V」是向量數(shù)據(jù)庫(kù)(vector database),負(fù)責(zé)向量的存儲(chǔ);「P」是 Prompt Engineering,負(fù)責(zé)向量的交互。
03 AI Native 時(shí)代的應(yīng)用演進(jìn)
極客公園:對(duì)于 AI Native 時(shí)代的應(yīng)用開發(fā)來說,什么變得更重要了?什么不重要了?
星爵:在大模型開發(fā)時(shí)代,我率先提出了前面提到的「CVP Stack」概念,現(xiàn)在也逐漸被廣泛接受了。
這里要特別指出的是,我對(duì)于「P」的定義和理解會(huì)更加開放一些,不限于 prompt engineering。它本質(zhì)上是個(gè)創(chuàng)造的過程,而不是說簡(jiǎn)單的寫 prompt。「P」的核心是提問能力,或者說是找到需求、找到市場(chǎng)的一個(gè)能力,比如說你如何設(shè)計(jì)你的用戶流程,如何找到一個(gè)好的商業(yè)化落地的場(chǎng)景,這都是包含在「P」中。
對(duì)于現(xiàn)在的開發(fā)者來說,不管你是產(chǎn)品經(jīng)理還是前端工程師,用 ChatGPT 加上向量數(shù)據(jù)庫(kù),寫好 prompt,再用 LangChain 把項(xiàng)目串起來,基本用上一周就可以寫個(gè)應(yīng)用出來,這極大地降低了大模型應(yīng)用的開發(fā)成本。
極客公園:面向大模型時(shí)代,你對(duì) Zilliz 這家公司更準(zhǔn)確的定義是什么?
星爵:我們是一家 DB for AI 的公司,大概 3 年前,我們發(fā)了這個(gè)領(lǐng)域第一篇 SIGMOD 論文的時(shí)候,提出了這個(gè)概念,但它是一個(gè)學(xué)術(shù)界的講法。如果按照更好理解的方式,我們其實(shí)的是一個(gè) AI Native 的數(shù)據(jù)庫(kù)公司。
過去 10 年最大的機(jī)會(huì)是做 Cloud Native(云原生)的 Data Infra,產(chǎn)生了 Snowflake 這樣的巨頭;未來 10 年最大的機(jī)會(huì)是做 AI Native(AI 原生)的 Data Infra,像 Zilliz 這樣的向量數(shù)據(jù)庫(kù)公司將會(huì)迎來歷史性機(jī)遇。
極客公園:這一波大模型創(chuàng)業(yè),應(yīng)用層創(chuàng)業(yè)者被問得最多的是,怎么去建立自己的競(jìng)爭(zhēng)壁壘,而不被大模型本身的進(jìn)步「淹死」?你怎么看壁壘這個(gè)問題?
星爵:應(yīng)用層其實(shí)是有壁壘,技術(shù)壁壘變低了,那么其他的壁壘就變高了,我覺得創(chuàng)意和運(yùn)營(yíng)變得更重要了。
極客公園:與中國(guó)關(guān)注應(yīng)用層和大模型層不同,美國(guó)在 AI Infra 上迎來了開源的繁榮,AI Infra 的競(jìng)爭(zhēng)格局會(huì)是怎么樣?中國(guó)接下來在 AI Infra 上有什么值得期待的嗎?
星爵:Infra 是一個(gè)贏者通吃的市場(chǎng),像 Snowflake 在云原生數(shù)據(jù)庫(kù)領(lǐng)域就是一馬當(dāng)先。
我覺得中國(guó)在這一塊還沒開始,中國(guó)大模型比國(guó)外大概落后了半年。Infra 的話,我覺得中國(guó)可能還會(huì)落后半年到 1 年。我覺得 AI Infra 在接下來的半年里會(huì)有一個(gè)史無前例的快速發(fā)展。
04 爆火背后的堅(jiān)持和運(yùn)氣
極客公園:3 月的 NVIDIA GTC 大會(huì)上,黃仁勛強(qiáng)調(diào)向量數(shù)據(jù)庫(kù)對(duì)于大模型至關(guān)重要,還宣布了你們是 NVIDIA 的向量數(shù)據(jù)庫(kù)的合作伙伴。這中間發(fā)生了什么故事?
圖|NVIDIA GTC 大會(huì),黃仁勛首次提及向量數(shù)據(jù)庫(kù),并強(qiáng)調(diào)對(duì)于構(gòu)建專有大型語言模型的組織而言,向量數(shù)據(jù)庫(kù)至關(guān)重要星爵:我們?cè)趧?chuàng)業(yè)之初就堅(jiān)定地認(rèn)為 AI 時(shí)代的計(jì)算一定是異構(gòu)的,也一直在堅(jiān)持包括 GPU 加速在內(nèi)的異構(gòu)計(jì)算的技術(shù)路線。
NVIDIA 是在去年下半年看到整個(gè) AI 的發(fā)展趨勢(shì)中,向量數(shù)據(jù)的處理會(huì)越來越重要,非常希望更多的企業(yè)能夠把 GPU 加速用起來。他們?cè)谌蚍秶鷥?nèi)調(diào)研和接觸向量數(shù)據(jù)庫(kù)領(lǐng)域的公司和團(tuán)隊(duì),但也發(fā)現(xiàn)真正能夠在異構(gòu)計(jì)算上面有布局、有實(shí)力的只有我們一家。
NVIDIA 在深入地了解我們之后,也成為了我們 Milvus 開源社區(qū)里一個(gè)很重要的貢獻(xiàn)者。除了共同發(fā)布 GPU 加速向量數(shù)據(jù)庫(kù),NVIDIA 還派了幾名的工程師專門給 Milvus 貢獻(xiàn)代碼。
此外,NVIDIA 還有一個(gè)用 GPU 加速的開源推薦系統(tǒng)框架 Merlin,它把 Milvus 也做成 Merlin 中的一個(gè)關(guān)鍵部件,幫推薦系統(tǒng)去管理下面的數(shù)據(jù)?,F(xiàn)在 NVIDIA 不僅僅是我們的合作伙伴,同時(shí)也成為我們的一個(gè)大用戶。
極客公園:OpenAI 又是什么樣的故事?我看到在公布 ChatGPT plugins 發(fā)布的官方文章中,Milvus 和 Zilliz 是首批的合作伙伴,貢獻(xiàn)了向量數(shù)據(jù)庫(kù)插件。
圖|OpenAI 發(fā)布 ChatGPT plugins 的官方文章中,Zilliz 的產(chǎn)品被提及了兩次星爵:OpenAI 的話就更加簡(jiǎn)單了,一年前就已經(jīng)有一些合作了。他們和我們說要做一個(gè)平臺(tái),就是 ChatGPT plugins,看到我們的向量數(shù)據(jù)庫(kù)是全球最流行和最具開發(fā)者社區(qū)影響力的,因此希望加入。最開始我們的心態(tài)很平和,覺得是基礎(chǔ)的開源兼容合作。但 plugins 發(fā)布后,我們獲得了來自大模型領(lǐng)域開發(fā)者和 GPT 用戶群體的空前關(guān)注,這個(gè)是我始料未及的。
極客公園:既然向量數(shù)據(jù)庫(kù)這么重要,會(huì)不會(huì)擔(dān)心國(guó)內(nèi)別人再做一個(gè)向量數(shù)據(jù)庫(kù)?
星爵:說實(shí)話我們很歡迎,因?yàn)橄蛄繑?shù)據(jù)庫(kù)還處于發(fā)展的早期階段,還需要更多的市場(chǎng)教育。
極客公園:對(duì)于「為什么是你們」這個(gè)問題,你是怎么思考的?
星爵:我也想不到今年會(huì)有機(jī)會(huì)和大家都去談向量數(shù)據(jù)庫(kù)。之前我每年都跟別人講,向量數(shù)據(jù)庫(kù)是接下來特別牛逼的事情,但大部分人聽完之后說,有趣,你有這個(gè)想法和愿景,就好好干。
現(xiàn)在回頭看,沒有堅(jiān)定的愿景和長(zhǎng)期主義的堅(jiān)持,我們不可能走到現(xiàn)在。
當(dāng)然,一個(gè)成功的企業(yè)也需要有些好的運(yùn)氣。比如說,我們歷史上每次融資都能夠遇到一些擁有相同愿景、堅(jiān)持長(zhǎng)期主義的投資人。我們今年開始準(zhǔn)備做商業(yè)化,剛好遇到大模型的「iPhone 時(shí)刻」,一下子把我們推到了聚光燈下。之前有人會(huì)懷疑我們的商業(yè)化潛力,但現(xiàn)在有人和我說 Zilliz 想不掙錢都很難。
很多時(shí)候,你堅(jiān)持在做一些難的事情,但是很多時(shí)間點(diǎn)你沒有趕上,你可能會(huì)死。因?yàn)槠鋵?shí)很多優(yōu)秀的企業(yè)也是這么死掉的,盡管它的產(chǎn)品和技術(shù)很好,但它跟市場(chǎng)經(jīng)濟(jì)發(fā)展的趨勢(shì)不吻合,跟用戶需求爆發(fā)的時(shí)間點(diǎn)不吻合。
對(duì)于可以掌控的,那我們就拼命去做成功的必要條件;而有些是無法控制的,對(duì)我們來說的話,很感恩這種運(yùn)氣。
極客公園:所以你是怎么看自己的?是長(zhǎng)期主義的勝利者?
星爵:幸存者更恰當(dāng)一些。
極客公園:大模型給向量數(shù)據(jù)庫(kù)帶來的是什么程度的加速?
星爵:是指數(shù)級(jí)的增長(zhǎng),過去 6 個(gè)月開發(fā)者的增長(zhǎng)量大概能頂?shù)蒙衔覀冞^去三年的。
這是一個(gè)向量數(shù)據(jù)庫(kù)開始瘋狂增長(zhǎng)的時(shí)代,也是 AI-native 數(shù)據(jù)庫(kù)未來十年高速增長(zhǎng)的開端。
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
今日聚焦!對(duì)話 Zilliz 星爵 :向量數(shù)據(jù)庫(kù)是大模型的「記憶體」
大模型在以「日更」進(jìn)展的同時(shí),不知不覺也帶來一股焦慮情緒:估值130億美元的AI寫作工具Grammarly在ChatGP
2023-05-10 -
【新要聞】天舟六號(hào)貨運(yùn)飛船將于今日發(fā)射
品玩5月10日訊,據(jù)央視新聞報(bào)道,據(jù)中國(guó)載人航天工程辦公室消息,目前,長(zhǎng)征七號(hào)遙七運(yùn)載火箭已完成推進(jìn)劑
2023-05-10 -
無線自由,暢享高清音質(zhì)!韌能 T30 領(lǐng)夾麥克風(fēng)體驗(yàn)_焦點(diǎn)資訊
在這個(gè)人人自媒體的時(shí)代,直播拍視頻已經(jīng)不是什么新鮮事了,以后更會(huì)成為一種常態(tài)。無線領(lǐng)夾麥大概是每一個(gè)
2023-05-10 -
無形無界隱于廚柜 惠而浦 W9 全嵌入式冰箱評(píng)測(cè)-環(huán)球微頭條
近年來裝修流行家居一體化,嵌入式冰箱越來越受到消費(fèi)者的歡迎。作為惠而浦打造一體化廚居美學(xué)的明星產(chǎn)品W9
2023-05-10 -
長(zhǎng)安汽車:前 4 月長(zhǎng)安汽車銷量 78.98 萬輛,自主品牌新能源累計(jì)銷量同比增 102.08% 當(dāng)前觀察
品玩5月10日訊,長(zhǎng)安汽車5月10日公告,1-4月,長(zhǎng)安汽車銷量789788輛,同比增加2 94%;自主品牌銷量671940輛
2023-05-10 -
華為 P60 Pro 獲 DXOMARK 影像評(píng)分第一,海外發(fā)布驚艷全球用戶
5月9日,華為在德國(guó)慕尼黑舉辦海外發(fā)布會(huì),正式推出了備受期待的華為P60系列和華為MateX3手機(jī)等產(chǎn)品,尤其
2023-05-10
相關(guān)閱讀
-
今日聚焦!對(duì)話 Zilliz 星爵 :向量數(shù)據(jù)庫(kù)是大模型的「記憶體」
大模型在以「日更」進(jìn)展的同時(shí),不知不覺也帶來一股焦慮情緒:估值130億美元的AI寫作工具Grammarly在ChatGP
-
報(bào)道:正觀快評(píng):遭群毆還手又被認(rèn)定“互毆”,這次先別急著聲討
最近,又一起被認(rèn)定為“互毆”的處罰引發(fā)爭(zhēng)議。據(jù)上游新聞5月10日?qǐng)?bào)道,從事水果交易的周登建、周世淅父...
-
世界上第一家保險(xiǎn)公司是哪家?正規(guī)保險(xiǎn)公司要滿足哪些條件?
第1家保險(xiǎn)公司應(yīng)該是在1568年英國(guó)倫敦批準(zhǔn)設(shè)立的皇家交易所。各種類型的保險(xiǎn)公司源于海上運(yùn)輸。在過去,海
-
好醫(yī)保健康告知是什么?好醫(yī)保的優(yōu)點(diǎn)有哪些?
好醫(yī)保健康告知是好醫(yī)保的重要組成部分。在購(gòu)買好醫(yī)保時(shí),保險(xiǎn)公司會(huì)要求購(gòu)買者填寫健康告知表,以了解購(gòu)買
-
網(wǎng)上眾安百萬醫(yī)療保險(xiǎn)可靠嗎?購(gòu)買時(shí)應(yīng)該注意什么?|時(shí)訊
可靠。 網(wǎng)上眾安百萬醫(yī)療保險(xiǎn)由中國(guó)人壽保險(xiǎn)(集團(tuán))公司承保,同時(shí)采用螞蟻金服提供的互聯(lián)網(wǎng)科技支持。這
-
茅臺(tái)私募招投資經(jīng)理,30歲以上不要,網(wǎng)友懟:這個(gè)年紀(jì)懂投資?_視焦點(diǎn)訊
來源:圖蟲創(chuàng)意近日,茅臺(tái)(貴州)私募基金管理有限公司(下稱“茅臺(tái)私募基金”)發(fā)布了一則招聘公告,...
-
老年人意外保險(xiǎn)是什么??jī)?yōu)點(diǎn)有哪些?-當(dāng)前熱聞
老年人意外保險(xiǎn)是一種專門為老年人提供保險(xiǎn)保障的產(chǎn)品,針對(duì)老年人在發(fā)生意外事故時(shí)所遭受的人身?yè)p害或死亡
-
人壽保險(xiǎn)哪家好??jī)?yōu)點(diǎn)有哪些?
選擇一個(gè)有良好信譽(yù)和強(qiáng)大實(shí)力的保險(xiǎn)公司可以為您提供更穩(wěn)妥的保障。根據(jù)自身需求和風(fēng)險(xiǎn)承受能力,選擇適合
-
理想汽車第一季度營(yíng)收187.9億元、交付52584輛 均創(chuàng)歷史新高-環(huán)球報(bào)資訊
5月10日,理想汽車發(fā)布2023年第一季度財(cái)報(bào),季度營(yíng)收和交付量雙雙創(chuàng)下歷史新高。第一季度,實(shí)現(xiàn)營(yíng)收187 9億
-
新款柯米克、柯米克GT上市 滿足國(guó)六B排放標(biāo)準(zhǔn)_天天精選
新款柯米克、柯米克GT上市滿足國(guó)六B排放標(biāo)準(zhǔn)近日,斯柯達(dá)新款柯米克、柯米克GT上市,建議零售價(jià)11 19萬-11
-
源自鳳羽靈感璀璨閃耀 vivo Y78開啟預(yù)售享多重好禮
2023年5月10日,vivo Y系列新品vivo Y78開啟全網(wǎng)預(yù)售,擁有「鳳羽金」、「玉瓷青」、「皓夜黑」三款配...
-
世界微頭條丨博騰生物與泓迅科技達(dá)成戰(zhàn)略合作
近日,蘇州博騰生物制藥有限公司(簡(jiǎn)稱:博騰生物)與蘇州泓迅生物科技股份有限公司(簡(jiǎn)稱:泓迅科技)宣布
-
世界時(shí)訊:博納影業(yè):北京博納為博納娛樂提供9700萬元定期存單質(zhì)押擔(dān)保
北京博納為博納娛樂在北京銀行紅星支行辦理的1300萬美元流動(dòng)資金貸款,提供9700萬元人民幣的定期存單質(zhì)押擔(dān)
-
聚焦:“董明珠接班人”已離職
孟羽童此前還曾在社交平臺(tái)發(fā)文辟謠:“誰再說我離職了,我真的會(huì)揍人。”
-
每日熱議!從“網(wǎng)紅”到“長(zhǎng)青” 小小一碗螺螄粉是如何實(shí)現(xiàn)產(chǎn)業(yè)進(jìn)階的?
這碗粉,不光本地人愛吃,不少游客剛下火車,就拖著行李箱前來“嗦粉”。
-
天天快看點(diǎn)丨從中國(guó)產(chǎn)品到中國(guó)品牌 高端裝備制造領(lǐng)域都經(jīng)歷了哪些?
在“2022年全球品牌價(jià)值500強(qiáng)”榜單中,我國(guó)入圍企業(yè)84家,比2017年增加27家,裝備制造等領(lǐng)域涌現(xiàn)眾多全球
-
【新要聞】天舟六號(hào)貨運(yùn)飛船將于今日發(fā)射
品玩5月10日訊,據(jù)央視新聞報(bào)道,據(jù)中國(guó)載人航天工程辦公室消息,目前,長(zhǎng)征七號(hào)遙七運(yùn)載火箭已完成推進(jìn)劑
-
無線自由,暢享高清音質(zhì)!韌能 T30 領(lǐng)夾麥克風(fēng)體驗(yàn)_焦點(diǎn)資訊
在這個(gè)人人自媒體的時(shí)代,直播拍視頻已經(jīng)不是什么新鮮事了,以后更會(huì)成為一種常態(tài)。無線領(lǐng)夾麥大概是每一個(gè)
-
失去色情直播,斗魚還有什么?
文|略大參考,作者|楊知潮,編輯|原野對(duì)斗魚來說,搞黃色,被整治,再放開,再被整治,幾乎成為規(guī)律。而這
-
長(zhǎng)安汽車:4 月汽車總銷量約 18 萬輛,同比增加 57.23%_信息
每經(jīng)AI快訊,長(zhǎng)安汽車(SZ000625,收盤價(jià):12 68元)5月10日晚間發(fā)布公告稱,長(zhǎng)安汽車2023年4月汽車總銷量
-
焦點(diǎn)資訊:求購(gòu) Space X、Open AI 老股;轉(zhuǎn)讓持有 Neuralink、Shein 的基金份額
資情留言板是36氪推出的新欄目。資產(chǎn)交易市場(chǎng),信息瞬息萬變,消息真假難辨,即使買賣雙方花費(fèi)大量的時(shí)間、
-
怎樣選擇 HR 系統(tǒng),讓公司管理有效又規(guī)范?
本文來自微信公眾號(hào):蓋雅學(xué)苑(ID:thinkwithgaia),作者:郭雨琛,原文標(biāo)題:《HR系統(tǒng)選型成功的三個(gè)底
-
天天資訊:?華為帶不動(dòng)了,賽力斯另尋出路
圖片來源@視覺中國(guó)文|連線出行,作者|墨白,編輯|周雄飛賽力斯,正褪去高光。前兩天,蔚小理為代表的造車品
-
琳達(dá)·艾蒙_關(guān)于琳達(dá)·艾蒙介紹_熱聞
琳達(dá)·艾蒙,關(guān)于琳達(dá)·艾蒙介紹這個(gè)很多人還不知道,我們一起來看看!1、琳達(dá)·艾蒙,,1959年5月22日出...
-
環(huán)球速讀:半月談丨活動(dòng)搞了一籮筐,學(xué)生咋就不買賬? 就業(yè)服務(wù),容不得花拳繡腿
半月談丨活動(dòng)搞了一籮筐,學(xué)生咋就不買賬?就業(yè)服務(wù),容不得花拳繡腿---眼下正值就業(yè)季,各地高度重視高校
-
精彩看點(diǎn):全球第三、國(guó)內(nèi)第一,訊飛星火認(rèn)知大模型獲權(quán)威評(píng)測(cè)認(rèn)可
5月9日,中文通用大模型綜合性評(píng)測(cè)基準(zhǔn)SuperCLUE正式發(fā)布,GPT-4位列全球第一,國(guó)產(chǎn)大模型中訊飛科技研發(fā)的
-
天天視點(diǎn)!滴滴自動(dòng)駕駛與廣汽埃安戰(zhàn)略合作再升級(jí),2025年推出首款量產(chǎn)L4無人駕駛新能源車
近日,滴滴自動(dòng)駕駛公司與廣汽埃安新能源汽車股份有限公司簽訂深化合作協(xié)議,共同發(fā)布無人駕駛新能源量產(chǎn)車
-
退保怎么退?能退多少呢?|焦點(diǎn)速遞
盡量在保險(xiǎn)的猶豫期內(nèi)退保,因?yàn)樵诒kU(xiǎn)的猶豫期內(nèi)退保,我們是可以退還所有的費(fèi)用,保險(xiǎn)公司是沒有理由拒絕
-
【環(huán)球播資訊】張國(guó)立的眾安百萬保險(xiǎn)是真的嗎?要注意什么?
是。 張國(guó)立的眾安百萬保險(xiǎn)其實(shí)就是眾安保險(xiǎn)請(qǐng)大明星張國(guó)立作為代言人,對(duì)眾安保險(xiǎn)進(jìn)行宣傳的一種手段,也
-
保險(xiǎn)分紅型是什么意思?有什么區(qū)別?
保險(xiǎn)分紅型是指一類壽險(xiǎn)產(chǎn)品,它的特點(diǎn)是會(huì)將投保人的保費(fèi)投入到固定的基金中,并在一定時(shí)期內(nèi)按照一定比例
精彩推薦
- 全球短訊!玉珍拉姆:不服輸?shù)墓媚铮?..
- 每日觀點(diǎn):西藏林芝開展地震救援實(shí)戰(zhàn)化演練
- 西藏加查:“軟黃金”助牧民經(jīng)濟(jì)增收 ...
- 世界微速訊:西藏阿里:野生動(dòng)物悠閑覓食
- 世界資訊:西藏自治區(qū)市場(chǎng)監(jiān)管局“重拳...
- “鴻鵠”機(jī)器人在西藏首例手術(shù)成功_每日...
- 拉薩海關(guān)以“智”提“效”構(gòu)筑“免稅快...
- 環(huán)球速讀:新開拓就業(yè)崗位253.1萬個(gè) 各...
- 環(huán)球今熱點(diǎn):西藏雪堆白技工學(xué)校:傳承...
- 西藏加查的冬蟲夏草采挖季
閱讀排行
精彩推送
- 世界最新:平安保險(xiǎn)意外險(xiǎn)官網(wǎng)查...
- 【世界新要聞】保險(xiǎn)公司能查到體...
- 格力:孟羽童已離職,人員流動(dòng)很...
- 滴滴自動(dòng)駕駛與廣汽埃安戰(zhàn)略合作...
- 佳能官微發(fā)文恭喜黃旭熙退團(tuán),疑...
- 天天快資訊丨仰望U8申報(bào)信息:比...
- 長(zhǎng)安汽車4月自主品牌新能源銷量...
- 直接明牌,東風(fēng)日產(chǎn)全速進(jìn)攻 動(dòng)...
- 無人車來了!廣汽埃安與滴滴自動(dòng)...
- 東風(fēng)專利“可檢測(cè)泡水風(fēng)險(xiǎn)提升車...
- 合同的格式是怎么樣的呢?合同的...
- 商品房買賣合同解釋是什么?中華...
- 租房合同怎么寫?合同的內(nèi)容由當(dāng)...
- 合同到期不續(xù)簽有補(bǔ)償嗎?有哪些...
- 裝修合同注意事項(xiàng)都有什么呢?中...
- 合同到期不續(xù)簽賠償是怎么樣的?...
- 簽合同時(shí)的注意事項(xiàng)都有什么呢?...
- 民法典第四百七十條內(nèi)容是什么?...
- 買房合同注意事項(xiàng)都有什么呢?中...
- 簡(jiǎn)單的房屋租賃合同的寫法都有什...
- 合同法解釋三 格式條款的組成部...
- 合同法違約責(zé)任是怎么樣的呢?中...
- 上海電氣與中國(guó)通用技術(shù)會(huì)談?dòng)懻?..
- 精選!第二十次粵港澳防治傳染病...
- 天舟六號(hào)貨運(yùn)飛船將于10日21時(shí)22...
- 吉利旗下乘用車4月份銷量超11萬|...
- 劉若英梁靜茹都在鬧退票?不轉(zhuǎn)不...
- 專家:人工智能將在幾年內(nèi)取代八...
- 世界即時(shí)看!江蘇公司債排查之二...
- 無形無界隱于廚柜 惠而浦 W9 ...