首頁 > 新聞 > 智能 > 正文

大模型時代下,企業需要什么云?

2023-06-29 21:19:41來源:ZAKER科技  


(相關資料圖)

新一代數字基礎設施已來。

手工勞動 / 獸姐

手工編輯 / 角叔

出品 / 獨角獸挖掘機

開年來,隨著 ChatGPT 的狂飆,引發了一輪全球的大模型熱,各方資金蜂擁而入。

ChatGPT 能夠成為火爆全球的頂流模型,除了自身強大的創新能力,也離不開強大算力的支持,這背后是耗資數億美元,用了英偉達數萬顆 A100 的微軟超級計算機。

一個有意思的現象是,打造出 ChatGPT 的明星公司 OpenAI 依然處于燒錢賺吆喝的巨虧狀態,提供核心算力芯片的英偉達卻是賺得缽滿盤滿,今年來股價已經翻番,市值破萬億美元。

可以說,隨著大模型時代到來,給整個產業鏈都帶來了新的挑戰和機遇,甚至有人驚呼第四次科學技術革命到來了。

AI 大模型背后的海量數據,需要有強大的算力作為支持,這自然也推動了云計算的升級迭代。

某種程度上,大模型之爭說到底也是云服務能力之爭。在市場明顯過熱的情況下,行業也開始有一些更加理性的聲音傳出,不需要這么多大模型,真正能夠為產業所用才是正解。

如何解決算力成本高企后,大模型訓練本身帶來的高昂成本,讓很多企業想用而不敢用的問題?站在新的生產力時代的起點,從云入端,數字基建服務商應該怎么部署?

時代正在呼喚新一代數字基礎設施。尤其是大模型的爆發,對于算力基礎設施提出更高的要求,應盡可能地用更高效的異構基礎設施資源,來支持不同的算力需求。

01

大模型下的數字基礎設施

早在數年前,就有不少企業逐漸意識到數智化升級的重要意義,但隨著近年來數智轉型逐漸進入 " 深水區 ",企業對此的需求也發生了一些明顯變化。

這些變化集中體現在三個方面。

從轉型意識來看,此前企業推動自身的數字化改造,幾乎都是從局部切入,更多是為了適應社會發展的被動數字化;而時至今日,這種觀點已發生了翻天覆地的變化,由點及面,越來越多企業開始主動求變,從全局出發,希望借助數字化來提升增長韌性。

從業務部署來看,在資源管理方面,多數企業原來只需單純管理 IaaS,現在則需要對全棧資源做統一管理;在安全防護方面,他們更希望在做推進數字化建設的同時,根據業務場景制定一體化安全體系,保障業務安全穩定運營。

從 " 上云 " 模式來看,企業 " 上云 " 整體呈現 " 多態、多地、多芯、多棧 " 這四種形態,在云端 AI 進化到顯著的訓練推理、云桌面、圖形圖像設計等多元化場景階段時,云上異構成為最能發揮 AI 效率的計算方式,但這也給數字化建設提出了更為嚴峻的挑戰。

一方面要保證靈活性,在混合多云架構下,讓多種計算資源能夠進行良好的協作;另一方面,需要強調安全性,能夠廣泛支持各類芯片、云平臺及不同異構基建,提升中國企業的經營韌性。

這與京東云對新一代數字基礎設施的理解不謀而合,曹鵬認為,新一代數字基礎設施至少應該具備三個特征。

首先,是融合開放。從實際應用來看,一個數字基礎設施僅依靠單一架構,已很難支撐整個社會的運轉。市場需要更加融合、更加開放的基礎設施,這樣才能屏蔽很多客戶差異化的需求,把更多異構的硬件納入到設施管理中來,對不同行業、不同應用提供很好的兼容性。

數字基礎設施融合方法,要做到的就是三 " 多 " —— " 多云、多芯、多活 ",這個做到廣泛支持各類芯片架構,包括 GPU、CPU、NPU,包括兼容各類公有云和私有云平臺,這樣才能支持下一步的智能化和產業化的發展。

其次,是極致的技術降本。大模型和數字化對于基礎設施需求越來越大,技術密度、網絡帶寬和存儲需求,都呈幾何級增長,算力成本變成非常重要的因素,有能力把算力成本降得更低,這是作為一個好的基礎設施應該考慮的。

" 比如京東云新一代分布式存儲平臺云海,能夠做到千萬級的 IOPS,延遲達到百微秒以內,通過存算分離技術架構,節省成本超 30%。比如軟硬一體虛擬化引擎京剛,將算力虛擬化損耗降至零,作為數據中心級 DPU 引擎,將存儲 IOPS、網絡轉發性能均提升 50%。"

第三,是安全可靠。隨著智能化、信息化、數字化的推薦,信息安全也變得愈發重要。保證信息是安全、不被泄露,保證業務能夠高質量地、連續地發展,同樣值得重視。" 京東云在服務上可以做到 99.995%,在存儲上的可靠性可以做到 12 個 9,這都是全球頂尖的水平。"

02

統一邏輯的 " 一朵云 "

大模型的如火如荼,為產業發展帶來更多可能性,這也是互聯網大廠、科創公司爭搶布局的根本原因。

而另一個擺在面前的現實問題是計算硬件的性能提升門檻越來越高,AI 算力短缺問題極有可能是一個長期存在的問題。

對于大多數企業而言,想要更高效地解決算力瓶頸等問題,為自身數智化建設提供更充足、普惠且安全的 AI 算力,或許還有一條更為 " 經濟 " 的途徑可走。

這里 " 更經濟的途徑 ",對應的是數字基礎設施提供者的 "AI 普惠 " 相互對應,即基于穩定的云計算基礎設施,將強大的 AI 算力和簡單上手的技術工具,輸送到企業特別是中小企業手中。

尤其是對中小企業來說,可以把這塊成本省下來,把服務交給京東這類能提供效率高且安全的云的大廠。

格局一打開,選擇就更多了。

從需求匹配的角度來看,在 " 萬物皆可上云 " 時代,混合多云確實是必要的,也逐漸成為主流趨勢之一。報告顯示,有高達 85% 的企業使用兩個或多云平臺,有 25% 的企業至少使用五個云平臺。

一云獨放不是春,多云混合春滿園。

從用戶端來說,采用 " 多云 " 架構,既可以避免與單一云廠商技術與業務綁定帶來的風險加劇,又可以構建更加靈活、性價比更高、有主導權的混合云結構,來解決存量、增量兩方面問題。

如何通過統一邏輯 " 一朵云 " 實現更敏捷、更開放、更高性價比和一致體驗的云架構,正是混合多云技術要解決的問題。

而京東云對此頗有心得。從創立之初起,京東云就支撐著京東大生態的運行,京東各條線業務從 " 上云 " 那一刻起,就生長出一個混合多云的環境,這也是一個天然的超大規模混合多云實踐場。

按照京東云事業部副總裁劉辰的介紹,京東的混合多云平臺是以應用為中心的云設計范式,與以資源為中心的傳統公有云、專有云平臺不同,混合多云平臺讓算力去找應用,讓算力去找數據,實現算力按需按時供給和數據流動。

簡言之,就是在落地層面實現多云、多芯、多活。這也是新一代數字基礎設施三大典型特征最重要的體現。

在多云方面,京東通過統一的云抽象層 " 云艦 ",打通分布在公有云、專有云、IDC 和邊緣節點的物理基礎設施,打通 Underlay 和 Overlay 網絡,數據和業務應用,并實現統一的運維運營和管理體系,從統管到統建。

在多芯方面,除了全面兼容 Intel,AMD,ARM 架構的 CPU,和全棧國產化軟硬件體系基礎上,通過京東集團生產級業務的國產化應用落地的打磨,京東云積累了從硬件到操作系統,基礎數據庫和中間件,以及應用運行時的全棧調優經驗,實現生產級國產化可用。

在多活方面,云艦與現在的一云多芯的云架構,以單元化技術,實現同一個應用跨芯片進行多活部署和調度,一部分流量運行在傳統 x86 云平臺,另外一部分流量運行在國產化平臺,不斷優化適配性能,穩定性和兼容性,實現應用在國產化環境的真替真用。

成本是不容忽視的另一個重點,京東云給出的解決方案是 " 異構算力池化 "。

一方面支持本地的 GPU/NPU 虛擬化,容器化,讓 AI 應用無需修改代碼就可以調用遠端的 GPU、NPU 資源,實現數據中心級別的池化管理和彈性調度,并與現有云平臺打通,實現 CPU,GPU 協同調度;另一方面,同時兼容多種 AI 訓練框架,并支持多種 AI 推理任務混合部署。

如此看來,京東云所打造的統一邏輯的 " 一朵云 ",不僅更適用于當下企業數智化轉型的需要,更重要的是,其這種通過精益調度為企業降本增效的功效,已成為新一代數字基礎設施的一類代表能力。

03

走向產業是必然

2023 年開年以來,以 BATJ 為代表的互聯網大廠,以商湯科技、科大訊飛等為代表的科技公司,以及各類初創企業,紛紛加入大模型領域。京東也宣告將在 7 月 13 日正式發布自己的大模型,以及京東大模型與產業場景結合的最新進展。

盡管公眾對于 AI 的關注已達到了一個新的高度,但從大市場的動作來看,大多數互聯網企業、科技企業等在錘煉大模型時,大多似乎都是直接對標 OpenAI 的 GPT-4,坦白講,鮮有顯著的差異化價值。

大模型想要 " 研以致用 ",走向產業已是一種必然。

但在產業應用的過程中,大模型企業可能要思考的是:一來,技術快速溢出,但算力基礎設施難以同步跟進,如何解決越來越大的算力供需的 " 剪刀差 ";二來,千行百業的落地條件和能力稟賦各有所不同,如何結合行業周期、行業痛點、個體特征等提供服務方案。

這就要求數字基礎設施服務商,必須擁有豐富的服務實體產業經驗,可以及時洞察產業客戶的需求,并基于此進行技術和產品的更新迭代,讓每一個技術創新都能切實解決真實場景下各類用戶最在意的真問題。

這就是京東云不斷聚焦于 " 產業 " 方向的關鍵所在。就實踐這一層,京東云已通過 " 服務練兵 ",驗證了產業大模型真正走向應用的可能與商業價值。

將京東云在生態內的極限考驗平移至大市場,在對外部企業提供數字服務支持時,京東云同樣顯得格外游刃有余。

這不得不提到京東云在 2022 年與央視春晚的紅包合作。在沒有額外增加一臺服務器的基礎上,京東云騰挪調度現有資源,包括遍布全國的 70 多座數據中心、近 300 萬個容器、超 1000 萬核算力資源,通過 16 次秒級精準調度資源,支持了那場超大流量洪峰的全球節目。

此外,國家電投、中化能源、蘇州農商行等重量企業都進入了京東云的 " 朋友圈 "。這些客戶基礎資源龐大,管理復雜,遷移困難,業務龐雜,而京東云在他們原有云資源環境的基礎上,完成混合多云部署,為各業務部門之間跨系統、跨業務單元提供一體化協同管控。

截至目前,京東云已服務了超 95% 的大型央企、2048 家大型企業、914 家金融機構和超 207 萬家中小微企業。

"對京東來說,技術永遠只是手段,而不是目的,我們發展大模型,最終還是希望將產業實踐中凝聚出的數字化能力,開放出來服務社會,不斷提升產業效率。" 曹鵬如是說。

曾幾何時,人們認為做大模型像是一場短跑比賽,拼的是眼力和速度,只要看得準時機、提前入局、快速投入,就能狂飆突進甚至成功沖刺。

現實情況已讓各方愈發深刻地意識到,大模型走入千行百業,實際是一場跨欄比賽,要跨過:算力資源的性價、基礎模型的選擇、業務場景的結合、開發工具的完備、商業模式的摸索、生態資源的支持等。

只有這樣,才有可能更好地面對大模型時代的到來。(完)

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀