環球速訊:AI 基礎軟件,在大模型時代講出新故事
大模型熱潮,讓多家企業沖在 AI 產業底座的路上。
(相關資料圖)
從交換機到高端 AI 服務器,再到云計算和數據中心都進入新增長周期。從 1 到 10 掀起 " 千模大戰 " 的 AI 革命,將首先在軟件和應用領域展開。
其中,算法作為實現 AI 功能的關鍵,基礎軟件為其提供運行的平臺和工具。隨著算力性能逐漸同質化和標準化,數據的差異性和企業需求的個性化逐漸加大,"AI 基礎軟件 " 作為模型訓練效率和算力使用效率的決定性因素,地位更加凸顯。
在企業迫切尋求生成式 AI 應用的加速工具和服務的需求下,一邊 NVIDIA AI Enterprise 軟件套件和 Azure 機器學習相結合,供開發者構建、部署和管理大型語言模型的 AI 應用;另一邊在產業起跑發令槍尚未響起之時,有前瞻性的國內 AI 基礎軟件玩家也開始蠢蠢欲動。
沿著 " 把數據變成模型,讓模型變簡單,讓模型真正用起來 " 的軸線發展,萌芽于硅谷車庫,由兩位前微軟工程師創辦于 2013 年的九章云極 DataCanvas,經歷過去十年隨著 AI 技術的不斷普及和深入應用后,在這次大模型 moment 的爆燃之下,也欲發起新動作。
微軟工程師回國創業,入局數據科學平臺
作為 AI 賽道的早期入局者,九章云極 DataCanvas 背后站著兩個男人:方磊和尚明棟。
兩人在美國待了 10 年,不僅是美國雪城大學攻讀計算機工程碩士時的同窗好友,后又都加入微軟工作。2008 年,微軟從各個團隊中,抽取精明強將,組成了類 startup 的團隊,晚亞馬遜 2 年沖入云計算,方磊跟尚明棟便是其中之二。
彼時,身處內部,兩人從工程師角度看到了很多趨勢,比如早期微軟只提供 PaaS 服務,后被市場教育,又變成了提供 SaaS 和 PaaS 服務。在大廠率先試錯的過程中,2011 年,云上收入增長迅速,多家企業規模量級發生變化。
尚明棟觀察到,一些傳統的大公司,開始成批量把算力往云上去遷移,驗證了當初杰夫貝索斯對云建設的初衷。
" 一開始有人嘲笑說云建設就是弄一堆 RDC 的機房,但貝索斯的愿景是以后接管所有企業的 IT,從底層計算存儲一直到上層數據能力建設等各種基礎能力的建設。企業不需要再有一個 IT 團隊去維護,以非常低的成本就形成一套很復雜、高可用、高并發的架構。"
2013 年前后,美國的數據科學平臺創業迎來爆發期,加之,公有云的技術環境形成,促使新一代數據和人工智能(Data AI)的公司不斷孵化出來 ....Databricks、Snowflake 等一批后來崛起為頭部的公司大都是從這個時候起步。
方磊和尚明棟順勢而為,決定回國在數據科學平臺領域創業,九章云極 DataCanvas 由此成為國內最早入局自動化數據科學平臺的供應商。
2014 年,方磊給投資人的郵件中表示:容器技術自 2012 年出現后,給分析行業帶來了很大的改變,容器化的方式統一了分析流程的運行基礎。而且,與容器結合后,機器學習、深度學習等不再只是在上層增光添彩的小工具,而成為了標準化的基礎設施。
同年,這一創業設想便拿到了亞杰天使基金的天使輪投資。
聚焦 "AI 基礎軟件 " 擴大版圖,超 20 家資本競相押注
尚明棟也深知 AI 基礎軟件更清晰的定位以及上下游的合作,往往更適用于一個相對來說比較成熟的生態分工,絕非一蹴而就。
在花了兩年時間打磨 DataCanvas 數據科學平臺后,尚明棟意識到要把產品變成商品,需要對市場需求精準洞察,而技術創業的背景早期讓其在市場化上也走過一些彎路。想要在國內把數據和算法變成生意,從有數據處理需求的大型企業入手成為了解法。
尚明棟坦言,模型作為數據資產的一部分,從大趨勢上看,數據產生、能力構建是一個持續建設的過程,信息化能力建設最早的行業一定相對來說數據更剛需和密集。
彼時,金融行業的信息化程度遠高于其他行業,銀行是當時國內 IT 預算最高的企業之一,亦成為了九章云極 DataCanvas 瞄準金融行業的最先切入點。時至今日,中國前一百家銀行里,九章云極 DataCanvas 客戶占比超 50 家,驗證了其 AI 創業以 "business" 的核心。
商業化驗證的同時,為解決企業在進行數據分析時面臨的 AI 建模難度門檻過高、以及 AI 推理等問題,九章云極 DataCanvas 也不斷完善產品版圖。
在 " 人工智能基礎軟件 " 的定位下,公司不僅通過 AutoML 自動機器學習、AutoDL 自動深度學習和 ModelOps 提供模型運行的全生命周期,更通過其研發的 HSAP 數據庫 DingoDB 落地 Data-Centric AI。
此外,九章云極 DataCanvas 從 DAT 自動機器學習軟件、DingoDB 實時交互式分析數據庫,到去年 7 月發布的 YLearn 因果學習軟件,不斷以開源重器刷新了業界對開源基礎軟件的期望。后者作為全球首款一站式處理因果學習完整流程的開源算法工具包,填補了可信 AI、可解釋 AI 高性能基礎軟件的市場空白,而這也正是推動 AI 技術實現從 " 預測 " 到 " 決策 " 的規模化應用的重要工具。
尚明棟表示,AI 基礎軟件不光是一個基礎軟件,還面向國內 toB 的生態合作。隨著眾多廠商協作產生的分工細化,在 toB 生態下,面對行業數據、結構的不同,企業更需要考慮在某一個能力層里進行長期的可復用、標準化。
這其中,越是偏底層的能力,他認為越應該參與到開源生態中,通過更多人適配變成整個標準化生態分工里的一環。
" 從這一點上來說,我們尊重且積極參與到開放生態,會開源一些比較底層的計算框架,而偏上面的行業應用,甚至是交互式的應用工具鏈,會更支持企業化特性。" 尚明棟表示,九章云極 DataCanvas 會保持對開源生態的兼容,處于中間層的位置,向上更靠近應用,向下更靠近底層。
據了解,九章云極 DataCanvas 軟件產品收入占六成以上,除在金融行業客戶滲透率不斷提高外,其在通信、工業制造、政府、交通等多行業均有標桿客戶落地。
10 年間,九章云極 DataCanvas 加速狂奔,資本的橄欖枝也接連不斷。
去年 9 月,九章云極 DataCanvas 完成龍門資本領投的 C+ 輪融資,至此,已在 9 輪融資中獲得超 20 家機構押注,其中中關村發展前沿基金、領沨資本、紅點中國、賽富投資基金、襄禾資本等知名機構更是多輪加持。
以 " 大 + 小 " 方式,形成模型訓練新范式
在技術快速發展和行業生態變遷下,如果說過去的產品矩陣是九章云極 DataCanvas 針對企業現有能力來進行伴生式的成長,那么大模型則是九章云極 DataCanvas 的詩和遠方。
近兩年,在跟規模體量特別大的客戶溝通并構建大規模深度學習的分布式訓練框架時,尚明棟就感受到面向未來的非結構化數據越來越多,只不過業內尚無大規模需求涌現。
而這些早期的個別需求讓他在訓練模型時,注意到隨著模型由小變大,大模型訓練成本高甚至可能還會進入到空轉狀態,形成大量成本浪費,故而需要一面訓練,一面監控,一面動態調整訓練參數,讓其持續進入到收斂態。
尚明棟坦言,自 2019 年起,團隊就開始挑可能通過長期投入來形成核心壁壘的點,作為大模型的投入重心。
在他看來,過去中小模型解決的是場景,現在大模型替代的是分工和角色。想讓企業更認可大模型的價值,一要用大模型的能力,給企業帶來更多收益,二要為企業節省更多人力成本。簡而言之就是實現客戶一些原先不能的,或者是原先效果不夠好的能力,在能力建設和業務結合時做好開源節流。
基于這樣的邏輯,九章云極 DataCanvas 將與行業生態結合得較緊密的需大量成本消耗的環節,作為可能被大模型所替代和驅動的目標。
當下,大模型雖表現優異,但對于各行業使用者來說,實際應用于業務場景仍然存在較高的技術和成本門檻。模型的參數標準并不統一,相對于參數級,模型的效果且是否能夠支持快速迭代對于企業客戶實際應用來說更為重要。客戶能夠在一個白盒大模型基礎上快速地、低成本地微調和迭代出客制化的小模型,才能高效地實現豐富場景的大模型應用。而這正是 AI 基礎軟件工具鏈的重要性。
尚明棟表示,大模型未來可能和中小模型更趨同化,而大模型和小模型的融合使用,大模型的小型化,或者說以大模型為底座的小型化微調,也是一種趨勢,能夠以低廉的成本解決大量的問題。AI 基礎軟件通過大模型 + 小模型的方式,正形成模型訓練新范式。
他指出,不管是大模型還是小模型,本質上都是模型,實際就是數據的濃縮,包含價值、邏輯密度。數據不開放,必然要搬運能力,而且是大模型所需的整個能力棧。
而通過過去啃下的技術 " 硬骨頭 ",使得九章云極 DataCanvas 在大模型的落地和應用里,能快速找到能力組合的戰略要點,打造更標準化的大模型工具鏈:不僅會在支持現有框架下,把構建大模型的能力引入行業的邊界里去,而且還會給行業提供能力閉環。
" 作為 AI 生態鏈中基礎軟件環節的能力提供者,過去 10 年我們一直在驗證從模型構建到模型推理生產化,甚至到后期的模型管理,形成一個基于以模型全生命周期作為起點和終點來進行的能力建設的閉環,來對行業產生價值,讓客戶為能力買單。"
而這樣的閉環在大模型構建下,尚明棟預測會有新的能力建設隨新的大閉環而產生。
在他看來,大模型很像新時代的制造業,大家在一個流水線上,下游負責算力、更底層的一些計算框架,九章云極 DataCanvas 負責好基礎軟件,模型的完整生命周期的構建和推理,并賦能于后面的應用,是一個更面向產業的閉環。
而其中,相較于專業能力分工更細致化,有前瞻性技術和能力構建的頭部客戶,真正進行大規模變現和賦能的是更偏向于最終應用的腰部企業,需要九章云極 DataCanvas 從基礎軟件往應用側提供一部分服務,去把最后這一公里補齊。其透露,目前大模型方面已經開始有付費客戶。
據 IDC 預測,到 2026 年,大規模基礎模型將成為大型供應商提供的標準行業實用程序。隨著各大廠商更加投入到底層基礎軟件的建設中,在時代推動和產業帶動下,以九章云極 DataCanvas 為代表的 AI 基礎軟件公司又將有哪些變與不變,讓我們拭目以待。
責任編輯:hnmd003
相關閱讀
相關閱讀
-
環球速訊:AI 基礎軟件,在大模型時代講出新故事
來源:獵云精選;文 孫媛大模型熱潮,讓多家企業沖在AI產業底座的路上
-
黑客威脅、用戶抗議 美版貼吧薅 AI 羊毛不成 陷入持續危機 全球熱訊
財聯社6月21日訊(編輯馬蘭)美國版貼吧Reddit想要從人工智能中分一杯
-
騰訊為何不做通用大模型產品?_全球滾動
出品|虎嗅科技組作者|齊健編輯|陳伊凡頭圖|騰訊云國內AI百模大戰打
-
天天滾動:2023年06月19日全國山藥報價分析
一、全國價格分析宇博智業監測數據顯示,2023年06月19日,全國101類山
-
觀熱點:校方回應女子花30萬拍短片拒領三等獎:評委老師很專業
6月19日,青島電影學院頒獎典禮現場,一名獲三等獎的女生上臺后奪走主
-
鄭州獨角獸企業“致歐科技”登陸創業板!系河南首家互聯網家居上市企業
6月21日,致歐家居科技股份有限公司(以下簡稱致歐科技)在深圳證券交
-
大童百萬醫療保險好不好?有什么特點?_當前快報
比較好。大童保險銷售服務有限公司是經保監會批準設立的中國首家全國性
-
平安人壽保險保單查詢方式有哪些?購買保險的途徑有哪些?-全球熱點
首先,可以通過官方網站或移動應用程序進行在線查詢。客戶只需登錄平安
-
6月21日江蘇嶼鑫金屬不銹鋼報價下跌-全球新資訊
6月21日,江蘇嶼鑫金屬科技有限公司,304,1 0四八尺平板價格報13350元
-
百萬醫療保險哪個產品好?有什么好處? 當前資訊
市場上有很多百萬醫療保險產品,各有各的好處,以下是一些值得推薦的優
-
看點:百萬醫療怎么關閉自動扣費?怎么續保?
聯系保險公司:投保人可以直接聯系百萬醫療保險的銷售渠道或者客服部門
-
重大疾病險過世后怎么賠付?賠付流程是什么? 今日熱聞
要看實際的情況。第一類產品僅僅保障重大疾病責任或者再保障輕癥責任,
-
全球熱議:愛奇藝老會員價值提升:長期連包不斷訂會員保價可再次優惠一年
6月21日,愛奇藝宣布已于近期為長期保持連包不斷訂的會員,推出一項優
-
孩子在家的表現情況懶散不積極完成作業怎么寫_孩子在家的表現情況-世界熱點評
1、時間過得真快,轉眼2010年已接近尾聲,讓我們一起來看看,經過一個
-
痔瘡出來了怎么塞進去_痔瘡出來了怎么塞回去
1、痔瘡與經常便秘有關,排便時經常出現痔瘡出血、疼痛、腫脹。2、當腫
-
世界今熱點:北方經貿雜志社官網_北方經貿學院
1、本人工程學院畢業的,今年搬新校區就讀,有些專業幾年前就升本科了
-
小眾“救命藥”頻頻“喊救命” 亟待建立長效供給機制
小眾“救命藥”面向的單一病種患者并不多,但以我國總人口基數,加之對
-
全球今頭條!鄉村之美丨“千萬工程”啟示錄之二:融合之路,城與鄉雙向奔赴
經歷了華麗蝶變的廣袤鄉村,還“望得見山、看得見水、記得住鄉愁”嗎?
-
GPT-4 是 8x2200 億參數的混合模型?這個小道消息今天傳瘋了
機器之心報道編輯:吳昕GeorgeHotz:除了蘋果之外,大部分公司保密的原
-
德國電信準備挑戰歐盟不合理規定 繼續購買華為 5G 設備|天天熱聞
【TechWeb】6月21日消息,據外媒報道,德國電信準備挑戰歐盟的不合理規
-
“賈躍亭式”財技重現 A 股!股東變債主,昆侖萬維實控人前妻欲套現離場? 當前觀察
本文來源:時代周報作者:何明俊6月20日晚,昆侖萬維(300418 SZ)發布
-
TCL、海信、小米密集推新,Mini LED 電視熬出頭了
中國面板和電視行業逆轉格局的機會來了。作者|辰紋來源|洞見新研社OLED
-
天天微動態丨直播回顧:HVV 經驗分享與重保整體解決方案
6月15日,Coremail聯合北京鈦星數安科技有限公司舉辦【HVV經驗分享與重
-
熱訊:人民幣匯率跌破 7.2!未來怎么走?出國留學、企業進口怎么辦?全面解讀來了→
近段時間,人民幣身價問題,備受關注。5月17日、5月18日,離岸人民幣、
-
《福布斯》長文揭密陳光英:幣安背后的神秘掌舵人-每日視點
圖片來源@視覺中國福布斯發文稱,幣安首席執行官趙長鵬的神秘助手陳光
-
日經 225 指數午后拉升,相關 ETF 集體大漲逾 1.6% 天天觀熱點
日本股市午后走強,日經225指數盤中一度漲逾0 8%。受盤面影響,場內4只
-
當前訊息:世界氣象組織報告歐洲成為全球變暖最快的大陸
財聯社6月21日訊(編輯馬蘭)世界氣象組織(WMO)和歐洲哥白尼研究所周
-
“賈躍亭式”財技重現 A 股!股東變債主,昆侖萬維實控人前妻欲套現離場?_環球時快訊
本文來源:時代周報作者:何明俊6月20日晚,昆侖萬維(300418 SZ)發布
-
有心未怕遲_對于有心未怕遲簡單介紹_今亮點
1、《有心未怕遲》是馮偉棠、黃愷欣演唱的歌曲。2、由李初作詞作曲。文
-
世界看熱訊:2023年6月21日連玉米期貨早盤行情
據生意社統計,2023年6月21日,星期三,大連商品交易所玉米期貨主力230
精彩推薦
閱讀排行
精彩推送
- 拼了!33歲海歸博士創業,7年干...
- 重疾險買長期還是終身?有哪些分...
- 平安百萬醫療門診報銷嗎?報銷的...
- 重大疾病保險屬于什么類型的保險...
- 女性百萬醫療險推薦,女性百萬醫...
- 百萬醫療可以續保終身嗎?續保的...
- 世界快資訊:美國得州要求電動汽...
- 江波龍:融資凈償還154.31萬元,...
- 世界最資訊丨輝瑞藥物Talzenna獲...
- 優予預制菜完成Pre-A輪融資
- 小米智造投資汽車制動系統研發商
- 索尼攜最新 4K HDR 旗艦基準...
- 京東 AI 大模型官宣 7 月 1...
- 看熱訊:OpenAI 被曝要搞「App...
- 美銀:至 2025 財年 蘋果近兩...
- 30 萬人擠進張蘭直播間,只“吃...
- 當前訊息:中郵悅享金生有哪些優...
- 光明一生必須領取年金嗎?投保規...
- 利寶互助保險集團管理團隊到訪水...
- 抖音發布新規:嚴厲打擊仿冒新聞...
- 利寶互助保險集團管理團隊到訪水...
- 世界資訊:北京房山發放1000萬元...
- 星紀魅族和極星聯手,吉利的“算...
- 環球關注:公安部發布端午節假期...
- 體內“穿山甲”微型機器人問世
- 蘋果自研基帶不給力:iPhone SE...
- Epic 旗下 3D 掃描應用《Real...
- 今日關注:華為回應向日企收取專...
- Redmi K60 Ultra 入網,天璣...
- 每日資訊:小米投資儲能企業安酷...