全球快看:一家 380 億美元的數據巨頭,要掀起企業「AI 化」革命
作者 | 宛辰、Li Yuan
(資料圖片)
編輯 | 靖宇
當地時間 6 月 28 日,美國知名數據平臺 Databricks 舉辦了自己的年度大會——數據與人工智能峰會。會上,Databricks 公布了 LakehouseIQ、Lakehouse AI、Databricks Marketplace 、 Lakehouse Apps 等一系列重要新品。
無論是從峰會的名稱,還是新產品的命名,都能看出這家知名數據平臺,正在趁著大語言模型的東風,加速向 AI 轉變的腳步。
Databricks 公司 CEO Ali Ghodsi 所說的數據和 AI 普惠化|Databricks「Databricks 要實現的是『數據普惠』和 AI 普惠,前者讓數據通向每一個雇員,后者讓 AI 進入每一個產品。」Databricks 公司 CEO Ali Ghodsi 在臺上說出了團隊的使命。
就在大會開始之前,Databricks 剛剛宣布以 13 億美元收購 AI 領域的新生力量 MosaicML,創下了當前 AI 領域收購紀錄,可見公司在 AI 轉型上的力度和決心。
正在前方參會的 PingCAP 創始人兼 CEO 劉奇告訴極客公園,Databricks 平臺剛剛上線 AI 的企業級應用,就已經有超過 1500 家公司在上面進行模型訓練,「數字超出預期」。同時,他認為 Databricks 由于之前在數據 + AI 方面的積累,讓公司能在 AI 大火之際,迅速在之前平臺基礎上加入新產品,就能快速給出和大模型相關的服務。
「最關鍵的就是速度。」劉奇說道,在大模型時代,如何用更快的速度讓大模型和現有產品整合,解決用戶的痛點,可能是當下所有數據公司最大的挑戰,同時也是最大的機會。
Talking points
通過交互界面的升級,不是數據分析師的普通人,也可以直接使用自然語言查詢和分析數據。
企業將大模型部署到云端數據庫將越來越容易,直接使用成品大模型工具分析數據,也將變得更加簡單。
隨著 AI 的進展,數據的價值還將越來越高,數據潛力將被進一步釋放。
01
數據庫迎來自然語言交互
在會上,Databricks 推出了全新的「神器」LakehouseIQ。LakehouseIQ 承載著 Databricks 近期最大的發力方向之一——數據分析普惠化,即不掌握 Python 和 SQL 的普通人也能輕輕松松接入公司數據,用自然語言就能進行數據分析。
為達到這個目的,LakehouseIQ 被設計為一個功能合集,既可以被普通終端用戶使用,也可以被開發者使用,針對不同的用戶設計了不同的功能。
LakehouseIQ 產品圖|Databricks對于開發者方面,發布了 LakehouseIQ in Notebooks,這項功能中,LakehouseIQ 可以利用大語言模型幫助開發人員完成、生成和解釋代碼,以及進行代碼修復、調試和報告生成。
而對于普通的非程序員群體,Databricks 則提供了可以直接用自然語言交互的界面,背后由大語言模型驅動,可以直接用自然語言來搜索和查詢數據。同時,該功能與 Unity Catalog 集成,讓公司可以對數據的搜索和查詢進行訪問權限控制,只返回提問者被授權查看的數據。
自大模型推出以來,用自然語言對數據進行查詢和分析,其實一直是一個數據分析方向的熱點,許多公司在此方向都有所布局。包括 Databricks 的老對手 Snowflake,剛剛宣布的 Document AI 功能也是主打這個方向。
LakehouseIQ 自然語言查詢界面|Databricks不過 Databricks 宣稱,LakehouseIQ 做到了更好的功能。它提到,通用大語言模型在理解特定客戶數據、內部術語和使用模式方面擁有局限性。而 Databricks 的技術,能夠利用客戶自己的模式(schema)、文檔、查詢、受歡迎程度、線程、筆記本和商業智能儀表盤來獲取智能,回答更多查詢。
Databricks 的功能與 Snowflake 的功能還有一個差別,Snowflake 平臺的 Document AI 功能,僅限于對文檔中的非結構化數據進行查詢,而 LakehouseIQ 適用于結構化的 Lakehouse 數據和代碼。
02
從機器學習到 AI
Databricks 與 Snowflake 在發布會上的相似之處還不局限于此。
此次發布會中,Databricks 發布了 Databricks Marketplace 和 Lakehouse AI,這與 Snowflake 這兩天大會的重點也完全吻合,二者都主打將大語言模型部署到數據庫環境中。
在 Databricks 的設想中,Databricks 未來既可以協助客戶部署大模型,也提供成品的大模型工具。
Databricks 過去就有 Databricks Machine Learning 的品牌,在此次發布會上,Databricks 對其進行品牌全面的重新定位,升級為 Lakehouse AI,主打協助客戶部署大模型。
Databricks 上線了 Databricks Marketplace。在 Databricks Marketplace 中,用戶可以接入經過篩選的開源大語言模型集合,包括 MPT-7B、Falcon-7B 和 Stable Diffusion,還可以發現和獲取數據集、數據資產。Lakehouse AI 還包括一些大語言模型操作能力(LLMOps)。
Lakehouse AI 架構圖|DatabricksSnowflake 也在對此進行積極部署,其相似功能由 Nvidia NeMo、Nvidia AI Enterprise、Dataiku 和 John Snow Labs 提供(與英偉達的合作正是 Snowflake 大會的重點之一,見極客公園的報道)。
在協助客戶部署大模型方向,Snowflake 與 Databricks 顯現出了分歧。Snowflake 選擇積極地與合作伙伴進行合作,而 Databricks 則試圖將該功能作為其核心平臺的本地特性添加進去。
而在提供成品工具方面,Databricks 宣布 Databricks Marketplace 未來還將可以提供 Lakehouse Apps。Lakehouse Apps 將直接在客戶的 Databricks 實例上運行,它們可以與客戶的數據集成,使用和擴展 Databricks 服務,并使用戶能夠通過單點登錄體驗進行互動。數據永遠不需要離開客戶的實例,沒有數據移動和安全 / 訪問問題。
這點則與 Snowflake 公司的產品從命名到功能上都直接撞車。Snowflake 公司與之相似的 Snowflake Marketplace 和 Snowflake Native App 已經上線,是其發布會的重點之一。彭博社就在 Snowflake 的大會上宣布了一個由彭博社提供的 Data License Plus ( DL+ ) APP,允許客戶在云端用幾分鐘時間就能配置一個隨時可用的環境,內部設有完全建模的彭博訂閱數據和來自多供應商的 ESG 內容。
03
數據平臺迎來新變革
開幕式主旨演講上,Databricks 公布了一個數字:過去 30 天,已經在 Databricks 平臺上訓練 Transformer 模型的客戶超過 1500 家。
在談及這個令人印象深刻的數字時,PingCAP 劉奇認為,這說明企業應用 AI 的速度比預期的要快得多,「應用模型不一定要去訓練模型,所以如果訓練的都有 1500 家,那應用的肯定要比這個(數字)大的多得多。」
另一方面,這也表明 Databricks 在 AI 這個領域的布局相對完整。「它現在不僅僅是一個 Data Warehouse(數據倉庫),一個 Datalake(數據湖)。現在它還提供:AI 的 training(訓練)、AI 的 serving(服務),模型的管理等一整套。」
Ali Ghodsi 以計算和互聯網的革命,類比大模型之于機器學習的變革|Databricks也就是說,底層模型可以通過 Databricks 的平臺去訓練,「最底層的模型改改參數就能訓練」。在這個模型之上所需要的 AI 服務,Databricks 也布局了相應的基礎設施——今天發布了 vector search(向量搜索)和 feature store(特征庫)。
Databricks 全面向大模型升級。
過去,Databricks 在 AI 方面有很多積累,比如在建索引、查數據、預測工作負載等方面,用小模型來提高效率、降低時延。但是,以如此快的速度補上大模型的能力,還是讓不少人意外。
在今天峰會全面展示的 AI 布局之前,Databricks 收購了 Okera(AI 數據治理),推出了自家的開源大模型 Dolly 2.0,又以 13 億美元并購了 MosaicML,一連串的動作一氣呵成。
對此,硅谷徐老師 Howie 認為,Databricks 和 Snowflake 這兩個大會都可以比較明確地看出:兩家公司的創始人認為,基于數據庫、數據湖他們所做的行動、接下來會面臨根本性的改變。按照一年前他們在做的思路,在未來幾年行不通。
相應地,快速補齊大模型的能力,也意味著可以獲得由于大模型帶來的增量市場。
劉奇認為,沒有大模型之前,很多的需求可能都不存在,但有了大模型之后,有了很多新增需求。「因為只有模型沒有數據,干不了什么事情,特別是沒有辦法做出差異化。如果大家都是一個大模型,那你跟別人可能也沒有差別。」
但比起大模型,峰會現場的觀眾似乎更關注小模型,因為小模型的幾個優勢:速度、成本、安全性。劉奇表示,基于自己獨有的數據,做出差異化的模型,模型要足夠小才能滿足這三條:足夠便宜、足夠快、足夠安全。
值得注意的是,Databricks 和 Snowflake 在日前都公布了它的營收數據,平臺年營收增長在 60% 以上。相比整個市場軟件支出放緩的大背景,這樣的增長速度反映了數據越來越被關注。這次 Databricks 峰會的主題也是數據加 AI,但有了大模型,數據的價值還將越來越高。
大模型的到來,讓數據自動生成成為可能,可以預見,數據量將指數級增長。怎么輕松地訪問數據、怎么支持不同的數據格式、挖掘數據背后的價值,會成為越來越頻繁的需求。
另一方面,今天很多企業還在還在探索觀望將大模型接入企業軟件,但考慮到安全、隱私、成本,敢直接用的,還很少。一旦通過將大模型直接部署到企業數據上,無需移動數據,部署大模型的門檻將被進一步降低,數據被消費的數量和速度都將被進一步釋放。
責任編輯:hnmd003
相關閱讀
-
Canalys:預估蘋果 Vision Pro 頭顯上市后五年累計銷量會超 2000 萬臺_頭條焦點
鈦媒體App6月30日消息,據市場調查機構Canalys發布的最新報告,蘋果拓
2023-06-30
相關閱讀
-
全球快看:一家 380 億美元的數據巨頭,要掀起企業「AI 化」革命
作者|宛辰、LiYuan編輯|靖宇當地時間6月28日,美國知名數據平臺Databri
-
環球快資訊:微軟收購驚動索尼,兩大巨頭明爭暗斗多年!
微軟收購驚動索尼一場全球矚目的反壟斷監管訴訟,一個改變行業格局的天
-
Canalys:預估蘋果 Vision Pro 頭顯上市后五年累計銷量會超 2000 萬臺_頭條焦點
鈦媒體App6月30日消息,據市場調查機構Canalys發布的最新報告,蘋果拓
-
小米、騰訊、吉利等巨頭持股 黑芝麻智能沖刺港股 IPO
【CNMO新聞】6月30日,CNMO從媒體獲悉,汽車AI芯片開發商黑芝麻智能近
-
全球今日訊!給 AI 打下手,我被搶了“飯碗”
Tech星球(微信ID:tech618)文|陳橋輝封面來源|圖蟲創意任何一項新技
-
單位存款有哪些?如何存款可以獲得更高的利息?
不少的小伙伴在選擇銀行存款時,大部分都會選擇活期存款,最大的原因之一就在于它沒有固定期限,可以隨...
-
公章莫名消失!業內人士:從未遇過 天天觀天下
作者丨唐韶葵編輯丨張偉賢圖源丨圖蟲6月的廈門集美新城,天清氣爽,不
-
背靠能源第一省,光伏強市的電不夠用了?
圖片來源:包頭發布最近,一則傳聞把包頭送上輿論風口。據上海有色網消
-
法人貸款需要什么條件?法人貸款無力償還后果
法人貸款需要什么條件?1、客戶群體:年齡在24-65周歲,成立6個月以上且三證俱全的有限公司或獨資企業法...
-
京東養車在西藏拉薩開業
京東集團旗下的汽車養護連鎖品牌——京東養車拉薩門店近日在拉薩市城關
-
信息:西藏改則縣生態文明建設掃描:守護羌塘腹地 打造動物天堂
這世上總有一些人,在常人難以注目的地方默默奉獻著。
-
西藏自治區市場監管局召開行政指導和政策解讀座談會 全球時快訊
近日,西藏自治區市場監管局網監處組織西藏美團和餓了么平臺相關負責人
-
速看:拉林鐵路開通運營兩周年
2023年6月25日,是拉林鐵路開通運營兩周年,記者從拉薩火車站獲悉,兩
-
三無食品怎么處罰?三無食品的處罰標準是什么?
一、三無食品是指什么三無食品中有可能含有色素和防腐劑的食品,甚至是地下工廠生產的食品。食用了這一...
-
網購收貨付款有什么注意事項?網購交易規則都有哪些?
1、多了解寶貝細節,了解賣家在出價前,您可以通過各種方式了解有關交易的信息。比如物品的具體細節,對...
-
到期還款日是什么意思?到期還款日和最后還款日區別
到期還款日是什么意思?信用卡到期還款日是指信用卡最后的還款日期。每張信用卡都有一次修改還款日期的機...
-
7月起一批新規將施行 涉鐵路出行、消費者權益、低保標準等
①全國性新規:國六b排放標準將全面實施、全國鐵路實行新的列車運行圖
-
企業所得稅季報是什么?企業所得稅應該怎么繳納呢?
大家都知道,企業是需要繳納企業的一個所得稅的,那么,對于企業所得稅來說,企業所得稅應該怎么繳納呢?...
-
刑法有泄露公民個人隱私罪嗎?中華人民共和國刑法第二百五十三條的內容是什么?
一、個人隱私信息包括什么私人隱私就是私人生活秘密,是指私人生活安寧不受他人非法干擾,私人信息保密...
-
進球網:卡斯特羅接受利雅得勝利邀請,將擔任球隊主教練_觀速訊
進球網:卡斯特羅接受利雅得勝利邀請,將擔任球隊主教練,卡斯特羅,利雅
-
公司可以抵押貸款嗎?公司抵押貸款的特點是什么?
的條件才惡意。下面小編為大家詳細介紹一下相關知識,希望對大家有所幫助。一、公司可以抵押貸款嗎公司...
-
避免個人債務糾紛要注意以下幾個方面?下列哪種情況下是允許債權人扣押財產?
一、所謂的清債公司是合法的嗎我國現行的法律法規并不允許成立討債或清債公司之類的組織,發生債務糾紛...
-
檔案管理方法有哪些?檔案管理的內容是什么?
一、檔案管理方法有哪些1、抽屜式直立檔案。所謂抽屜式就是立在地面上的分層的抽屜,這種方式能夠將種類...
-
股票交易傭金是多少?股票交易要交哪些費用?
股票交易傭金是多少?1、不同的營業部的傭金比例不同,極個別的營業部還要每筆收1-5元的委托(通訊)費。2...
-
世界實時:果粉網傳新iphone 大遲到11月底_果粉網創始人
想必現在有很多小伙伴對于果粉網創始人方面的知識都比較想要了解,那么
-
建設銀行信用卡好辦嗎?建設銀行信用卡辦理需要什么條件?
建設銀行信用卡好辦嗎?建設銀行是比較好申請的,只要用戶符合建設銀行的申請條件,想要成功下卡還是很容...
-
環境污染防治原則都有哪些?完善環境管理體制都有什么?
一、環境污染有哪些1、空氣污染:包括企業廢氣排放污染、機動車尾氣排放污染、飲食業油煙排放污染、建筑...
-
滬深300股指期貨怎么開戶?滬深300股指期貨一手多少錢?
滬深300股指期貨怎么開戶?個人攜帶本人身份證、銀行卡復印件或者掃描件1份、身份證掃描件(電子版)、個人...
-
房地產業務都包括哪些?房地產經營是指什么內容?
房地產經營是指房地產開發企業的中介組織進行房地產項口轉讓、商品房預售、銷售以及租賃等商業活動。具...
-
天天觀天下!國際油價29日上漲
南方財經6月30日電,。截至當天收盤,紐約商品交易所8月交貨的輕質原油
精彩推薦
閱讀排行
精彩推送
- 風險可控、理性發展、長期回報…...
- 建筑面積和使用面積的區別是什么...
- 去臺灣要簽證嗎?怎么辦理簽證呢?
- 生產者能夠證明有哪些情形不承擔...
- 進口車銷量暴跌!雷克薩斯、寶馬...
- 長城汽車荊門工廠新增三款車型-...
- 股權激勵是什么意思?公司股權激...
- 法律意見書格式都有什么內容?法...
- 文明實踐在行動|營造清朗社會文...
- 護航未成年人成長|筑牢校園“防...
- 三證齊發 跑出審批“加速度”
- 每日關注!“法稅協作”出新招 ...
- 什么是社保卡?社保卡可以當銀行...
- 文明實踐在行動|稀土高新區:精...
- 營業稅勞務范圍是什么?什么是營...
- 匯票和本票的區別是什么?匯票和...
- 公司增資的主要方式都有哪些?申...
- 移倉是什么意思?期貨主力移倉會...
- 規章制度的作用都有什么?規章制...
- 股票漲停可以買嗎?股票漲停為什...
- 工業總產值的計算原則是什么?目...
- 白銀期貨保證金是什么意思?白銀...
- 游客開車壓草場牧民損失數萬!牧...
- 敞口是什么意思?風險敞口怎么計...
- 焦點快報!外媒:蘋果更重視 iOS...
- AI 公司 Inflection 融資 13...
- 世界百事通!鈦媒體科股早知道:...
- 售價 4 萬美元、限量 24 臺...
- 罕見 4GB 未拆封初代 iPhone...
- 全球聚焦:美國駐北約大使:成員...