大模型落地金融業,想象力在哪?
文 | 產業家,作者 | 思杭 ,編輯 | 皮爺
" 從經濟角度講,整個金融業的數字化進程并非勻速;從技術角度講,催化劑的出現會加速行業駛向數字化深水區。而大模型正是過去十年最強的‘催化劑’。" 恒生電子首席科學家告訴我們。
大模型正在成為推進金融業數字化的第二波浪潮。
【資料圖】
2013 年,互聯網金融騰空出世。此后十年,金融產業共經歷過兩次由 AI 帶來的革命。
第一場革命的主角是辨別式 AI,比如幫助金融機構更好地進行智能分析與決策。在當時,互聯網金融正處于浪潮之巔,金融無紙化、在線化、移動化、遠程化,都促進了金融產業鏈的變革與創新。
在第一波 AI 浪潮中,最為顯著的改變是,以銀行為代表的金融產業經歷了新舊范式的轉變。
然而,這一波金融產業革命進行得并不徹底。雖然 " 金融信任 " 的號角早已吹響,但在金融業,數字化接受程度不高。人工智能的利好,也并未充分得利用在金融業。
這其中,有技術問題,也有合規因素,更有行業壁壘等種種原因,都阻礙著金融產業革命的到來。直到 2023 年,大模型讓局面發生了些許變化。
客觀來看,生成式 AI 的到來,讓行業正在重拾 " 金融信任 "。
大模型在金融業是剛需嗎?
當下,金融機構對數字化的接受程度普遍較低,全面實現數字化的難度也較大。但全流程的數字化,正是金融機構引入大模型的前提。如果仍僅停留在工具層應用,大模型無法更好地賦能產業發展,其顛覆性不大。
恒生電子告訴我們," 如果將金融機構的數字化轉型成熟度分為 0 到 5 級,其中 0 級代表剛起步階段,而 5 級表示完全以數據驅動的商業模式。目前大多數金融機構處于 2 級和 3 級的水平,少量機構已經達到 4 級,甚至有一些局部達到 5 級。"
在所有金融機構中," 數字化轉型表現最優異的是銀行,尤其是頭部銀行,其次是券商。"
之所以銀行的數字化接受程度最高,是因為銀行涉及到很多客戶服務和風險監控的場景。券商則不同,其更多的應用場景在智能決策方面。這兩類不同的場景恰恰是辨別式 AI 與生成式 AI 各自擅長的領域。
具體來看,辨別式 AI 是直接將輸入映射到輸出上,通過學習輸入數據的特征來預測輸出標簽,而在輸入與輸出之間,并沒有生成式 AI 的增強學習的過程中。因此,辨別式 AI 更多用于分類、回歸等任務,比如圖像識別和語音識別。
生成式 AI 則有所不同。其最大的優勢就在于增強學習的過程。生成式 AI 可以從已有數據中學習樣本的統計特征,并在此基礎上生成新的數據。因此,在金融場景下,更適合進行智能決策,通過大模型中輸入的金融知識和新聞等知識,從而給出業務營銷、風險投資等建議。
這意味著,在 AI 大模型的加持下,在金融行業里會出現一些之前沒有的變化。
正如白碩所言,大模型是多年來對金融業影響最為直觀的 " 催化劑 ",相比于元宇宙、區塊鏈等技術,大模型更能深入到垂直領域,顛覆產業,帶來實際價值。其中,最為直觀的影響是給原有的崗位帶來全新的工作方式。
" 比如像數據分析師崗位的變化就很突出。在投資研究領域,數據分析師需要根據財務報表、公開資訊、研報等公開數據進行數據分析形成內容。大模型在這樣的數據處理能力上表現很好,可以替代一部分的崗位工作。" 白碩這樣告訴產業家。
然而,由于大模型在精度、時效性、專業性等方面還有明顯缺陷,當前在金融業還很難實現更深的價值。目前,大模型更多能起到的還是提供一個人機非常友好的交互能力,在金融專業工作中還是需要專業人力完成。
可以說,想象力豐富之余,就當下而言,大模型對金融行業帶來的更為實際價值,更多體現在一些交互性更強的場景。
已經有銀行開始行動。今年 3 月,工商銀行基于昇騰 AI,發布了首個金融行業通用模型。在發布會上,工行宣布該模型已應用在客戶服務、風險防控、運營管理領域。比如,工行應用該模型支撐智能客服接聽客戶來電;再比如,利用金融大模型,對工業工程融資項目建設進行進度監測。
或者也可以說,大模型對金融行業的意義,在加速數智化和重拾 " 金融信任 " 之前,更鮮明的變化是長尾場景落地。
金融大模型走到哪了?
半年時間,互聯網大廠已全部入局;銀行、券商等金融機構也紛紛下場。
金融大模型之所以被稱為 " 塔尖技術 ",其難點不僅在于技術和合規,更在于數據和領域經驗。也就是說,金融大模型的搭建并非可以一蹴而就,而需要具備一定的條件。
以互聯網大廠為例,百度、騰訊、阿里和 360 憑借其多年對抗黑灰產的經驗和在 AI 領域的深耕,可以算得上最有條件做金融大模型的佼佼者。
最先有所動作的是度小滿。5 月 26 日,度小滿正式開源中文金融大模型 " 軒轅 "。與文心一言不同的是,軒轅大模型是度小滿在金融領域長期深耕的結果,并擁有更多高質量的可訓練數據。對金融大模型而言,金融領域的數據質量直接決定了軒轅大模型的各方面表現。
另外,從參數量來看,據官方介紹,軒轅大模型是在 1760 億參數的 Bloom 大模型基礎上訓練而來,且軒轅還融合了金融名詞理解、金融市場評論、金融數據分析和金融新聞理解等數據。
其次傳出風聲的是螞蟻集團。6 月 21 日有消息稱,螞蟻集團的技術研發團隊正在自研語言和多模態大模型,內部命名為 " 貞儀 "。對此,螞蟻集團的回應是 " 消息屬實 "。
螞蟻集團的底氣一方面來源于支付寶在金融領域的多年行業經驗;另一方面來源于從 2015 年螞蟻集團在可信 AI 技術研究的投入。2016 年,螞蟻集團全面啟動 AI 智能風控防御戰略,目前已在反欺詐、反洗錢、反盜用、企業聯合風控、數據隱私保護等多場景落地。近兩年,螞蟻集團更是加緊 AI 領域的布局。
早在 2019 年清華 AI 研究院基礎理論研究中心成立,該中心首席科學家朱軍及其團隊同期發布了第三代人工智能平臺 RealAI,并與金融、工業制造等行業應用深度結合。而就在螞蟻集團傳出自研 " 貞儀 " 的前兩日,由朱軍帶領的新團隊完成了近億級天使輪融資,由螞蟻集團領投。
最后,騰訊和 360 也在近日聯合信通院編制國內金融大模型標準。對于騰訊而言,過去 20 多年黑灰產對抗經驗加上上千個真實業務場景,這些都讓騰訊具備了最真實的行業數據。而向來有著 " 安全衛士 " 稱號的 360 也不例外。
除了互聯網廠商,在金融領域大模型方向布局的還有數據庫廠商,比如星環科技。
對于金融大模型的搭建,數據庫廠商與互聯網廠商走的是兩條完全不同的路線。星環科技的優勢有兩方面。
第一是工藝,即在模型訓練過程中涉及到的數據 " 清洗 " 等加工處理。作為數據庫廠商,星環科技對于數據處理有著一套嚴密的方法論,尤其是針對金融領域特有的異構數據。
對此,星環科技在自研金融大模型 " 無涯 Infinity" 的同時,還提供了一站式的企業自建大語言模型工具鏈。該工具鏈了包含了與大語言模型應用落地緊密相連的向量數據庫 Hippo,以及一系列針對數據庫底層處理技術。其中,最值得注意的是向量數據庫 Hippo。
在金融領域,數據時效性是大模型落地挑戰之一。如何將突發事件和金融資訊等實時數據輸入到大模型中,直接關乎著金融大模型能否準確地進行分析決策。而向量數據庫正是解決該問題的關鍵。
星環科技的第二大優勢則是其長期深耕于金融領域沉淀下來的領域數據和行業 know-how。
盡管互聯網廠商與數據庫廠商各占據行業經驗和模型工藝的優勢,但最具備搭建金融大模型的應該非垂直類廠商莫屬。因為這類廠商有著較高的訓練模型的數據,比如致力于提供金融數字化解決方案的廠商「恒生電子」。
6 月 28 日,恒生電子對外發布金融行業大模型 LightGPT。據了解,該模型使用了超 4000 億 tokens 的金融領域數據(包括資訊、公告、研報、結構化數據等)和超過 400 億 tokens 的語種強化數據(包括金融教材、金融百科、政府報告、法規條例等),并支持超過 80+ 金融專屬任務指令微調,從而加強 LightGPT 在專業領域的理解能力。
白碩表示,對于金融大模型,最為重要的是數據質量,即大模型訓練的數據量大小和數據質量,因為這關系到大模型能夠輸出什么。在底層技術相差無幾的情況下,數據質量才是關鍵。其次是工程化能力和行業經驗。其中,工程化能力包括對數據的選擇、清洗和改造等工作,比如當大模型表現不盡如人意或出現問題時,廠商知道如何判斷缺哪些數據,需要補充哪些數據,從而提高大模型數據質量。
然而,在金融大模型落地過程中,最不容忽視的挑戰是安全問題,即公有云與本地部署之間取舍。
在金融領域,很多數據涉及合規、隱私安全,甚至監管問題,無法公開,因此很難上云。比如工商銀行、農業銀行、郵儲銀行、中信銀行、興業銀行、江蘇銀行、蘇州銀行等多家銀行和券商都已選擇接入通用大模型,即以本地部署方式構建專屬領域的大模型。
既選擇了本地部署的方式,就必然會面臨一些難點,如算力挑戰、參數量問題等。選擇本地部署的金融機構是否有足夠的算力是一方面,另一方面是參數量是否夠大,如果參數量不夠,即使輸入高質量數據,大模型也無法 " 涌現 "。
種種原因,讓入局金融大模型的廠商面臨重重阻礙。
向產業縱深處探尋價值
但問題仍然很多,即使在金融業較為發達的海外,大模型的落地仍是一大挑戰。
來源:Atom Capital從上圖不難看出,創業公司融資金額普遍較小;且除了較為知名的 YC,明星資本不多。
在國內,至少目前來看,精準度、時效性和安全性是金融大模型在落地過程中面臨的三大挑戰。
從精準度來講,大模型在專業領域,尤其涉及到民生經濟的問題時,還無法給出專家級的答案。白碩向產業家說道," 從技術原理上,我們不認為 AGI 能長出某個領域的專業能力,專業的事情還需要交給專家。但大模型能提供的是人機對接能力,如果兩者相結合就可以發揮出更大的作用。"
另一大挑戰在時效性上。數據產生的過程本身是流動的,市場上的數據講精準、講質量,也講時效。" 從數據時效性方面來講,大模型的訓練周期本身就決定了不可能具有時效性,所以補充時效性很強的數據則是金融大模型的必備條件。" 現在很多自研金融大模型的廠商都使用了向量數據庫的手段來實現這一難題。
最后,也是當前領域大模型所面臨的最重要的挑戰,即數據安全問題。由于大模型所收集的數據來源于公開數據,行業大模型需要的是領域數據,甚至是一些不在公開渠道上的研究報告、論文等專有數據。
對此,部分企業、機構的做法是將數據選擇公開出來,但更多的則是選擇將大模型部署在本地。而這就引出了另一個問題,算力挑戰、參數量問題、工程算法等方面的技術問題能否得到解決。
在白碩的觀察中,一些語言能力的差距,在 2~3 年內可以得到解決,不同大模型能力之間的差距也可以拉齊。剩下的問題則要看大模型能否扎在更深的產業中去提供價值。
從當前金融大模型的應用場景來看,提供的價值更多停留在工具層。具體而言,金融大模型在傳統 AI 模型的基礎上更進一步,利用高質量的知識數據和智能屬性,應用于交互性強的場景。
但從更大的視角來看,隨著金融大模型標準的落地,數據合規、隱私安全和訓練工藝等問題一一得到解決,金融大模型會撬動更多的崗位,也會提升人的價值。在精準度、時效性和安全性等挑戰被消除后,金融大模型會與 " 專家 " 一起,解決當下無法解決的問題,帶來更大的產業價值。
金融大模型的難點在于,能否在產業中扎得更深;其顛覆性也更建立在,縱深到產業中去,賦能金融行業的數字化發展。
責任編輯:hnmd003
相關閱讀
相關閱讀
-
大模型落地金融業,想象力在哪?
圖片來源@視覺中國文|產業家,作者|思杭,編輯|皮爺從經濟角度講,整個
-
央行:7 月末 M2 余額 285.4 萬億,同比增長 10.7%
中新經緯8月11日電央行網站11日發布2023年7月金融統計數據報告。一、廣
-
央行:7 月末社會融資規模存量為 365.77 萬億元,同比增 8.9%
中新經緯8月11日電央行網站11日公布《2023年7月社會融資規模增量統計數
-
阿里為何做不好自營電商?
圖片來源@視覺中國文|一刻商業,作者|吳彤,編輯|周燁上線至今不足一年
-
報道:字節跳動 2022 年收入 850 億美元,海外日活 8.4 億
最新數據顯示,字節跳動海外業務正在迅速增長,增速已超過國內業務。周
-
超級平臺生態下,創始人如何走出全域增長焦慮?
本文5400字,預計閱讀8分鐘2023年,消費市場越來越卷了。很多企業創始
-
央行:7月份人民幣存款減少1.12萬億元 同比多減1.17萬億元
央視網消息:據中國人民銀行網站消息,央行8月11日發布2023年7月金融統
-
【@太原人。8月10日起,車站34趟列車停運,其中,有經過太原的......】
因受前期持續強降雨影響,8月10日起,從大同火車站始發以及途經、終到
-
47歲再交職工醫療保險劃算嗎?怎么交?
劃算。 職工醫療保險是由國家和企事業單位共同承擔的一種社會保險制度
平安意外險賠付比例是多少?賠付流程有哪些?
具體來說,平安意外險的賠付比例通常分為以下幾種情況: 1 意外傷殘賠
汽車綜合意外險有必要買嗎?多少錢?
有必要。汽車綜合意外險作為一種綜合性保險,主要針對車輛在使用過程中
意外險心梗猝死賠多少錢?賠付需要什么材料?
意外險心梗猝死賠付的金額是根據保險合同中約定的賠償標準來確定的。一
五險一金交夠多少年可以不用交了?要交多少錢呢?
15年以上, 根據我國的相關法律規定,勞動者在正式工作后,需要連續繳
2023年國際潛水小姐大賽中國區線上新聞發布會正式舉行!
8月11日,2023國際潛水小姐大賽中國區線上新聞發布會正式舉行。本屆
天天收評:滬指創年內最大單日跌幅 兩市超4600股飄綠
北向資金凈賣出超120億。
正榮地產稱債權人盡調完成 預計上半年歸母凈利虧14-16億元
正榮地產集團有限公司(簡稱:正榮地產,6158 HK)公告稱,公司過去數
華為:2023年上半年實現銷售收入3109億元 同比增長3.1%
ICT基礎設施業務收入為1672億元,終端業務收入為1035億元。
傭金高達 50%、一袋成本幾分錢,陷智商稅爭議
各大主播直播間最近一段時間掀起一股「綠色」熱潮。大麥青汁作為前幾年
8 月 11 日三星 Galaxy Z Fold5 開售 京東手機小時購下單 1 小時即可送達
8月11日,三星GalaxyZFold5和三星GalaxyZFlip5正式開售,起售價分別為1
賈可:什么才是中國汽車在一起的正確姿勢
很多人或許都已經忘記了大眾汽車集團2015年的柴油門丑聞。當時美國環保
鴻蒙生態,沒那么簡單
鴻蒙生態這片輕舟,還在努力渡過萬重山,尤其是在消費類終端的鴻蒙OS,
新能源車戰事大賞,“下鄉包圍城市”利好了誰?
圖片來源@視覺中國文|首席商業評論2023年7月,中國新能源汽車市場逆勢
宗慶后又給員工發千萬獎金,兩年前年終獎就發了 6 億,網友們慕了
連發兩個通知,公司為了給大家發錢也是辛苦了,據網上流傳的一張截圖顯
“臺版郭晶晶霍啟剛”?從家庭主婦逆襲千億女掌門,她妻承夫業贏麻了!
在中國臺灣嚴氏家族,婆媳兩代人接連繼位,先后扛起了汽車王國裕隆集團
淘寶起來了,阿里也就穩住了
圖片來源@視覺中國文|表外表里,作者|周霄、張冉冉、譚鳩云,編輯|付曉
山姆盒馬爭奪存量中產,刺刀見紅
圖片來源@視覺中國文|真故研究室,作者|鄭思芳,編輯|龔正在中國要想贏
滬指創年內最大單日跌幅,資金持續博弈次新方向,“牛市旗手”券商緣何走出深幅回調?
財聯社8月11日訊,今日21股漲停,5股炸板,封板率為81%,科源制藥、塞
多瑞醫藥(301075)龍虎榜數據(08-11)
滬深交易所2023年08月11日公布的交易公開信息顯示,多瑞醫藥因成為日漲
如何看qq音樂正在下載的音樂_QQ音樂怎么查看下載好的音樂
如何看qq音樂正在下載的音樂,QQ音樂怎么查看下載好的音樂解答:1、作
精彩推薦
閱讀排行
精彩推送
- 商品期貨收盤漲跌各異,尿素漲超...
- 知情人:“被抄家”醫生半年前被...
- 重疾險可以重復購買嗎?保障什么?
- 二十幾歲買什么保險好?投保方式...
- 42歲了公司給交五險合適嗎?怎么...
- 農村八十歲老人要交醫療保險嗎?...
- 58歲還能交靈活就業保險嗎?怎么交?
- 小米投資汽車零部件研發商盈智熱...
- 切勿割裂對立
- 能源植物聽說過嗎?太空蘆竹了解...
- 連鎖藥店“圈地戰”不停歇:四大...
- 辦45張證明才解綁?支付寶回應:...
- 索尼停止披露 PlayStation Plu...
- iOS 17 對比鴻蒙 4:誰是更智...
- 甩開 7-11 和全家,羅森中國向...
- “ X ”將引入視頻通話功能?...
- 長城 CTO 回應比亞迪“在一起...
- 我國全面啟動氣象探空系統升級換代
- 《固定污染源在線監測系統運維技...
- 花樣年控股明日復牌:去年凈虧損...
- 每天支付寶小雞莊園答題答案:白...
- 46歲交五險一金還來得及嗎?要交...
- 中國人壽意外險電話號碼是多少?...
- 五險交到多大年齡就不讓交了?要...
- 生日前一天買保險年齡怎么算?要...
- 城鄉居民養老保險多少歲開始領?...
- 傳馬斯克考慮在印尼建廠
- 海爾金盈重要股東減持 中金跌近6%
- 天天盤中:主力資金加速從太平洋...
- 斯柯達速派優惠4.3萬,1.4T版售...