首頁 > 股票 > 正文

華為重大發(fā)布:將重塑千行百業(yè)!

2023-07-08 11:18:18來源:ZAKER財(cái)經(jīng)  

作 者丨倪雨晴 , 畢永豪

編 輯丨駱一帆 , 陳思穎


(相關(guān)資料圖)

圖 源丨圖蟲

2023 年,大模型的大競(jìng)爭(zhēng)時(shí)代開啟,目前全球已經(jīng)有數(shù)百個(gè)大模型亮相,而戰(zhàn)場(chǎng)上的主角們還在不斷進(jìn)化。

7 月 7 日,在華為開發(fā)者大會(huì) 2023(Cloud)上,華為云發(fā)布了盤古大模型 3.0 版本。華為常務(wù)董事、華為云 CEO 張平安表示,盤古大模型 " 不作詩,只做事 ",將重塑千行百業(yè)

事實(shí)上,華為對(duì)大模型的探索很早就開啟,2019 年 ~2020 年,盤古大模型就已在華為云內(nèi)部立項(xiàng),并且完成了與合作伙伴、高校的合作搭建。2021 年 4 月,華為云盤古大模型正式對(duì)外發(fā)布。

從盤古大模型面世之初,就主要面向盤古大模型 3.0 是一個(gè)面向行業(yè)的大模型系列,包括"5+N+X" 三層架構(gòu),分別是基礎(chǔ)大模型、行業(yè)大模型、專用大模型

2021 年,盤古的多模態(tài)大模型、科學(xué)計(jì)算大模型還在規(guī)劃中,如今的 3.0 版本,盤古的大模型體系已經(jīng)頗為豐富。不僅從基礎(chǔ)通用大模型發(fā)展出行業(yè)大模型,還針對(duì)細(xì)分場(chǎng)景提供更細(xì)致的大模型服務(wù)。

張平安在會(huì)后接受 21 世紀(jì)經(jīng)濟(jì)報(bào)道等媒體采訪時(shí)表示,對(duì)于盤古大模型的下一步計(jì)劃,內(nèi)部有非常激進(jìn)的 roadmap(路線圖)。在盤古大模型的發(fā)展上,有團(tuán)隊(duì)在研究有更多參數(shù)讓 AI 大模型發(fā)展更好,也有團(tuán)隊(duì)在研究將參數(shù)通過量化,以更少的算力需求來滿足服務(wù)。另外更重要的是,現(xiàn)在華為云已經(jīng)在鐵路、煤礦、金融等行業(yè)里做了模型,在行業(yè)的垂直深度還要更深一些。

盤古大模型 3.0 來了

張平安介紹道,最新版本的盤古大模型共有三層架構(gòu)。其一為基礎(chǔ)大模型(L0 層),主要提供通用技能,支撐企業(yè)各類應(yīng)用,具體包括自然語言、視覺、多模態(tài)、預(yù)測(cè)、科學(xué)計(jì)算五個(gè)基礎(chǔ)大模型。

在參數(shù)方面,盤古 3.0 提供 100 億參數(shù)、380 億參數(shù)、710 參數(shù)和 1000 億參數(shù)的系列化基礎(chǔ)大模型,匹配客戶不同場(chǎng)景、不同時(shí)延、不同響應(yīng)速度的行業(yè)多樣化需求。

同時(shí),大模型也提供一致的能力集,包括 NLP 大模型的知識(shí)問答、文案生成、代碼生成以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以直接調(diào)用。

對(duì)于基礎(chǔ)大模型的煉成,華為的技術(shù)專家在會(huì)上指出,盤古大模型的特色是可伸縮、高可擴(kuò)展的稀疏 - 稠密語言大模型,在數(shù)據(jù)訓(xùn)練方面,預(yù)訓(xùn)練數(shù)據(jù)超過 3 萬億個(gè) token(AI 大模型的數(shù)據(jù)單位),指令微調(diào)數(shù)據(jù)的規(guī)模在千萬級(jí)。

基礎(chǔ)大模型之外,第二層架構(gòu)是 N 個(gè)行業(yè)大模型(L1 層),華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù),金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的 L0 和 L1 層上,為客戶訓(xùn)練自己的專有大模型。

在此基礎(chǔ)上,華為云還提供了大模型行業(yè)開發(fā)套件,通過對(duì)客戶自有數(shù)據(jù)的二次訓(xùn)練,客戶就可以擁有自己的專屬行業(yè)大模型。同時(shí),根據(jù)數(shù)據(jù)安全與合規(guī)訴求,盤古大模型還提供了公用云、大模型云專區(qū)、混合云多樣化的部署形態(tài)。

華為云人工智能領(lǐng)域首席科學(xué)家、國際歐亞科學(xué)院院士、IEEE/CAAI Fellow 田奇談道,通用大模型在落地行業(yè)上面臨三大挑戰(zhàn),分別是知識(shí)雖多、價(jià)值挖掘快但數(shù)據(jù)安全難保障、通用性強(qiáng)但專業(yè)性弱。

而盤古大模型通過分層解耦架構(gòu)從而更好應(yīng)用到千行百業(yè),從基礎(chǔ)大模型迭代出行業(yè)大模型。田奇表示,實(shí)現(xiàn)行業(yè)大模型有四大關(guān)鍵舉措,分別是沉淀行業(yè)知識(shí)、淬煉行業(yè)技能、對(duì)話專業(yè)工具和保障安全合規(guī)

行業(yè)大模型之上就是 N 個(gè)專用大模型(L2 層),提供了更多細(xì)化場(chǎng)景的模型。比如,更加專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測(cè)、臺(tái)風(fēng)路徑預(yù)測(cè)等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場(chǎng)景,提供 " 開箱即用 " 的模型服務(wù)。

而大模型的發(fā)展離不開算力,在大會(huì)上,華為云宣布推出昇騰 AI 云服務(wù),并在烏蘭察布和貴安同時(shí)上線。據(jù)悉,昇騰 AI 云服務(wù)可以提供更長穩(wěn)的 AI 算力服務(wù),達(dá)到每秒 200 億億次浮點(diǎn)運(yùn)算能力,千卡訓(xùn)練 30 天長穩(wěn)率達(dá)到 90%,斷點(diǎn)恢復(fù)時(shí)長不超過 10 分鐘。

張平安表示,華為要構(gòu)建 AI 算力的另一極," 現(xiàn)在有數(shù)百個(gè)項(xiàng)目在排隊(duì),算力都來不及建設(shè),GPU 價(jià)格高、交貨周期很長,中國算力緊缺,滿足不了需求。華為首先在中國先立足和扎根,滿足中國行業(yè)客戶的需求,立志成為算力的另一極。"

行業(yè)大模型深入應(yīng)用

事實(shí)上在 OpenAI 引爆熱潮之前,華為等大企業(yè)就已經(jīng)在鉆研 AI 大模型,此前幾年大模型在學(xué)術(shù)界早就是熱門話題,2023 年才徹底引燃大眾市場(chǎng)。

對(duì)于華為而言,人工智能自然是必爭(zhēng)之地,云、計(jì)算都是華為升級(jí)轉(zhuǎn)型的重要方向。一方面,華為云盤古大模型并非今年才進(jìn)入市場(chǎng),而是已經(jīng)歷經(jīng)迭代根據(jù)業(yè)務(wù)的需求發(fā)展而來,并且已經(jīng)形成一個(gè)系列。

另一方面,需要指出的是,盤古大模型和 ChatGPT 并非在一個(gè)賽場(chǎng),它們屬于兩個(gè)概念。ChatGPT 是 GPT 系列大模型的一個(gè)應(yīng)用場(chǎng)景,可以直接面向 C 用戶群體,而盤古大模型的應(yīng)用場(chǎng)景更多聚焦在 B 端的千行百業(yè),華為本身 B 端起家,在產(chǎn)業(yè)端有天然的優(yōu)勢(shì)和稟賦。

此前,田奇向 21 世紀(jì)經(jīng)濟(jì)報(bào)道記者表示:"AI 是華為云的核心競(jìng)爭(zhēng)力之一,我們持續(xù)在 AI 領(lǐng)域投入研發(fā),大模型是 AI 的重要技術(shù)方向。未來三年,我們認(rèn)為將會(huì)是大模型是風(fēng)起云涌的三年,AI 將會(huì)和各行各業(yè)深度結(jié)合,AI for industries 將是我們的主要方向。"

目前,盤古大模型已在政務(wù)、金融、制造、煤礦、鐵路、制藥、氣象等諸多領(lǐng)域進(jìn)行深耕。比如在政務(wù)領(lǐng)域,華為云攜手深圳市福田區(qū)政務(wù)服務(wù)數(shù)據(jù)管理局,上線了基于盤古政務(wù)大模型的福田政務(wù)智慧助手。在煤礦領(lǐng)域,盤古礦山大模型已經(jīng)在全國 8 個(gè)礦井規(guī)模使用,一個(gè)大模型可以覆蓋 1000 多個(gè)細(xì)分業(yè)務(wù)場(chǎng)景。

在制造領(lǐng)域,過去單產(chǎn)線制定器件分配計(jì)劃,往往要花費(fèi) 3 個(gè)小時(shí)以上才能做齊 1 天的生產(chǎn)計(jì)劃。盤古制造大模型學(xué)習(xí)了華為產(chǎn)線上各種器件數(shù)據(jù)、業(yè)務(wù)流程及規(guī)則以后,能夠?qū)I(yè)務(wù)需求進(jìn)行準(zhǔn)確的意圖理解,并調(diào)用天籌 AI 求解器插件,1 分鐘即可做出未來 3 天的生產(chǎn)計(jì)劃。

在氣象領(lǐng)域,盤古氣象大模型是首個(gè)精度超過傳統(tǒng)數(shù)值預(yù)報(bào)方法的 AI 預(yù)測(cè)模型,同時(shí)預(yù)測(cè)速度也有大幅提升。原來預(yù)測(cè)一個(gè)臺(tái)風(fēng)未來 10 天的路徑,需要在 3000 臺(tái)服務(wù)器的高性能計(jì)算機(jī)集群上花費(fèi) 5 小時(shí)進(jìn)行仿真。現(xiàn)在基于預(yù)訓(xùn)練的盤古氣象大模型,通過 AI 推理的方式,研究者只需單臺(tái)服務(wù)器上單卡配置,10 秒內(nèi)就可以獲得更精確的預(yù)測(cè)結(jié)果。

7 月 6 日,國際頂級(jí)學(xué)術(shù)期刊《自然》 ( Nature ) 雜志正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊(duì)研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報(bào)》(《Accurate medium-range global weather forecasting with 3D neural networks》)。數(shù)據(jù)顯示,這是近年來中國科技公司首篇作為唯一署名單位發(fā)表的《自然》正刊論文。

眼下,國內(nèi)外的巨頭們都已經(jīng)在大模型賽場(chǎng)上落子,隨著 AI 產(chǎn)業(yè) "iPhone 時(shí)刻 " 的到來,AI 如何融合產(chǎn)業(yè)進(jìn)行升級(jí)變革、如何進(jìn)行商用也將備受關(guān)注,產(chǎn)業(yè)界也更加期待中小開發(fā)者們也像雨后春筍一樣涌現(xiàn),構(gòu)建起更完善的 AI 生態(tài)。

大模型成為 WAIC 最火關(guān)鍵詞

7 月 6 日至 8 日,2023 世界人工智能大會(huì)(WAIC)在上海舉辦。本屆大會(huì)聚焦科學(xué)前沿和產(chǎn)業(yè)發(fā)展,首次設(shè)置 " 邁向通用人工智能 " 主題展區(qū),集中展示國內(nèi)外總計(jì) 30 多款大模型,大模型成為今年 WAIC 的最火關(guān)鍵詞。

SFC

本期編輯 劉雪瑩 實(shí)習(xí)生 趙鳳鈴

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀