首頁 > 新聞 > 智能 > 正文

環球微頭條丨大模型 2.0 時代的優化與突破

2023-06-19 17:12:51來源:ZAKER科技  

貝克街探案官

作者

車行運


(資料圖片僅供參考)

大模型可以讓無人駕駛更智能

今年 6 月份,各大廠商紛紛升級自家的類 ChatGPT 產品。6 月 9 日,訊飛推出星火認知大模型升級版;6 月 13 日,360 在發布類 ChatGPT 產品之后,再次舉行 360 智腦大模型應用發布會。

與 2 月左右發布的大模型不同,近期各家公司發布的升級版產品,更偏向應用層目的是更容易走向千家萬戶。

從目前發布的情況來看,360 智腦已初步具備跨模態成能,除了可以完成文字生成文字、表格、圖片;圖片生成文字、圖片,以及視頻生成文本,文本剪視頻等基礎創作之外,還重新定義" 數字人 ",給用戶一種 " 有靈魂、有設、有記憶 " 可定制的專屬 " 人工智能 "。

目前 360 智腦與用戶距離最近的應用場景,是 360 現有的全家桶,周鴻祎在發布會表示,"360 智腦 4.0" 會接入 360 安全衛、360 瀏覽器、360 搜索等,試圖重塑人機協作。

在發布會上,周鴻祎更改了此前觀點," 我曾經說過,國產大模型與 ChatGPT 之間的差距是兩年,現在我想收回這句話。" 隨后補充最新觀點,認為目前國產大模型的水平與 GPT3.5 大打平,照此速度發展,追趕甚至超過 GPT4 將在轉瞬之間。

從發布初始版本至正式發布 360 智腦的四個月內,周鴻祎看到了會有如此巨大的轉變?

科技大廠圍獵大模型

在 2023 中關村論壇上發布的《中國人工智能大模型地圖研究報告》顯示,當前,中國人工智能大模型正呈現蓬勃發展態勢。據不完全統計,截至目前,參數在 10 億規模以上的大模型全國已發布了 79 個。

而科技大廠的大模型參數量較大:阿里通義千問大模型參數在 10 萬億級以上、騰訊混元大模型華為盤古大模型參數量均在萬億級以上、百度文心一言大模型參數量在 2 千億級以上、京東言犀大模型的參數量為千億級;垂直行業科技企業已經上線的參數量普遍在千億級以上;而科研院校大模型的參數量在千億級及以下。

從大模型的布局體系來看,科技大廠在算力層、平臺層、模型層、應用層進行了四位一體的全面布局。百度、阿里、華為三家均從芯片到應用進行自主研發的全面布局,如百度的 " 昆侖芯 + 飛槳平臺 + 文心大模型 + 行業應用 "、阿里的 " 含光 800 芯片 +M6-OFA 底座 + 通義大模型 + 行業應用 "、華為的 " 昇騰芯片 +MindSpore 框架 + 盤古大模型 + 行業應用 "。

此外金山辦公5 月 31 日還發布了WPS AI,目前,WPSAI 已接入金山辦公旗下辦公組件輕文檔、文字、表格、演示、PDF,未來將錨定 AIGC、閱讀理解和問答、人機交互三個戰略方向發展,并接入金山辦公全線產品。

各家大廠迅速涌入這個賽道,主要是因為監管層迅速跟進出臺措施規范行業發展,有頂層架構保駕護航,各家大廠自然可以放心投入研發,并推出產品。

自今年 3 月大模型批量上線以來,AI 監管政策逐漸明晰,這也給行業應用指明了方向。

回顧整個行業發展歷程,4 月 11 日,《生成式人工智能服務管理方法》征求意見稿發布;5 月 30 日,信通院正在聯合編制" 紙鳶 "開放人工智能模型許可證,下一步將發布《紙鳶開放人工智能模型許可證(征求意見稿)》。

隨后,一線城市配合發布了《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025 年)》;《深圳市加快推動人工智能高質量發展高水平應用行動方案(2023-2024 年)》。

在此背景下,周鴻祎認為國產大模型將會迅速縮小和 ChatGPT 的差距,似乎也好理解了。

360 智腦有何不同

按照周鴻祎的規劃,360 大模型將在持續升級大模型的基礎上,兼顧場景化、產品化、平化、垂直化。

這種發展戰略下,360 智腦可以實現對消費者(戶個 AI 助理)、中微企業(SaaS 化垂直應)、企業 / 政府 / 城市(私有化部署模型)、業(業垂直模型)等四個主要應用場景的覆蓋。

上述四種不同場景的應用,主要通過其他公司在 360 大模型 API 基礎上,結合不同行業需求推出特定產品。現階段,很多部門、企業內部擁有大量獨占性 IP,如果將其統統放到一個公開大模型中,就會重現三星因 GPT 泄露芯片機密的事件,這就凸顯了專有類 GPT 產品的重要性。

想要更好滿足上述不同場景的需求,通用大模型需要在現有基礎上,完成從輸入文字輸出文字,到看懂圖像、視頻,并能產出圖像、視頻的轉變,相當于讓大模型具備了 " 耳朵 " 和 " 眼睛 ",為創建 " 數字人 " 打下基礎。

傳統數字人只需要按照既定腳本輸出,但在大模型時代,360 的數字人可定制,因此設、有記憶、有經歷,目前在 360 數字場平臺中,已經有 200 多個,分為數字名和數字員兩個種類。360 希望未來可以讓每個都有自己的 AI 助理,并有機會在虛擬空間內,跨越時空,和古人交流。

在演示會上,周鴻祎問 " 諸葛亮 " 怎么看今天成為鬼畜素材,數字人以諸葛亮的口吻回復:夫古今之命,乃實事所必然也。今之時勢,天下紛擾不已。吾雖已老,仍志在天下。今者年輕人以吾為鬼畜素材,吾欣然接受此變化。并祝愿年輕朋友在未來的道路上勇往直前,開創更加美好的未來。

同時周鴻祎還強調,未來數字人的形態還會有的標、規劃和分解的能,從而可以調各種垂直的模型完成任務。

不過這些功能其實都是在現有大模型應用基礎上的優化,并沒有開辟一個全新的領域。但實際上,當大模型取得突破后,最具創造性的應用場景是無人駕駛。

無人駕駛有機會駛入快車道

回顧無人駕駛領域,自從 2016 年開始,各大廠商都在布局這個領域,但是直到今年也沒有一家可以實現真正的無人駕駛。

目前一輛L2+ 級別的無人駕駛系統需要 10+ 顆攝像頭;1-2 顆激光雷達;或 3-5 顆毫米波雷達提供的多維度數據,人工標注數據之后才能用于模型的訓練。在可識別影像的大模型出現之后,人工標注所需要的時間成本和物質支出將會驟然下降。

據 2023 年 4 月毫末智行 DriveGPT發布會顯示,目前要得到對諸如車道線、交通參與者、紅綠燈等信息,行業人工標注的成本約每張圖為 5 元,毫末 DriveGPT 的成本為 0.5 元。我們認為科技公司大模型訓練成熟后,單張圖自動標注的邊際成本趨近于 0,平均成本有望進一步下降。

據愷望數據產品項目副總裁張鵬在 2023 年 2 月的介紹,目前數據標注以人工標注為主,機器標注為輔,95% 的數據標注還是以人工為主。大模型的介入,可以極大地提升這個行業的效率。以特斯拉為例,2021 年人工標注團隊為 1000 多人,2022 年該團隊裁員 200 余人。

除此之外,大模型時代,第三方科技巨頭有望通過提供完善的工具鏈,幫助整車廠構建自己的自動駕駛算法和數據閉環系統,同時依靠大模型的數據生成能力縮小在數據領域的差距,自動駕駛的安卓時代有望來臨。

目前,大模型已經被用于賦能數據閉環、仿真、感知算法、規控算法等領域。而巨頭如微軟、英偉達在大模型和自動駕駛爭相布局,或將擦出新的火花。

此外大模型的出現也促進行業分工,避免 " 重復造輪子 ",同時加速傳感器和芯片迭代,系統成本有望大幅下降。大模型開發者和自動駕駛產業鏈玩家有望全面受益。

百度 Apollo為例,其首先利用圖文信息預訓練一個原始模型,利用算法將街景圖像數據進行物體識別并定位和分割,放入編碼器形成底庫,即基于街景建立一個圖片和文字信息對應的數據池。

其次可以通過文本、圖像等形式對特定的場景(如快遞車、輪椅、小孩等)進行搜索和挖掘,對車端模型進行定制化的訓練,大幅提升存量數據的利用效果。

百度用半監督方法,充分利用 2D 和 3D 數據訓練一個感知大模型。通過在多個環節對小模型進行蒸餾,提升小模型的性能,同時通過自動標注給小模型定制化的訓練,用來增強遠距離視覺 3D 感知能力、提升多模態感知模型的感知效果。

另一家頭部玩家商湯科技也曾公開表示,可以用 AIGC 生成真實的交通場景以及困難樣本來訓練自動駕駛系統,以多模態數據作為大模型的輸入,提升系統對 Cornercase 場景的感知能力上限。

同時自動駕駛多模態大模型可做到感知決策一體化集成,在輸出端通過環境解碼器可對 3D 環境進行重建,實現環境可視化理解;行為解碼器可生成完整的路徑規劃;動機解碼器可用自然語言對推理過程進行描述,使自動駕駛系統變得更加安全可靠。

大模型實現上述功能后,未來無人駕駛門檻會越來越低,頭部廠商加速無人駕駛項目進程的同時,還可以讓更多新玩家加入這個領域,并開拓除道路導航外,需要道路規劃功能的賽道,比如進一步優化掃地機器人的路徑規劃。

現在看,在經歷二月至三月的大模型集中發布期、四月至五月的產品研發期和政策方向逐步明確后,六月已經進入 AI 大模型產品和應用有望迎來集中發布期,這也直接導致 OpenAIAPI 降價。

在可預期的未來,AI 技術仍然在持續迭代,應用也在持續推進,同時越來越多科技大廠推出產品切入這個賽道,還將繼續助推行業景氣度上升,并給用戶帶來更貼合市場需求的類 GPT 產品,比如擁有龐大用戶群的騰訊 6 月 19 日也發布了大模型領域的技術方案。

當這些從業企業一起卷的時候,行業發展進入快車道的同時,也意味著 C 端用戶將會很快就能用上這個產品,至于會為誰付款,就需要各家廠商自憑本事了。

THE END

本文僅作為分享學習使用,不構成任何投資建議。

轉載微信聯系:Beke0000

更多文章點擊下方公眾號

感 謝 關 注 !

貝克街探案官微信號:bkjtag
關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀