【世界快播報】13 層網絡拿下 83% 精度,華為諾亞新型神經網絡架構 VanillaNet「簡約」到極致
機器之心專欄
【資料圖】
機器之心編輯部
深度學習模型架構越復雜越好嗎?
自過去的幾十年里,人工神經網絡取得了顯著的進展,這歸功于一種理念:增加網絡的復雜度可以提高性能。從 AlexNet 引爆了深度學習在計算機視覺的熱潮后,研究者們為了提升深度網絡的性能,精心地設計出了各種各樣的模塊,包括 ResNet 中的殘差,ViT 中的注意力機制等。然而,盡管深層的復雜神經網絡可以取得很好的性能,但他們在實際應用中的推理速度往往會受到這些復雜操作的影響而變慢。
來自華為諾亞、悉尼大學的研究者們提出了一種極簡的神經網絡模型 VanillaNet,以極簡主義的設計為理念,網絡中僅僅包含最簡單的卷積計算,去掉了殘差和注意力模塊,在計算機視覺中的各種任務上都取得了不俗的效果。13 層的 VanillaNet 模型在 ImageNet 上就可以達到 83% 的精度,挑戰了深度學習模型中復雜設計的必要性。
論文地址:https://arxiv.org/abs/2305.12972代碼地址:https://github.com/huawei-noah/VanillaNet
極簡網絡的架構設計
圖 1. 6 層的 VanillaNet 結構示意圖圖 1 展示了 6 層的 VanillaNet 的結構,它的結構十分簡潔,由 5 個卷積層,5 個池化層,一個全連接層和 5 個激活函數構成,結構的設計遵循 AlexNet 和 VGG 等傳統深度網絡的常用方案:分辨率逐漸縮小,而通道數逐漸增大,不包含殘差,自注意力等計算。
然而,如此簡單的神經網絡結構真的可以達到 SOTA 的精度嗎?從過往的經驗來看,AlexNet 和 VGG 等網絡由于難以訓練,精度低等特性早已被拋棄。而如何提升這類網絡的精度,是一個需要解決的難關。
極簡網絡的訓練方案
作者認為,VanillaNet 的瓶頸主要在于由于其層數少帶來的非線性差的問題,作者基于此觀點,首先提出了深度訓練策略來解決這一問題。
針對 VanillaNet 中的一個卷積層,深度訓練策略提出將其拆分為兩個卷積層,從而增加其非線性,然而,將一層拆分成兩層會顯著增加網絡的計算量和復雜度,因此,作者提出只需在訓練時增加網絡層數,在推理時將其融合即可。具體來說,被拆分為兩層的卷積會使用如下的激活函數:
是由一個傳統非線性激活函數(如 ReLU 等)和恒等映射加權得到。在網絡訓練的初始階段,非線性激活函數會占主導地位,使得網絡在開始訓練時具有較高的非線性,在網絡訓練的過程中,恒等映射的權值會逐漸提升,此時該激活函數會逐漸變為線性的恒等映射,通過以下公式簡單推導:
不具有非線性激活的兩個卷積層就可以被融合為一層,從而達到了 " 深層訓練,淺層推理 " 的效果。
此外,作者還提出了一種基于級數啟發的激活函數,來進一步增加網絡非線性,具體的,假設為任意現有的非線性激活函數,級數激活函數通過對激活函數進行偏置和加權,得到多個激活函數的疊加,從而使得單個激活函數具有更強的非線性:
作者對這一形式又進行了改進,使得該激活函數可以學習到全局信息而非單個輸入點的信息:作者認為,可以通過提出這兩個改進方案,增加網絡的非線性,從而使得極簡網絡也具有媲美甚至超越復雜網絡的精度。極簡網絡的威力
為了證明 VanillaNet 的有效性,作者在計算機視覺的三大主流任務:圖像分類、檢測和分割上進行了實驗。
作者首先驗證了提出的深度訓練方案和級數激活函數的有效性:
表 1 極簡網絡在圖像分類的性能從上表中可以看到,所提出的兩個方案可以大幅提升 VanillaNet 的精度,在 ImageNet 上有數十個點的提升,此外,作者還在 AlexNet 這種傳統網絡上也進行了實驗,效果提升依舊十分驚艷,這證明了簡單的網絡設計只要通過精心的設計和訓練,仍然具有強大的威力。而對于 ResNet50 這類復雜網絡來說,本文提出的設計方案收效甚微,說明這類方案對于簡單的網絡更為有效。
表 2 極簡網絡在圖像分類的性能殘差模塊在 VanillaNet 這種簡單的網絡中是否還奏效?作者同樣針對這一問題進行了實驗,實驗表明,不管是采用 ResNet 本身的殘差方案還是改進后的 PreAct-ResNet 殘差方案,對于 VanillaNet 來說都沒有提升,這是否說明了殘差網絡不是深度學習的唯一選擇?這值得后續研究者們的思考。作者的解釋是由于 VanillaNet 的深度較少,其主要瓶頸在于非線性而非殘差,殘差反而可能會損害網絡的非線性。
接下來,作者對比了 VanillaNet 和各類經過復雜設計的網絡在 ImageNet 分類任務上的精度。
表 3 極簡網絡在圖像分類的性能可以看到,所提出的 VanillaNet 具有十分驚艷的速度和精度指標,例如 VanillaNet-9 僅僅使用 9 層,就在 ImageNet 上達到了接近 80% 的精度,和同精度的 ResNet-50 相比,速度提升一倍以上(2.91ms v.s. 7.64ms),而 13 層的 VanillaNet 已經可以達到 83% 的 Top-1 準確率,和相同精度的 Swin-S 網絡相比速度快 1 倍以上。盡管 VanillaNet 的參數量和計算量都遠高于復雜網絡,但由于其極簡設計帶來的優勢,速度反而更快。
圖 2 極簡網絡在圖像分類的性能圖 2 更直觀的展示了 VanillaNet 的威力,通過使用極少的層數,在 batch size 設置為 1 的情況下,VanillaNet 可以達到 SOTA 的精度和速度曲線。
表 4 極簡網絡在檢測和分割任務的性能為了進一步顯示 VanillaNet 在不同任務的能力,作者同樣在檢測和分割模型上進行了實驗,實驗表明,在下游任務上,VanillaNet 也可以在同精度下具有更好的 FPS,證明了 VanillaNet 在計算機視覺中的潛力。
總結來說,VanillaNet 是一種十分簡潔但強大的計算機視覺網絡架構,使用簡單的卷積架構就可以達到 SOTA 的性能。自從 Transformer 被引入視覺領域后,注意力機制被認為是十分重要且有效的結構設計,然而 ConvNeXt 通過更好的性能重振了卷積網絡的信心。那么,VanillaNet 是否可以引發無殘差網絡、淺層網絡等設計 " 文藝復興 " 的浪潮?讓我們拭目以待。
THE END
投稿或尋求報道:content@jiqizhixin.com
責任編輯:hnmd003
相關閱讀
-
【世界快播報】13 層網絡拿下 83% 精度,華為諾亞新型神經網絡架構 VanillaNet「簡約」到極致
機器之心專欄機器之心編輯部深度學習模型架構越復雜越好嗎?自過去的幾十年里,人工神經網絡取得了顯著的進
2023-05-27 -
天天消息!Faraday Future 宣布 FF 91 成功通過 FMVSS 碰撞測試 第一階段交付將于 5 月 31 日開始
品玩5月26日訊,據法拉第未來官方消息,FF91電動汽車成功通過了美國聯邦機動車安全標準(FMVSS)的碰撞測試
2023-05-27 -
天天消息!A16z 精心整理的最全 AI 學習資料(全文中譯 + 鏈接)
硅谷以善于研究和喜愛分享著稱的投資機構A16z(AndreessenHorowitz)最近發布了一份經過詳細篩選并配有簡介
2023-05-27
相關閱讀
-
【世界快播報】13 層網絡拿下 83% 精度,華為諾亞新型神經網絡架構 VanillaNet「簡約」到極致
機器之心專欄機器之心編輯部深度學習模型架構越復雜越好嗎?自過去的幾十年里,人工神經網絡取得了顯著的進
-
蘋果 7 月關閉“我的照片流”服務
鈦媒體App5月27日消息,蘋果宣布將于7月26日關閉我的照片流(MyPhotoStream)服務,建議現有用戶盡快遷移到
-
基辛格 100 歲了,但現在的美國似乎不再需要他
5月27日,當今世界最具傳奇色彩的外交家基辛格,迎來了自己100歲的生日。撇開政治立場,看他100年的人生經
-
網信辦“清朗”專項行動:處置違規賬號92.76萬余個_當前快報
據“網信中國”消息,按照“清朗·從嚴整治‘自媒體’亂象”專項行動要求,3月10日以來,各級網信部門積...
-
巨星傳奇上市,周杰倫賣咖啡三年賺7個億
據北京商報報道,周杰倫巡演火熱開唱期間,與其深度綁定的巨星傳奇集團有限公司通過港交所上市聆訊,在
-
天天消息!Faraday Future 宣布 FF 91 成功通過 FMVSS 碰撞測試 第一階段交付將于 5 月 31 日開始
品玩5月26日訊,據法拉第未來官方消息,FF91電動汽車成功通過了美國聯邦機動車安全標準(FMVSS)的碰撞測試
-
【新要聞】Great Wall Motor Accuses Rival BYD of Failing on Hybrid Emissions
GreatWallMotorAccusesRivalBYDofFailingonHybridEmissions,with,sold,wall,share,sales,motor
-
天天消息!A16z 精心整理的最全 AI 學習資料(全文中譯 + 鏈接)
硅谷以善于研究和喜愛分享著稱的投資機構A16z(AndreessenHorowitz)最近發布了一份經過詳細篩選并配有簡介
-
我過上了“二手人生”,真是一言難盡!一言難盡! 全球訊息
本周六我們的心理學入門小學堂將進入第一章——精神分析流派,這次直播主講弗洛伊德的人生故事。弗洛伊...
-
環球熱推薦:AI+ 廣告營銷望成流量爭奪重要抓手!受益上市公司梳理
財聯社5月27日訊(編輯若宇)谷歌于美東時間周二推出了一款人工智能(AI)工具,能夠幫助營銷人員創建廣告,
-
西藏林芝森林消防開展30公里徒步行軍訓練-全球快播報
為弘揚森林消防救援隊伍吃苦耐勞的優良作風,練就高效、專業精準的過硬本領,5月25日,西藏自治區森林消防
-
日喀則博物館開館 頭條
近日,投資2400萬元的日喀則博物館正式開館。
-
【世界新視野】西藏今年計劃實施鄉村振興項目1139個
近年來,西藏農牧區面貌得到極大改善,人居環境整治工作有序推進,95%的鄉鎮和78%的建制村通了硬化路,農牧
-
世界微頭條丨非標業務估值核算 非標業務
今天來聊聊關于非標業務估值核算,非標業務的文章,現在就為大家來簡單介紹下非標業務估值核算,非標業務,
-
142億全歸女方,A股又現天價離婚案!70后女博士牢握控制權,創業踏準光刻膠 觀天下
5月25日,光刻膠上市公司彤程新材(603650 SH)緊急連發三條公告,宣告公司實控人夫婦經法院調解后離婚,并
-
*ST龐大被證監會立案調查 全球微動態
5月26日,*ST龐大發布公告稱,公司收到證監會下發的《中國證券監督管理委員會立案告知書》。因公司涉嫌
-
百果園被曝不收顧客一元紙幣,店家:沒說不收,只是兌換麻煩讓她換一張
據時間視頻,5月25日,網曝百果園上海新村路2店不收1元紙幣。網傳視頻中,女子稱店家不收1元紙幣,店員
-
2023年全國“奔跑吧·少年”兒童青少年主題健身活動內蒙古主會場活動即將啟幕_每日看點
活動彩排。5月26日下午,在包頭奧林匹克體育中心的排練場上,伴著稚嫩的童聲、矯健的步伐,一群活力四射的
-
熱門:我市全力做好青年就業創業工作
拓寬就業渠道提供周到服務精準匹配供需我市全力做好青年就業創業工作今年以來,市人社局以開展春風就業行動
-
愛心送考專項服務啟動
圖為參加愛心送考專項服務的交警。記者安吉斯攝在2023年高考即將來臨之際,5月25日下午,由市總工會、市公
-
全國首個家校社協同育人研究與實踐基地在我市建立 全球今熱點
5月25日,中國青少年研究會家校社協同育人研究與實踐基地揭牌儀式暨培訓大會在北重三中舉行。中國青少年研
-
包頭市全民健身發展研究中心在包頭師范學院掛牌成立
5月25日,內蒙古自治區首家地方政府和高校共建的全民健身發展研究中心——包頭市全民健身發展研究中心在...
-
全球百事通!我國科研團隊揭示人腦杏仁核-海馬神經環路工作機制
我國科研團隊揭示了人腦杏仁核-海馬神經環路在工作記憶編碼和維持階段的功能分工和協同模式,為深入理解工
-
西藏啟動電力便民服務體系示范點建設工作-焦點報道
近日,國網類烏齊縣供電公司與類烏齊縣濱達村正式簽訂“村網共建”協議,標志著西藏正式啟動電力便民服...
-
走向珠峰丨行動——走向那座湖|天天觀速訊
近日,2023年珠穆朗瑪峰極高海拔地區綜合科學考察研究活動在西藏珠峰地區啟動。
-
世界動態:2023年珠峰科考登頂隊員凱旋
5月25日傍晚,在圓滿完成海拔8830米自動氣象站維護升級、登頂珠峰采集雪冰樣品等科考任務后,9名科考登頂隊
-
環球速看:哈鐵開行今年首趟“龍藏號”旅游專列
25日22時46分,滿載著486名游客的“龍藏號”旅游專列從哈爾濱東站緩緩駛出,這是中國鐵路哈爾濱局集團有...
-
全球超高海拔單機容量最大風電機組成功吊裝
記者25日從三峽集團獲悉,一臺單機容量為3 6兆瓦的風機在西藏自治區山南市措美縣哲古鎮成功吊裝。
-
滾動:全球首艘,正式交付!
該船型是世界首個應用最新規范設計的超大型海工項目,可適用于全球多個海域的油氣開發作業,實現了我國浮式
-
讓夢想觸手可及 全新一代中高端北京數智重卡耀世登場
5月16日,讓夢想觸手可及北京重卡全球上市發布盛典在北汽重型汽車有限公司隆重舉行。來自全國各地的客戶...
精彩推薦
閱讀排行
精彩推送
- 網紅何丹彤稱在巴黎被搶劫:劫匪...
- 全區推進縣域學前教育普及普惠督...
- “高精尖”科技成果扎堆亮相2023...
- 特斯拉:Model Y 成為第一季度...
- FF:首款量產車 FF 91 已通過碰撞測試
- 通信網如何隨 AI 之需而變?
- C919 機票開售,上海虹橋飛成都...
- 所有人免費!著名景區官宣 環球訊息
- 法院判了!特斯拉車頂維權女車主...
- 他們公告離婚!140 億元股票全...
- 提升中小企業科技創新力 十部門...
- 游戲行業2022年年報盤點:用戶見...
- 環球短訊!小米一季度造車支出11...
- 定位為緊湊型車 寶駿云朵將于8月上市
- 蔚來150kWh固態電池包將于7月交...
- 世界新消息丨廣汽集團:國六A庫存...
- 每日觀點:華為申請汽車品牌 AI...
- 特斯拉車頂維權女車主敗訴,高通...
- 辨認不出親人的遺書,他們開始在...
- 華碩推出新款 Radeon RX 7600...
- 關注:和數字尾巴一起聊 WWDC23
- 4月經濟恢復不及預期:投資增速...
- 恭喜國乒男單包攬四強,梁靖崑跪...
- 度小滿開源國內首個千億參數金融...
- 賽爾號仙境中的頂尖對決_賽爾號...
- 即時看!寶馬325 內飾改裝,寶...
- 【環球熱聞】深圳坪山區龍田街道...
- 【獨家】惠州社??ㄎ搭I取注銷了...
- 遵化市氣象臺發布雷電黃色預警【...
- 天天快消息!什么信號?這家小公...