谷歌下場優(yōu)化擴散模型,三星手機運行 Stable Diffusion,12 秒內(nèi)出圖
機器之心報道
編輯:陳萍、小舟
(資料圖片僅供參考)
Speed Is All You Need:谷歌提出針對 Stable Diffusion 一些優(yōu)化建議,生成圖片速度快速提升。
Stable Diffusion 在圖像生成領(lǐng)域的知名度不亞于對話大模型中的 ChatGPT。其能夠在幾十秒內(nèi)為任何給定的輸入文本創(chuàng)建逼真圖像。由于 Stable Diffusion 的參數(shù)量超過 10 億,并且由于設備上的計算和內(nèi)存資源有限,因而這種模型主要運行在云端。
在沒有精心設計和實施的情況下,在設備上運行這些模型可能會導致延遲增加,這是由于迭代降噪過程和內(nèi)存消耗過多造成的。
如何在設備端運行 Stable Diffusion 引起了大家的研究興趣,此前,有研究者開發(fā)了一個應用程序,該應用在 iPhone 14 Pro 上使用 Stable Diffusion 生成圖片僅需一分鐘,使用大約 2GiB 的應用內(nèi)存。
此前蘋果也對此做了一些優(yōu)化,他們在 iPhone、iPad、Mac 等設備上,半分鐘就能生成一張分辨率 512x512 的圖像。高通緊隨其后,在安卓手機端運行 Stable Diffusion v1.5 ,不到 15 秒生成分辨率 512x512 的圖像。
近日,谷歌發(fā)表的一篇論文中《 Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations 》,他們實現(xiàn)了在 GPU 驅(qū)動的設備上運行 Stable Diffusion 1.4 ,達到 SOTA 推理延遲性能(在三星 S23 Ultra 上,通過 20 次迭代生成 512 × 512 的圖像僅需 11.5 秒)。此外,該研究不是只針對一種設備;相反,它是一種通用方法,適用于改進所有潛在擴散模型。
在沒有數(shù)據(jù)連接或云服務器的情況下,這項研究為在手機上本地運行生成 AI 開辟了許多可能性。Stable Diffusion 去年秋天才發(fā)布,今天已經(jīng)可以塞進設備運行,可見這個領(lǐng)域發(fā)展速度有多快。
論文地址:https://arxiv.org/pdf/2304.11267.pdf為了達到這一生成速度,谷歌提出了一些優(yōu)化建議,下面我們看看谷歌是如何優(yōu)化的。
方法介紹
該研究旨在提出優(yōu)化方法來提高大型擴散模型文生圖的速度,其中針對 Stable Diffusion 提出一些優(yōu)化建議,這些優(yōu)化建議也適用于其他大型擴散模型。
首先來看一下 Stable Diffusion 的主要組成部分,包括:文本嵌入器(text embedder)、噪聲生成(noise generation)、去噪神經(jīng)網(wǎng)絡(denoising neural network)和圖像解碼器(image decoder,如下圖 1 所示。
然后我們具體看一下該研究提出的三種優(yōu)化方法。專用內(nèi)核:Group Norm 和 GELU
組歸一化(GN)方法的工作原理是將特征圖的通道(channel)劃分為更小的組,并獨立地對每個組進行歸一化,從而使 GN 對批大小的依賴性降低,更適合各種批大小和網(wǎng)絡架構(gòu)。該研究沒有按順序執(zhí)行 reshape、取均值、求方差、歸一化這些操作,而是設計了一個獨特的 GPU shader 形式的內(nèi)核,它可以在一個 GPU 命令中執(zhí)行所有這些操作,而無需任何中間張量(tensor)。
高斯誤差線性單元(GELU)作為常用的模型激活函數(shù),包含大量數(shù)值計算,例如乘法、加法和高斯誤差函數(shù)。該研究用一個專用的 shader 來整合這些數(shù)值計算及其伴隨的 split 和乘法操作,使它們能夠在單個 AI 作畫調(diào)用中執(zhí)行。
提高注意力模塊的效率
Stable Diffusion 中的文本到圖像 transformer 有助于對條件分布進行建模,這對于文本到圖像生成任務至關(guān)重要。然而,由于內(nèi)存復雜性和時間復雜度,自 / 交叉注意力機制在處理長序列時遇到了困難。基于此,該研究提出兩種優(yōu)化方法,以緩解計算瓶頸。
一方面,為了避免在大矩陣上執(zhí)行整個 softmax 計算,該研究使用一個 GPU shader 來減少運算操作,大大減少了中間張量的內(nèi)存占用和整體延遲,具體方法如下圖 2 所示。
另一方面,該研究采用 FlashAttention [ 7 ] 這種 IO 感知的精確注意力算法,使得高帶寬內(nèi)存(HBM)的訪問次數(shù)少于標準注意力機制,提高了整體效率。Winograd 卷積
Winograd 卷積將卷積運算轉(zhuǎn)換為一系列矩陣乘法。這種方法可以減少許多乘法運算,提高計算效率。但是,這樣一來也會增加內(nèi)存消耗和數(shù)字錯誤,特別是在使用較大的 tile 時。
Stable Diffusion 的主干在很大程度上依賴于 3 × 3 卷積層,尤其是在圖像解碼器中,它們占了 90% 。該研究對這一現(xiàn)象進行了深入分析,以探索在 3 × 3 內(nèi)核卷積上使用不同 tile 大小的 Winograd 的潛在好處。研究發(fā)現(xiàn) 4 × 4 的 tile 大小最佳,因為它在計算效率和內(nèi)存利用率之間提供了最佳平衡。
實驗該研究在各種設備上進行了基準測試:三星 S23 Ultra(Adreno 740)和 iPhone 14 Pro Max(A16)?;鶞蕼y試結(jié)果如下表 1 所示:
很明顯,隨著每個優(yōu)化被激活,延遲逐漸減少(可理解為生成圖像時間減少)。具體而言,與基線相比:在三星 S23 Ultra 延遲減少 52.2%;iPhone 14 Pro Max 延遲減少 32.9%。此外,該研究還對三星 S23 Ultra 端到端延遲進行評估,在 20 個去噪迭代 step 內(nèi),生成 512 × 512 像素圖像,不到 12 秒就達到 SOTA 結(jié)果。小型設備可以運行自己的生成式人工智能模型,這對未來意味著什么?我們可以期待一波。
責任編輯:hnmd003
相關(guān)閱讀
-
谷歌下場優(yōu)化擴散模型,三星手機運行 Stable Diffusion,12 秒內(nèi)出圖
機器之心報道編輯:陳萍、小舟SpeedIsAllYouNeed:谷歌提出針對StableDiffusion一些優(yōu)化建議,生成圖片速度
2023-04-27 -
印度 IT 業(yè)之父:美科技行業(yè)裁員對印度來說是個機會!_天天簡訊
財聯(lián)社4月27日訊(編輯周子意)印度IT公司印孚瑟斯(Infosys)創(chuàng)始人納拉亞納·穆爾蒂(NarayanaMurthy)近
2023-04-27 -
天天關(guān)注:餓了么:熱門旅游地的本地消費明顯升溫,將聯(lián)合高德發(fā)放跨平臺用戶福利
品玩4月26日訊,據(jù)36氪報道,餓了么和高德宣布,即日起將聯(lián)合發(fā)放跨平臺用戶福利,涵蓋外賣、門票、打車等
2023-04-27 -
世界今亮點!金融數(shù)據(jù)港攜手 B 站,“數(shù)治鏈”數(shù)字藏品限量發(fā)行
今天,由金融數(shù)據(jù)港推出的數(shù)治鏈數(shù)字藏品在產(chǎn)業(yè)生態(tài)合作伙伴B站高能鏈(UPowerchain)正式發(fā)行。此前,該數(shù)
2023-04-27 -
天天速看:我國計劃 2030 年首次撞擊小行星,2045 年前初步具備小行星軌道控制能力
品玩4月26日訊,據(jù)環(huán)球時報報道,在首屆深空探測(天都)國際會議開幕式暨主論壇上,來自中國深空探測領(lǐng)域
2023-04-27
相關(guān)閱讀
-
谷歌下場優(yōu)化擴散模型,三星手機運行 Stable Diffusion,12 秒內(nèi)出圖
機器之心報道編輯:陳萍、小舟SpeedIsAllYouNeed:谷歌提出針對StableDiffusion一些優(yōu)化建議,生成圖片速度
-
印度 IT 業(yè)之父:美科技行業(yè)裁員對印度來說是個機會!_天天簡訊
財聯(lián)社4月27日訊(編輯周子意)印度IT公司印孚瑟斯(Infosys)創(chuàng)始人納拉亞納·穆爾蒂(NarayanaMurthy)近
-
每日快訊!中國二冶受邀參加第五屆全國漿體濃縮與管道輸送技術(shù)和裝備研討會
2023年第五屆全國漿體濃縮與管道輸送技術(shù)和裝備研討會于4月20日-23日在長沙召開,中國二冶作為聯(lián)合主辦單位
-
盤錦站站前廣場-停車場(盤錦站)_天天頭條
盤錦站站前廣場-停車場,盤錦站這個很多人還不知道,現(xiàn)在讓我們一起來看看吧!1、如果實在沒有車的話。2、有
-
加強對改造梯市場開拓,展鵬科技2023年實現(xiàn)營收4.99億元-焦點信息
2023年,我國將有5 3萬個以上城鎮(zhèn)老舊小區(qū)開工改造。市場人士分析認為,在國家政策強力賦能下,老舊小區(qū)改
-
當前短訊!《仙劍世界》發(fā)布實機視頻受好評,6月17日開啟實機測試
4月27日,中手游發(fā)布首款國風仙俠開放世界游戲《仙劍世界》的實機視頻,并宣布6月17日開啟實機測試。作為一
-
泰康贏家人生終身壽險(投資連結(jié)型)怎么樣?買多少年?-焦點簡訊
泰康贏家人生終身壽險(投資連結(jié)型)是一種長期保障型壽險產(chǎn)品,具有以下特點: 1、保障全面 2、投資理財 3、
-
天安人壽優(yōu)享d款兩全保險分紅型怎么樣?利率是多少?
可靠。 天安人壽優(yōu)享d款兩全保險分紅型在風險控制、資產(chǎn)配置、收益穩(wěn)定等方面都有著嚴格的規(guī)定和管理。同時
-
天天微頭條丨ChatGPT替代品來了 Hugging Face發(fā)布開源聊天機器人HuggingChat
【TechWeb】4月27日消息,據(jù)外媒報道,人工智能初創(chuàng)公司HuggingFace發(fā)布了一款開源AI聊天機器人HuggingChat
-
久久尊享終身壽險怎么樣?是騙局嗎?
久久尊享終身壽險主要具有以下特點: 1、終身保障 2、保障全面 3、投資增值 4、靈活性高 綜上所述,久久尊
-
今日熱訊:消息稱蘋果MR頭顯正處于最后沖刺和供應鏈交付階段 預計6月發(fā)布
【TechWeb】4月27日消息,據(jù)媒體報道,分析師和研究機構(gòu)普遍預計,傳聞已久的蘋果MR頭顯,將在6月份的蘋果
-
應用場景再擴容 微信小程序、視頻號可使用數(shù)字人民幣付款
數(shù)字人民幣應用場景正在加速擴容。繼多地使用數(shù)字人民幣發(fā)放工資引起關(guān)注后,微信宣布小程序、視頻號即日起
-
世界新消息丨IDC:中國智能手機市場2023開年依舊低迷
證券時報e公司訊,國際數(shù)據(jù)公司(IDC)手機季度跟蹤報告顯示,2023年第一季度,中國智能手機市場出貨量約65
-
焦點熱訊:什么保險公司最好最可靠?怎么選擇合適的保險公司?
目前市面上的保險公司眾多,并不存在什么保險公司最好最可靠的說話,主要是根據(jù)消費者的實際需求以及經(jīng)濟情
-
環(huán)球速看:個人意外險多少錢?如何購買?
個人意外險的保費通常與保額大小、被保險人的職業(yè)、年齡、健康狀況等因素有關(guān)。 一般來說,越高的保額需要
-
微信群出售“和20歲女網(wǎng)友見面機會”,惠州110:正核查
據(jù)澎湃新聞報道,4月27日,網(wǎng)傳一名20歲女孩將去惠州見男網(wǎng)友,男網(wǎng)友將見面機會發(fā)到微信群出售,相關(guān)聊
-
險! 一顆瓜子仁差點要了2歲孩子的命
大象新聞記者王澤群視頻報道近日,在廣東深圳,一對夫妻帶著2歲的女兒麗麗來到中國科學院大學深圳醫(yī)院兒科
-
31省份常住人口數(shù)據(jù)出爐:廣東人最多,浙江增量第一
截至4月26日,31省份2022年常住人口數(shù)據(jù)已全部出爐。總量方面,廣東仍為人口第一大??;增量方面,浙江則位
-
環(huán)球觀點:中國廣電首批5G合約機正式開售
4月27日上午,中國廣電舉辦終端營銷啟動儀式,vivo、iQOO、OPPO、聯(lián)想、中興、榮耀、Apple、三星等首批合約
-
淡水河谷第一季度EBITDA為37億美元 同比減少42%-新要聞
淡水河谷當?shù)貢r間4月26日公布2023年第一季度財報。第一季度,淡水河谷凈營收84 3億美元,同比下降22%;持續(xù)
-
天天關(guān)注:餓了么:熱門旅游地的本地消費明顯升溫,將聯(lián)合高德發(fā)放跨平臺用戶福利
品玩4月26日訊,據(jù)36氪報道,餓了么和高德宣布,即日起將聯(lián)合發(fā)放跨平臺用戶福利,涵蓋外賣、門票、打車等
-
世界今亮點!金融數(shù)據(jù)港攜手 B 站,“數(shù)治鏈”數(shù)字藏品限量發(fā)行
今天,由金融數(shù)據(jù)港推出的數(shù)治鏈數(shù)字藏品在產(chǎn)業(yè)生態(tài)合作伙伴B站高能鏈(UPowerchain)正式發(fā)行。此前,該數(shù)
-
當前快播:京東養(yǎng)車啟動投資人培訓計劃 新店扶持政策升級發(fā)布
在為期2天的培訓大會中,京東養(yǎng)車針對門店經(jīng)營,從開店籌備、經(jīng)營實操、運營賦能,到全渠道營銷支持、新店
-
天天要聞:陽光車險報價是怎么樣的?價格會變化嗎?
交強險的初次保費為950元 年,適用于6座以下車輛,根據(jù)浮動費率機制,最低可降低30%。車損險的保費由固定保
-
保險沒有保單可以退保嗎?退保如何操作?
如果保單丟失,投保人仍然可以退保,但需要先補辦保單。 如果投保人要求退保,保險人應在收到解除合同通知
-
環(huán)球時訊:十大保險公司排名有哪些?哪家最好?
中國人壽保險股份有限公司、中國平安保險(集團)股份有限公司、中國太平洋保險(集團)股份有限公司、中國
-
平安保險平安福交了4年能退多少錢?退保劃算嗎?
不確定,需要根據(jù)實際的保單情況來看。 平安福交了四年的情況下,保險公司會將保單當時的現(xiàn)金價值進行全額
-
目前最好的養(yǎng)老保險是什么?怎么買最劃算?
我國的養(yǎng)老保險主要包括企業(yè)職工基本養(yǎng)老保險、城鄉(xiāng)居民基本養(yǎng)老保險、個人商業(yè)養(yǎng)老保險等多種形式。其中,
-
小米福建攜專業(yè)影像旗艦小米13 Ultra 亮相“數(shù)字中國”峰會 焦點快播
4月26日,第六屆數(shù)字中國建設成果展覽會暨第三屆中國國際數(shù)字產(chǎn)品博覽會在福州海峽國際會展中心盛大啟幕。
精彩推薦
閱讀排行
精彩推送
- 每日速訊:5月1日起,種草筆記附...
- 天天熱資訊!奔馳正式退出俄羅斯...
- 關(guān)注:卡斯特利亞諾斯面對皇馬上...
- 每日快播:安杰思擬首次公開發(fā)行...
- 華住集團:一季度平均可出租客房...
- 世界熱訊:剛披露完一季報,中國...
- 純電皮卡!雷達RD6新增創(chuàng)業(yè)版,...
- 天天速看:我國計劃 2030 年首...
- 今日快看!堅實可靠 堅如磐石 ...
- 強強聯(lián)合!微軟新功能震撼來襲:...
- AWE2023:森歌展出智能水洗集成...
- Beats Studio Buds+ 無線耳機...
- 每日熱議!火山的女兒屬性怎么刷攻略
- 車子走保險的流程是怎么樣的?報...
- 各保險公司重疾險比較哪家比較好...
- 個人旅游意外險怎么買?一般多少...
- 太平洋鴻運年年兩全保險分紅型怎...
- 建行保險理財產(chǎn)品可靠嗎?會虧損...
- 去年一季度拆遷款2.44億,老白干...
- 韓國總統(tǒng)會見馬斯克,再度力邀特...
- 今年下半年發(fā)布 全新寶馬1系路...
- “我真的把自己當成了一名消防員...
- 當前關(guān)注:海南儋州南豐鎮(zhèn)擬打造...
- 天天短訊!淄博文旅局:“五一”...
- 全球百事通!地中海俱樂部年底前...
- 阿根廷將使用人民幣結(jié)算中國進口...
- 新款RAV4榮放上市,17.68萬元起...
- 米哈游護肝行動:100+ 地區(qū)下載...
- 亞馬遜宣布將停止支持 Halo 手環(huán)
- 全球熱門:好太太:晾衣架產(chǎn)品營...