全球快資訊丨隨時隨地,追蹤每個像素,連遮擋都不怕的「追蹤一切」視頻算法來了
機器之心報道
機器之心編輯部
(相關資料圖)
Tracking Everything Everywhere All at Once.
前段時間,Meta 發布「分割一切(SAM)」AI 模型,可以為任何圖像或視頻中的任何物體生成 mask,讓計算機視覺(CV)領域研究者驚呼:「CV 不存在了」。之后,CV 領域掀起了一陣「二創」狂潮,一些工作陸續在分割的基礎上結合目標檢測、圖像生成等功能,但大部分研究是基于靜態圖像的。
現在,一項稱為「追蹤一切」的新研究為動態視頻中的運動估計提出了新方法,能夠準確、完整地追蹤物體的運動軌跡。
該研究由來自康奈爾大學、谷歌研究院和 UC 伯克利的研究者共同完成。他們聯合提出了一種完整且全局一致的運動表征 OmniMotion,并提出一種新的測試時(test-time)優化方法,對視頻中每個像素進行準確、完整的運動估計。論文地址:https://arxiv.org/abs/2306.05422項目主頁:https://omnimotion.github.io/
有網友在推特上轉發了這項研究,僅一天時間就收獲了 3500 + 的點贊量,研究內容大受好評。
從該研究發布的 demo 看,運動追蹤的效果非常好,例如追蹤跳躍袋鼠的運動軌跡:蕩秋千的運動曲線:還能交互式查看運動追蹤情況:即使物體被遮擋也能追蹤運動軌跡,如狗在跑動的過程中被樹遮擋:在計算機視覺領域,常用的運動估計方法有兩種:稀疏特征追蹤和密集光流。但這兩種方法各有缺點,稀疏特征追蹤不能建模所有像素的運動;密集光流無法長時間捕獲運動軌跡。該研究提出的 OmniMotion 使用 quasi-3D 規范體積來表征視頻,并通過局部空間和規范空間之間的雙射(bijection)對每個像素進行追蹤。這種表征能夠保證全局一致性,即使在物體被遮擋的情況下也能進行運動追蹤,并對相機和物體運動的任何組合進行建模。該研究通過實驗表明所提方法大大優于現有 SOTA 方法。
方法概述
該研究將幀的集合與成對的噪聲運動估計(例如光流場)作為輸入,以形成整個視頻的完整、全局一致的運動表征。然后,該研究添加了一個優化過程,使其可以用任何幀中的任何像素查詢表征,以在整個視頻中產生平滑、準確的運動軌跡。值得注意的是,該方法可以識別畫面中的點何時被遮擋,甚至可以穿過遮擋追蹤點。
OmniMotion 表征
傳統的運動估計方法(例如成對光流),當物體被遮擋時會失去對物體的追蹤。為了在遮擋的情況下也能提供準確、一致的運動軌跡,該研究提出全局運動表征 OmniMotion。
該研究試圖在沒有顯式動態 3D 重建的情況下準確追蹤真實世界的運動。OmniMotion 表征將視頻中的場景表示為規范的 3D 體積,通過局部規范雙射(local-canonical bijection)映射成每個幀中的局部體積。局部規范雙射被參數化為神經網絡,并在不分離兩者的情況下捕獲相機和場景運動。基于此種方法,視頻可以被視為來自固定靜態相機局部體積的渲染結果。
由于 OmniMotion 沒有明確區分相機和場景運動,所以形成的表征不是物理上準確的 3D 場景重建。因此,該研究稱其為 quasi-3D 表征。OmniMotion 保留了投影到每個像素的所有場景點的信息,以及它們的相對深度順序,這讓畫面中的點即使暫時被遮擋,也能對其進行追蹤。
實驗及結果定量比較
研究者將提出的方法與 TAP-Vid 基準進行比較,結果如表 1 所示??梢钥闯?,在不同的數據集上,他們的方法始終能實現最佳的位置準確性、遮擋準確性和時序一致性。他們的方法可以很好地處理來自 RAFT 和 TAP-Net 的不同的成對對應輸入,并且在這兩種基準方法上提供了一致的改進。
定性比較如圖 3 所示,研究者對他們的方法和基線方法進行了定性比較。新方法在(長時間)遮擋事件中顯示出了出色的識別和追蹤的能力,同時在遮擋期間為點提供合理的位置,并處理很大的攝像機運動視差。
消融實驗與分析研究者利用消融實驗來驗證他們設計決策的有效性,結果如表 2 所示。
在圖 4 中,他們展示了由他們的模型生成的偽深度圖,以展示學習到的深度排序。需要注意的是,這些圖并不對應于物理深度,然而,它們展示了僅使用光度和光流信號時,新方法能夠有效地確定不同表面之間的相對順序,這對于在遮擋中進行追蹤至關重要。更多的消融實驗和分析結果可以在補充材料中找到。THE END
投稿或尋求報道:content@jiqizhixin.com
責任編輯:hnmd003
相關閱讀
-
全球快資訊丨隨時隨地,追蹤每個像素,連遮擋都不怕的「追蹤一切」視頻算法來了
機器之心報道機器之心編輯部TrackingEverythingEverywhereAllatOnce 前
2023-06-10 -
全文 + 視頻來了!張宏江對話 OpenAI Altman:AGI 會從根本上改變文明,不會很快有 GPT-5_全球最資訊
6月10日,OpenAI創始人SamAltman以視頻連線的方式現身于中國北京舉辦的
2023-06-10 -
蘋果頭顯出新招!收購 AR 明星公司:喬布斯靈魂伴侶 Jony Ive 曾任顧問,還是任天堂合作方 焦點速遞
比賽,才剛剛開始——就在蘋果剛剛發布VisionPro頭顯之后第二天,有外
2023-06-10 -
快看點丨Sam Altman 中國對話全文:要警惕 AI 風險,但看懂神經網絡比了解人在想什么容易多了
SamAltman的致辭發生在6月10日智源大會的AI安全與對齊分論壇上?,F場座
2023-06-10 -
Bethesda 新作《星空》定價曝光:PC 和 Xbox 版本 69.99/79.99 歐元起|全球訊息
由BethesdaGameStudios開發的《星空(Starfield)》是今年不少玩家期待
2023-06-10
相關閱讀
-
全球快資訊丨隨時隨地,追蹤每個像素,連遮擋都不怕的「追蹤一切」視頻算法來了
機器之心報道機器之心編輯部TrackingEverythingEverywhereAllatOnce 前
-
全文 + 視頻來了!張宏江對話 OpenAI Altman:AGI 會從根本上改變文明,不會很快有 GPT-5_全球最資訊
6月10日,OpenAI創始人SamAltman以視頻連線的方式現身于中國北京舉辦的
-
蘋果頭顯出新招!收購 AR 明星公司:喬布斯靈魂伴侶 Jony Ive 曾任顧問,還是任天堂合作方 焦點速遞
比賽,才剛剛開始——就在蘋果剛剛發布VisionPro頭顯之后第二天,有外
-
焦點信息:一般意外險多少錢一年?包括哪些范圍?
一般意外險的價格因保額、保障范圍、購買年齡等因素而異。 通常情況下
-
當前快訊:團險意外險包括什么?怎么買?
團險意外險是指由企業或組織向其員工或成員提供的一種商業保險,主要針
-
樊綱:中國經濟有很大的韌性 今年5%以上增長可以預期
“即使復蘇進程不像原來想象的那么快,今年5%以上的增長還是可以預期的
-
焦點熱文:增額終身壽是壽險嗎?為什么不值得買?
是。 增額終身壽險是一種保險,它的主要功能是提供終身保障。與傳統的
-
2023世界動力電池大會儲能發展高峰論壇舉行 宜賓被授予“中國儲能產業新高地” 焦點
6月9日,2023世界動力電池大會儲能發展高峰論壇在宜賓市召開。來自國內
-
年金險給孩子買還是自己買?買多少金額合適?
給孩子買年金險或自己買年金險都有其各自的優缺點,購買時需要根據實際
-
當前看點!合眾理財保險安全嗎?怎么買?
安全。合眾理財保險是一種由保險公司發行的理財產品,其安全程度相對較
-
【世界獨家】龍湖集團:今年前5個月累計銷售額817億元,5月新增4宗土地
每經AI快訊,6月9日,龍湖集團控股有限公司(00960 HK)公告,今年前5
-
快看點丨Sam Altman 中國對話全文:要警惕 AI 風險,但看懂神經網絡比了解人在想什么容易多了
SamAltman的致辭發生在6月10日智源大會的AI安全與對齊分論壇上?,F場座
-
中國電科發布生成式人工智能大模型“小可”
品玩6月10日訊,據中國電科官微,中國電科所屬電科太極在京正式發布生
-
Bethesda 新作《星空》定價曝光:PC 和 Xbox 版本 69.99/79.99 歐元起|全球訊息
由BethesdaGameStudios開發的《星空(Starfield)》是今年不少玩家期待
-
微軟大牛加入 ZOOM,AI 人才大戰打響|熱推薦
AI大戰越演越烈,人才爭奪戰也開始白熱化。稀缺的AI頂尖人才,成為各大
-
強者恒強,江鈴福特全順何以持續領跑輕客市場?
如果想購買一輛輕客車型,俯瞰全球汽車市場,相信江鈴福特全順定會成為多數人的首選,無論從市場保有量...
-
2023深圳靈活就業社保退休工資與職工有差別嗎 環球快資訊
無論是以職工身份,還是以靈活就業人員身份參加職工基本養老保險,達到
-
焦點滾動:解剖案例做到舉一反三|天天頭條
解剖案例做到舉一反三---用好調查研究傳家寶,在解剖案例中舉一反三,
-
百萬醫療康健華尊是消費險嗎?怎么買? 世界今頭條
百萬醫療康健華尊是一款商業醫療保險,不屬于消費險范疇。其主要特點是
-
醫療保險一個月多少錢?是人壽保險嗎? 焦點消息
首先,要回答這個問題,需要考慮多個因素,如年齡、性別、健康狀況和選
-
熱門看點:人壽理財保險可以退嗎?退保損失多少?
可以。 一般來說,人壽理財保險是可以退保的。人壽理財保險是一種長期
-
學校意外險包括什么?報銷需要什么材料?_天天熱議
學校意外險是指由學?;驅W生家長購買的一種旨在保障學生在校期間發生意
-
【環球報資訊】泰康人壽重疾險交滿20年后錢怎么辦?多少錢?
1 繼續繳納保費:客戶可以選擇繼續繳納保費,保單將繼續有效。如果客戶
-
RK3588開發板(armsom-w3)之PWM實操
RK3588開發板(armsom-w3)之PWM實操
-
國寶畫重點丨上天入海,到處“出差”!這件寶貝可不得了-環球時訊
太陽神鳥金飾2001年出土于成都金沙遺址。這枚圓形黃金飾品薄如蟬翼,靈
-
全球今日訊!馬斯克:推特將向認證創作者支付在評論中投放廣告的收益
IT之家6月10日消息,推特(Twitter)老板埃隆馬斯克(ElonMusk)剛剛表
-
環球今日報丨聯想服務器連續三季度全球第三!以算力賦能實體經濟
全球知名市場調研機構IDC近日發布的2023年第一季度x86服務器全球市場追
-
百事通!三星電子據稱已開始全面開發大語言模型,目標在 7 月底前完成初始版本
鈦媒體App6月10日消息,據市場消息,三星電子本月初已經開始全面開發人
-
與 watchOS 10 相處 72 小時后,我發現了下一代 Apple Watch 的秘密|全球快播報
在VisionPro和visionOS的光芒下,WWDC23上其他軟硬件更新都略顯暗淡,
-
熱議:BlackCat 勒索軟件啟用了新的簽名內核驅動程序
我們將在本文中詳細介紹發生在2023年2月的BlackCat勒索軟件事件,研究
精彩推薦
閱讀排行
精彩推送
- 紛紛上調!事關中國
- 這生意突然走紅!有人懵了:當垃...
- 商家掛“高考加油”橫幅被城管拆...
- 焦點觀察:約基奇23分12籃板掘金...
- 陽光百萬醫療優缺點有哪些?多少...
- 當前觀察:平安E家百萬醫療險怎...
- 工傷團體意外險怎么買?多少錢?...
- 世界今亮點!醫保重大疾病險包括...
- 場地意外險多少錢?在哪里買? ...
- 340多家葡萄酒企業悉數亮相 第...
- 【天天速看料】國內物價運行總體...
- 深度學習三巨頭之一 Yann LeCu...
- 世界觀焦點:完美世界:已在研發...
- 被低估的智能門鎖,為何成為智能...
- 百元級的“小屏平板”市場:死不...
- 微軟準備在加拿大新建實驗室,將...
- 增額壽與年金險哪個收益好?怎么...
- 養老年金保險可靠嗎?在哪里買?...
- 即時焦點:年金險和增額終身壽險...
- 招商信諾年金險有必要買嗎?在哪...
- 年金保險產品有哪些類型?靠譜嗎...
- 暖心助考 全球速看
- 這就是信心|優化營商環境 各地...
- 三星正開發自有 AI 大語言模型...
- 熱門:21 個“問界”商標已轉讓...
- Ryzen Threadripper 7000 系...
- 蘋果發布 MR 頭顯 XR 的“ ...
- OpenAI 聯合創始人 sam altma...
- 年輕人更愛買金條了,周大福一年...
- 看熱訊:我,“絕版”畢業生,專...