CVPR 2018獎(jiǎng)項(xiàng)出爐:最佳論文花落斯坦福大學(xué)
昨日,一年一度的計(jì)算機(jī)視覺頂級(jí)會(huì)議 CVPR 2018 在美國(guó)鹽湖城拉開帷幕,排起長(zhǎng)龍的注冊(cè)隊(duì)伍讓現(xiàn)場(chǎng)參會(huì)的機(jī)器之心分析師看到了這屆 CVPR 的火熱。據(jù)統(tǒng)計(jì),本屆大會(huì)有超過 3300 篇的大會(huì)論文投稿,錄取 979 篇(接受率約為 29%,其中包括 70 篇 Oral 和 224 篇 Spotlight 論文)。
本文引用地址:http://www.ex-cimer.com/article/201806/382362.htm而在一個(gè)小時(shí)前,最受關(guān)注的 CVPR 2018 最佳論文結(jié)果揭曉:來自斯坦福大學(xué)和 UC Berkeley 的 Amir R. Zamir 等人獲得 CVPR2018 的最佳論文(Best Paper Award);來自卡內(nèi)基梅隆大學(xué)的 Hanbyul Joo 等人獲得了本屆大會(huì)最佳學(xué)生論文獎(jiǎng)(Best Student Paper Award)。此外,Tübingen 大學(xué)教授 Andreas Geiger 與 FAIR 研究科學(xué)家何愷明獲得本屆大會(huì)的 PAMI 年輕學(xué)者獎(jiǎng)。
在 19 號(hào)上午的主會(huì)議上,CVPR 方面先介紹了今年大會(huì)的數(shù)據(jù)信息,除了論文接收量再次超越往年,今年的注冊(cè)參會(huì)人員也達(dá)到了 6512 位。
此外,論文評(píng)審人員的數(shù)量在今年也達(dá)到了新高,2385 名 reviewer,而 2014 年 CVPR 的參會(huì)人員也才 2000 人左右。
介紹完大會(huì)數(shù)據(jù)方面的信息,接下來就是揭曉最佳論文得主了:
最佳論文
CVPR2018 的最佳論文(Best Paper Award)由斯坦福大學(xué)和 UC Berkeley 的 Amir R. Zamir 等人獲得。他們提出了一個(gè)映射視覺任務(wù)空間的框架,通過計(jì)算不同任務(wù)的相關(guān)性來確定遷移學(xué)習(xí)方案,從而可以在保持準(zhǔn)確率的同時(shí),大大降低對(duì)數(shù)據(jù)、監(jiān)督信息和計(jì)算資源的需求。
最佳論文:Taskonomy: Disentangling Task Transfer Learning
視覺任務(wù)之間是否相關(guān)?例如,能否使用曲面法線簡(jiǎn)化估計(jì)圖像深度的過程?直覺上對(duì)這些問題的正面回答暗示著在各種視覺任務(wù)之間存在一種結(jié)構(gòu)。了解這種結(jié)構(gòu)具有巨大的價(jià)值;它是遷移學(xué)習(xí)背后的概念,且可為識(shí)別任務(wù)間的冗余提供了一種有理可依的方法,比如,為了在相關(guān)任務(wù)間無縫地重復(fù)使用監(jiān)督或在一個(gè)系統(tǒng)中解決多個(gè)任務(wù)而不增加復(fù)雜度。
我們提出了一種完全計(jì)算的方法來建模視覺任務(wù)的空間結(jié)構(gòu),通過在一個(gè)位于隱空間內(nèi)的 26 個(gè)二維、2.5 維、三維和語義任務(wù)中尋找(一階或更高階)遷移學(xué)習(xí)依賴關(guān)系來實(shí)現(xiàn)。其成品是用于任務(wù)遷移學(xué)習(xí)的計(jì)算分類圖。我們研究了這個(gè)結(jié)構(gòu)的成果,比如出現(xiàn)的非平凡相關(guān)關(guān)系,并利用它們減少對(duì)標(biāo)注數(shù)據(jù)的需求。比如,我們展示了解決一組 10 個(gè)任務(wù)所需的標(biāo)注數(shù)據(jù)點(diǎn)總數(shù)可以減少約 2/3(與獨(dú)立訓(xùn)練相比),同時(shí)保持性能幾乎一致。我們提供了一套計(jì)算和探測(cè)這種分類結(jié)構(gòu)的工具,包括一個(gè)求解器,用戶可以用它來為其用例設(shè)計(jì)有效的監(jiān)督策略。
會(huì)后,該論文的第一作者、斯坦福大學(xué)和加州大學(xué)伯克利分校的博士后研究員 Amir Roshan Zamir 告訴機(jī)器之心記者,「這篇論文主要圍繞了當(dāng)前機(jī)器學(xué)習(xí)系統(tǒng)最大的缺點(diǎn),也就是需要很多標(biāo)注數(shù)據(jù)才能完成它們想要的結(jié)果。人類是可以借鑒學(xué)到的不同技能,也就是遷移學(xué)習(xí),你在第一盤棋中學(xué)到的技能可以用到第 10、第 100 盤棋,這篇論文的重點(diǎn)就是將這個(gè)概念帶去機(jī)器學(xué)習(xí)、尤其是在感知(perception)這塊兒?;旧夏阌媚阒皩W(xué)的技能解決新的問題?!?br />
該論文的共同二作,斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的現(xiàn)本科生/準(zhǔn)博士生沈博魁告訴記者,他們的目標(biāo)是找到不同任務(wù)之間的關(guān)聯(lián),這些任務(wù)比如說是深度感知(depth-perception)、surface normal estimation 之類的,發(fā)現(xiàn)這些關(guān)聯(lián)之后就能用更少的數(shù)據(jù)來解決更多的任務(wù)。比如用邊緣檢測(cè)和 surface normal estimation 就能更好地學(xué)深度感知。
最佳學(xué)生論文
本屆大會(huì)的最佳學(xué)生論文(Best Student Paper Award)由來自卡耐基梅隆大學(xué)(CMU)的 Hanbyul Joo、Tomas Simon、Yaser Sheikh 獲得。該研究提出了一種 3D 人體模型,不僅可以追蹤身體的姿勢(shì),還可以追蹤人臉表情和手勢(shì)等微小動(dòng)作。
最佳學(xué)生論文:Total Capture: A 3D Deformation Model for Tracking Faces, Hands, and Bodies
摘要:我們展示了一種用于無標(biāo)記捕捉多尺度人類動(dòng)作(包括人臉表情、身體動(dòng)作和手勢(shì))的統(tǒng)一變形模型(deformation model)。初始模型通過將人體各部位的模型進(jìn)行局部組合來形成,我們稱之為「弗蘭肯斯坦」模型。該模型能夠通過單個(gè)無縫模型完整表達(dá)人體部位的動(dòng)作,包括人臉和手的動(dòng)作。通過對(duì)穿著日常服飾的人們進(jìn)行大規(guī)模數(shù)據(jù)收集,我們優(yōu)化弗蘭肯斯坦模型以創(chuàng)建「亞當(dāng)」(Adam)。亞當(dāng)是校準(zhǔn)模型,它與初始模型具備同樣的基礎(chǔ)層級(jí),但是它可以表現(xiàn)頭發(fā)和衣服的幾何形狀,使之可直接用于查看衣服和人是否相配,就像真的在日常生活中穿了這些衣服一樣。最后,我們展示了這些模型可用于整體動(dòng)作追蹤,同時(shí)捕捉一組人的大規(guī)模身體動(dòng)作和細(xì)微的面部和手部動(dòng)作。
榮譽(yù)提名獎(jiǎng)(Honorable Mention)
論文:Deep Learning of Graph Matching
作者:Andrei Zanfir、Cristian Sminchisescu
論文:SPLATNet: Sparse Lattice Networks for Point Cloud Processing
作者:Hang Su、Varun Jampani、Deqing Sun、Subhransu Maji、Evangelos Kalogerakis、Ming-Hsuan Yang、Jan Kautz
論文:CodeSLAM - Learning a Compact, Optimisable Representation for Dense Visual SLAM
作者:Michael Bloesch、Jan Czarnowski、Ronald Clark、Stefan Leutenegger、Andrew J. Davison
論文:Efficient Optimization for Rank-based Loss Functions
作者:Pritish Mohapatra、Michal Rol′?nek、C.V. Jawahar、Vladimir Kolmogorov、M. Pawan Kumar
除了以上獲獎(jiǎng)?wù)撐?,大?huì)還公布了今年的 PAMI Longuet-Higgins Prize 與 PAMI Young Researcher Award。前者是頒發(fā)給至少 10 年前發(fā)布的論文,而后者是頒發(fā)給 7 年內(nèi)獲得博士學(xué)位且早期研究極為有潛力的研究人員。今年 Longuet-Higgins Prize 的得主為 CVPR 2008 年的論文《A discriminatively trained, multiscale, deformable part model》;PAMI Young Researcher Award 的得主為 Andreas Geiger 與何愷明。
Andreas Geiger 是德國(guó)蒂賓根大學(xué)計(jì)算機(jī)科學(xué)系的教授,自動(dòng)駕駛視覺組成員。今年他們有四篇論文被 CVPR 2018 接收。而另一位獲獎(jiǎng)?wù)吆螑鹈鞔蠹叶急容^熟悉,他于 2016 年 8 月加入 FAIR(Facebook AI Research),擔(dān)任研究科學(xué)家。此前,他曾以第一作者身份拿過兩次 CVPR 最佳論文獎(jiǎng)(2009 和 2016)。
評(píng)論