当前位置:主页 > 便民网 >

何恺明!再斩ICCV 2017最佳论文

作者:admin 来源:未知 更新日期:2018-06-14 12:01

夏乙 若朴 发自 凹非寺量子位 出品 | 公众号 QbitAI

何恺明第三次斩获顶会最佳论文!

昨天下午,ICCV 2017最佳论文公布。

何恺明为一作的Mask R-CNN论文,不负众望获得最佳论文(Marr Prize)。

另外,何恺明参与的另一篇论文:Focal Loss for Dense Object Detection,也被大会评为最佳学生论文。

作为计算机视觉领域的顶级会议,ICCV 2017共收到2143篇论文投稿,其中621篇被选为大会论文(入围比例29%),其中56篇亮点报告(Spotlight),45篇口头报告(Oral)。

本次ICCV 2017大会,参会人数再创新高,达到3107名。在30年ICCV大会历史上,堪称火爆出奇的一届。

从参会人数上来看,来自美国的最多,达到749人;来自中国的次之,达到362人。排进前五的还包括:德国(274人)、韩国(229人)、英国(218人)。

Mask R-CNN简史

还是得详细说一说Mask R-CNN。

这篇论文主要解决的是“实例级的”对象分割,也就是把照片中的人、动物等对象,一个一个地从图像中检测出来,并同时为每个对象实例生成一个高质量分割遮罩。

根据Mask R-CNN论文中所写的,这个算法在COCO数据集的三类任务上,Mask R-CNN都取得了顶尖的成绩,包括实例分割、边界框对象检测、以及人体关键点检测。不用任何trick,Mask R-CNN在所有任务上的性能都超越了全部现有单一模型算法,包括COCO 2016的获胜者。

获得Best Paper的消息传出之后,知乎就热闹了起来,不少同行都到Faster R-CNN相关问题下表示盼望开源代码已经判了半年。

所以,量子位就不多介绍论文内容了,认真好学但是还没读过这篇论文的朋友看这里:https://arxiv.org/abs/1703.06870

论文Preprint版今年3月在arXiv上公开后,得到了同行们的广泛认可。

比如说上学期斯坦福大学李飞飞的计算机视觉课CS231n,就在今年5月份的图像检测和分割一节里,介绍了Mask R-CNN。

再比如MIT在7月份CVPR 2017上主办的“将深度学习用于对象和场景”Tutorial,还邀请论文作者之一Ross Girshick到现场做了演讲。Girshick讲的主要内容,就是Mask R-CNN。何恺明也去了,他分享了图像识别相关的内容,涉及经典的ResNet以及CVPR 2017上发表的ResNeXt。

Mask R-CNN摘取胜利的果实时,并不是站在地上,而是站在巨人的肩膀上,而这个“巨人”,叫做Faster R-CNN,作者也包括何恺明自己,和我们前边提到的Ross Girshick。

Ross Girshik也是Facebook的研究员,江湖人称RBG大神。他和何恺明第一次合作写论文的时候,何恺明还是微软亚洲研究院员工,而RBG也还在Redmond微软研究院工作。他们,以及任少卿、孙剑的合作成果,就是Faster R-CNN。

在这之前,RBG已经长期在探索用CNN做对象检测,并发表了两篇论文,提出了R-CNN和Fast R-CNN算法。这个系列虽然历史不长,却已经成了谈CNN图像分割绕不开的经典,量子位之前也发布过相关文章。

对于与何恺明的合作,RBG大神表示非常满意,至少对美国和北京之间的时差很满意。( ̄▽ ̄)”他说俩人加一起,每天可以高效工作24小时。

论文还没写完,RBG就跳槽到了Facebook AI研究院。而何恺明,在微软亚洲研究院和老朋友张翔宇、任少卿、孙剑一起,完成了后来甚至被称为图像识别算法顶峰的ResNet。

第二年,何恺明也加入了Facebook,搬到了太平洋对岸的加州门罗帕克。

何恺明和RBG大神之间的时差,顿时从12小时缩短到了几乎没有,不过好在,他们之间依然合作愉快,也就有了今年的Mask R-CNN。

传奇何恺明

ICCV 2017绝不是何恺明唯一的高光时刻。

或者说,他一路以来都似乎在以“开挂”的模式前进。

2003年,何恺明以高考满分的成绩,摘得广东高考状元。不过在高考之前,何恺明已经被保送清华。

在当年的报道中,何恺明谈到学习秘诀时说:“不知道啊,很多人都问过这个问题,但(自己)一直都不太清楚,可能是(自己)悟性好”。谈到高考后的计划,何恺明说:去桂林旅游。

直到现在,何恺明的微博上还有不少他在各地的留影,俨然一副旅游博主的感觉。

插播一句,当年与何恺明同为广东高考满分状元的还有王俊煜等人。当年王俊煜在接受采访时,谈到了自己对杂志的喜好。

2007年,尚未本科毕业的何恺明以实习生身份,进入微软亚洲研究院(MSRA)。在孙剑的指导下开始研究工作。

尝试很多方向未果之后,有天何恺明打游戏时,受到雾气场景启发,认为存在一种方法可以去除图像中的雾气。

运气和实力再次眷顾了何恺明,他很快找到简单高效的处理办法。但孙剑要求何恺明继续研究,找到成功背后的本质原因。最后何恺明写出了论文Single Image Haze Removal Using Dark Channel Prior。

最终,何恺明的这篇论文被评为CVPR 2009最佳论文。这也是中国人首次获得这一奖项。这篇论文的另外两名作者是:孙剑、汤晓鸥。

本科毕业后,何恺明进入香港中文大学读研。期间继续在微软亚洲研究院参与研究。2015年,何恺明所在的团队凭借图像识别深度残差学习(Deep Residual Learning for Image Recognition)在ImageNet上傲视群雄。

随后这篇论文被CVPR 2016评为最佳论文。这篇论文的作者还包括:张祥雨、任少卿、孙剑。

随后残差网络(ResNets)也在AI领域得到了广泛的应用,包括机器翻译、语音合成、语音识别,以及最新的AlphaGo Zero(相关报道)。

如上所述,去年8月何恺明加入Facebook人工智能研究院(FARI)。

获奖论文详情

最后,再小结下ICCV 2017的奖项。

最佳论文

Mask R-CNN

作者:何恺明、Georgia Gkioxari、Piotr Dollár、Ross Girshick

地址:https://arxiv.org/abs/1703.06870

最佳学生论文

Focal Loss for Dense Object Detection

作者:Tsung-Yi Lin、Priya Goyal、Ross Girshick、何恺明、Piotr Dollár

地址:https://arxiv.org/abs/1708.02002

提名奖(Honorable mentions)

First Person Activity Forecasting with Online Inverse Reinforcement Learning

作者:Nicholas Rhinehart、Kris M. Kitani

地址:https://www.cs.cmu.edu/~nrhineha/darko.html

Open Set Domain Adaptation

作者:Pau Panareda Busto、Juergen Gall

地址:http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_opensetdomain_iccv17.pdf

Globally-Optimal Inlier Set Maximisation for Simultaneous Camera Pose and Feature Correspondence

作者:Dylan Campbell、Lars Petersson、Laurent Kneip、Hongdong Li

地址:https://arxiv.org/abs/1709.09384

OMT

这次ICCV 2017也有一众中国企业赞助。

白金赞助商包括:百度、滴滴、美图、商汤、腾讯优图。白银赞助商包括:360、中科视拓、北京文安。

相关文章:

隐私保护 版权所有 法融在线 Copyright ©2016 http://www.forumelektrik.com All Rights Reserved