News Center

Every new move is s step forward.

Newsroom

商汤及联合实验室37篇论文入选ECCV 2018,识别、检测与场景分析等技术获关键突破

2018-09-08 14:09

9月8日-14日,备受瞩目的2018欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,ECCV两年举办一次,与CVPR、ICCV共称为计算机视觉领域三大顶级学术会议,每年录用论文约300篇。根据ECCV 2018宣布的最终结果,商湯科技及聯合實驗室共有37篇論文入選,超過微軟、谷歌、Facebook等科技巨頭。商汤科技ECCV 2018录取论文在以下领域实现突破:大规模人脸与人体识别、物体检测与跟踪、自動駕駛场景理解与分析、视频分析、3D视觉、底层视觉算法、视觉与自然语言的综合理解等。这些新颖的计算机视觉算法不仅有着丰富的应用场景,使得更多的智能视觉算法能应用于日常生活之中,还为后续研究提供了可贵的经验和方向。

例如,商汤入选ECCV 2018论文《人脸识别的瓶颈在于数据集噪声(The Devil of Face Recognition is in the Noise)》中,对于现有人脸数据集中的标签噪声问题进行了深入研究,对MegaFace和MS-Celeb-1M数据集中的噪声特性和来源做了全面的分析,发现干净子集对于提高人脸识别精度效果显著

再如入选论文《量化模仿-训练面向物体检测的极小CNN模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》,本文提出一种简单而通用的框架—量化模仿,来训练面向物体检测任务的极小CNN模型。作者提出联合模仿与量化的方法来减小物体检测CNN模型的参数量实现加速。在有限计算量的限制下,该框架在Pascal VOC和WIDER Face数据集的物体检测性能均超越了当前物体检测的先进水平。

而在几个月前举行的CVPR 2018会议上,商汤科技、香港中文大学-商汤科技联合实验室以及其他商汤科技联合实验室共有44篇论文中稿,商湯科技今年累計入選計算機視覺頂會論文數量達到81篇!

商汤科技联合创始人、商汤研究院院长王晓刚表示:商汤始终坚持对原创技术的极致追求,正是这种精益求精的精神让商汤在诸多计算机视觉前沿技术领域上不断取得新突破,也在行业应用方面全面落地。本次会议,华人入选ECCV 2018 的论文数量非常抢眼,近年来华人学者们对原创研究孜孜不倦的坚守,铸就CV技术领域的一股新力量。

参加COCO 2018和VOT 2018均夺冠

商湯原創技術的不斷進步也在重要的比賽中得到驗證。在2018年的COCO比賽中,商湯科技研究員和香港中文大學-商湯聯合實驗室同學組成的團隊,在核心的物體檢測(Detection)項目中奪得冠軍。 

在此次競賽中,商湯團隊創造性地開發了三項全新的技術,獲得了大幅度的性能提升:

(1)新的多任务混合级联架构(hybrid cascade)。通过把不同子任务进行逐级混合,这种新架构有效地改善了整个检测过程中的信息流动。

(2)通過特征導引産生稀疏錨點,而不是使用傳統的規則分布的密集錨點。這種特征導引的方案使得錨點的投放更爲精准,平均召回率提升了超過10個百分點。

(3)采用一種新型的FishNet網絡結構,它有效地保留和修正多個尺度的信息,能更有效地用于圖像級,區域級,以及像素級預測任務。

在test-dev上,商汤团队对上述框架进行了全面测试,其中单模型和多模型(最终提交的结果来自于五个模型混合的框架)的mask AP分别达到了47.4% 和49.0%,比去年冠军(也是商汤团队获得)的结果,44.0% 和46.3%,有约3个百分点的明显提高。 在传统的基于检测框的指标bbox AP上,这个新的框架也分别达到了单模型54.1%和多模型的56.0%的性能,比去年冠军的结果,50.5%和52.6%,也有较大的提升。

值得一提的是,为了推动视觉检测技术的进一步发展,在ECCV期间,香港中文大学-商汤联合实验室还开源了检测库mm-detection(https://github.com/open-mmlab/mmdetection)。这个开源库提供了已公开发表的多种视觉检测核心模块。通过这些模块的组合,可以迅速搭建出各种著名的检测框架,比如Faster RCNN,Mask RCNN,和R-FCN等,以及各种新型框架,从而大大加快检测技术研究的效率。

此外,商汤科技团队还参加了视觉目标跟踪大赛VOT Challenge,并在实时跟踪项目获得第一名,这一成绩体现了商汤在视觉目标跟踪技术的新突破。

VOT Challenge是视觉目标跟踪领域一年一度的国际权威比赛,其为跟踪领域提供了精细的数据标注和评测方式,并在2017年引入了实时比赛:被评测算法在跟踪物体的同时必须保持至少60fps跟踪速率,来模拟现实场景中的跟踪情况。

今年的VOT 2018在ECCV 2018期间举办,共有72只队伍参赛,包括微软亚洲研究院、牛津大学等知名企业与高校。商汤科技的参赛算法能够在60FPS的速率下获得精确的跟踪结果,并且在其他两项项目(普通跟踪和长时跟踪)也获得了骄人的成绩。

举办新型大赛 推动人工智能行业发展

商湯不止于在頂級計算機視覺大賽上獲得好成績,還致力舉辦行業大賽,制定行業標准,推動人工智能行業發展。

今年8月,商汤科技携手香港中文大学、亚马逊、南洋理工大学、悉尼大学联合举办的首届WIDER Face and Pedestrian Challenge 2018(简称:WIDER Challenge)挑战赛获得圆满成功。作为一项全新的全球顶级计算机视觉竞赛,共吸引来自世界各国超过400支队伍报名。

商汤作为主办方制定了全新标准数据集——WIDER Face人脸检测数据集、WIDER Pedestrian专门用于行人检测的大规模数据集和WIDER Person Search人物检索数据集,促进高性能算法涌现。

未來,商湯將繼續賦能AI創新大賽,加速推進以人工智能爲核心的創新技術,帶動行業應用和産業融合的持續深入。