南京大学计算机科学与技术系软件新技术与产业化协同创新中心
摘 要:
高分辨率的表示学习对于位置敏感的视觉问题而言是非常必要的,例如人体姿态估计、语义分割和物体检测等。当今性能较为领先的算法框架普遍都是先将输入图像通过由一系列高分辨到低分辨的卷积模块构成的子网络(例如ResNet\VGGNet等),得到一个空间分辨率很低的特征表达,然后从这个低分辨的表达去恢复高分辨率表达。与之不同,本次报告介绍的框架HRNet,可以在算法处理的整个流程中都保持高分辨率,其中有两个关键的要素:1)将高分辨到低分辨的卷积模块平行化处理;2)在网络中间不同分辨率的表达之间不断重复地交换信息。通过HRNet得到的特征表达在语义上更加丰富,在空间上也更加准确。HRNet在人体姿态估计、语义分割和问题检测等视觉问题上都取到了显著的性能提升,代码已在GitHub开源https://github.com/HRNet。
报告人简介:
王井东,微软亚洲研究院首席研究员,国际模式识别学会会士。担任或曾担任过CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM 等人工智能会议的领域主席或高级程序委员会委员。现为IEEE 汇刊 IEEE TPAMI, IEEE TCSVT和IEEE TMM的编委会成员曾获得ACM
MM 2015最佳论文提名。其研究成果10多次转化到微软的关键产品和服务中。主要从事计算机视觉、深度学习及多媒体等领域的研究,包括神经网络结构的设计、行人姿势估计、图像分割、目标检测以及多媒体搜索等。
时间:9月24日(星期二) 15:00
地点:计算机科学技术楼230室
|