一、个人简介
清华大学自动化系长聘副教授,博士生导师,国家杰出青年科学基金获得者,IAPR Fellow,国际期刊Pattern Recognition Letters主编,研究领域为计算机视觉、模式识别、无人系统。在PAMI、CVPR、ICCV、ECCV上发表论文130余篇,主持国家重点研发计划课题、基金委联合重点基金、优秀青年基金等项目,获中国电子学会自然科学一等奖(排名1)、中国自动化学会高等教育教学成果一等奖(排名3)等奖励。担任国际期刊IEEE T-IP、T-CSVT和T-BIOM编委,国际会议ICME2022大会主席,FG2023、VCIP2022和ICME2020程序委员会主席,中国计算机学会计算机视觉专委会、中国人工智能学会模式识别专委会、中国自动化学会模式识别与机器智能专委会、中国图象图形学学会视觉大数据专委会常务委员。
二、报告内容
题目:视觉基础模型及应用
摘要:基础模型是人工智能领域的研究热点,在计算机视觉和自然语言处理等领域中均取得了优异的性能,是视觉监控、自动驾驶、智能终端等重要应用的支撑性技术。报告将从模型架构和学习范式两个方面回顾视觉基础模型近年来的研究进展,同时介绍清华大学智能视觉实验室在视觉基础模型方面所开展的一些工作,主要包括高阶交互模型、动态稀疏模型、全局滤波模型、球面分形模型等,以及它们在目标检测与分割、物体分类与识别、图像与视频检索、三维重建与理解等视觉任务中的应用。