视觉问答（Visual Question Answering，VQA），是一种涉及计算机视觉和自然语言处理的学习任务，系统对视频及图像的内容和问题进行深度理解和推理后，给出相应的回答，相比于其他视频分析手段，视频问答能根据用户的提问，对视频内容进行细粒度语义理解。在面对复杂视频时可有效过滤冗余信息，方便用户进行决策。视频问答被广泛应用在社交媒体监管、智能监控分析、国防智能决策、智慧视频教育等多个领域，本报告将介绍团队近年来在视觉问答方面所作的研究工作。

主讲人简介：

俞俊，教授、博士生导师，杭州电子科技大学计算机学院常务副院长，教育部长江学者青年学者，“复杂系统建模与仿真”教育部重点实验室主任。浙江省民盟省委委员，浙江省民盟青年委员会主任。主要研究图像处理与机器学习，主持国家自然科学基金优秀青年基金、国家自然科学基金重点基金等项目。已发表国际学术论文100余篇，已申请发明专利20余项，目前担任Pattern Recognition, Information Sciences, Neurocomputing等刊物的副主编。

打印: