2019年学术报告之十五——视觉问答-利用深度学习沟通视觉与语言

作者:admin时间:2019-11-12 浏览:141

主  题:视觉问答-利用深度学习沟通视觉与语言

时  间:11月14日(周四)下午15:30-16:30

主讲人:俞俊 教授、博士生导师

地  点:英超买球平台31-903

报告简介:

视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务,系统对视频及图像的内容和问题进行深度理解和推理后,给出相应的回答,相比于其他视频分析手段,视频问答能根据用户的提问,对视频内容进行细粒度语义理解。在面对复杂视频时可有效过滤冗余信息,方便用户进行决策。视频问答被广泛应用在社交媒体监管、智能监控分析、国防智能决策、智慧视频教育等多个领域,本报告将介绍团队近年来在视觉问答方面所作的研究工作。

主讲人简介:

    俞俊,教授、博士生导师,杭州电子科技大学计算机学院常务副院长,教育部长江学者青年学者,“复杂系统建模与仿真”教育部重点实验室主任。浙江省民盟省委委员,浙江省民盟青年委员会主任。主要研究图像处理与机器学习,主持国家自然科学基金优秀青年基金、国家自然科学基金重点基金等项目。已发表国际学术论文100余篇,已申请发明专利20余项,目前担任Pattern Recognition, Information Sciences, Neurocomputing等刊物的副主编。


打印: