您当前所在的位置: 网站首页 -> 学术科研 -> 正文

【计算机|学术活动】3044am永利集团3044noc举办“视觉-语言导航研究进展与未来趋势”工程大师讲坛

发布日期:2024-12-01   来源:3044am永利集团3044noc   点击量:

3044am永利集团3044noc

工作信息

2024年 第82

        


2024年11月29日,3044am永利集团3044noc邀请中科院自动化所黄岩副研究员进行了“工程大师讲坛”讲座,主题为“视觉-语言导航研究进展与未来趋势”。

黄岩副研究员就职于中科院自动化所,国家优青,研究方向为多模态理解和视频分析。在相关领域的国内外期刊和会议上发表论文共计100余篇,曾获国内外学术会议最佳论文奖3项、国内外主流竞赛冠军4项,担任IEEE TIP编委、CVPR领域主席、10次国内外主题研讨会的组织主席。曾获得中国图象图形学学会青年科学家奖、中国科学院经理特别奖、NVIDIA创新研究奖等。曾受邀在国内外20多个主流会议学术论坛上报告研究进展。

    在当前计算机视觉、自然语言理解和机器人等交叉领域,视觉-语言导航是近年来兴起的新兴研究方向。从2018年开始,该方向逐步经历了离散环境、连续环境和开放环境等一系列由易到难的发展阶段,最终逐渐接近实际应用场景设定。因此,本报告首先分阶段回顾视觉-语言导航方向的发展过程,并对其中重要的典型方法进行简要介绍然后分享本团队在视觉-语言导航方面的代表性工作,并简要展望未来发展趋势。

黄岩老师首先为大家进行了视觉-语言导航技术的背景介绍,并重点介绍了其在人形机器人、军事国防与生产制造领域的重要应用价值,随后黄岩老师介绍了视觉-语言导航技术面临的主要挑战,让大家在清晰了解视觉-语言导航技术作用的同时,对视觉-语言导航面临的挑战亦有了明确的认识。

      随后,黄岩老师从离散场景、连续场景以及开放场景三方面着手说明了视觉-语言导航技术的研究进展。让同学们对视觉-语言导航的原理、方法以及应用等有了更进一步的概念,使大家拓宽了科研、教学与应用的思路,不局限于纯计算机方面的工作,其在各项人工智能领域的重大理论研究与应用价值亦需进行充分的研究与挖掘。

接下来,黄岩老师从积累知识的视觉语言导航以及边走边学的视觉语言导航两方面介绍了团队在视觉语言导航领域的研究工作与最新进展。黄岩老师耐心细致地对发表于国际顶级学术会议的研究工作进行了深入浅出的讲解,通过完整的讲解脉络来帮助大家理清所提出方法的设计动机、运行原理、实验验证等各项问题,让大家获益匪浅。

最后,黄岩老师对视觉语言导航技术未来的发展趋势与方向进行了预测。黄岩老师以生动的讲解和现场展示、丰富的应用案例,给大家提供了一个丰富而又精彩的报告,不但使大家对视觉-语言导航有了更深入的了解,而且对以后计算机视觉领域的科研工作也很有帮助。

同学和老师们对报告会的内容十分感兴趣,积极提问,与黄老师针对有关视觉-语言导航领域的相关问题展开了讨论。通过本次报告会,到场的各位同学得到了深入的启发,开阔了视野,更深入全面地了解了视觉-语言导航这个领域。最后,黄老师给在场的各位寄予深深的勉励,希望大家能够更多地参与到计算机视觉与人工智能的研究与应用,为人工智能的发展贡献力量。


主办单位:教务处 教师教学发展中心 3044am永利集团3044noc

2024年12月2日