6月18日下午,应伟德国际bevictor1946邀请,伦敦城市圣乔治大学Senior Lecturer朱睿博士来学院开展学术交流,并作题为Efficient Fine-Tuning of Vision-Language Models的学术报告。报告会由学院副院长薛伟主持,学院相关研究方向教师、在校硕士生(含国际硕士生)参加活动。
报告中,朱睿博士首先结合当下多模态人工智能领域研究现状,介绍了视觉语言模型的优化微调技术。她表示,以CLIP为核心的预训练视觉语言模型,已在各类视觉识别任务中展现出优异的泛化性能,但在实际应用中,将大型预训练模型迁移适配至各类下游任务仍具有挑战性。随后,朱睿博士重点分享了其团队在视觉语言模型高效微调领域的两项最新研究成果,一是通过基于岭回归的对齐方法,同时增强同模态一致性和跨模态交互,并减少可学习参数的数量;二是基于批内相似性的转导式适配器,利用同一批次中未标注查询样本之间的关系提升测试阶段的泛化能力。整场报告内容充实,在交流环节,与会师生结合各自科研实际,进行了深入探讨。



此次学术交流活动不仅加深了我院师生对多模态大模型高效微调前沿技术的理解,也为我院与伦敦大学圣乔治学院在计算机视觉领域开展进一步的学术交流奠定了基础。
其间,朱睿博士围绕高水平学术论文的撰写技巧与参会教师进行了探讨与经验分享。
(撰稿:孟頔 审核:薛伟 夏玉钦)