报告题目:生成式人工智能模型安全技术研究
报告人:谢洪涛 中国科学技术大学教授/博导
报告时间:2026年4月28日 14:30
报告地点:先进技术中心513会议室
报告对象:感兴趣的教师、学生等
主办单位:伟德国际bevictor1946、科教融合人工智能学院
报告人简介:
谢洪涛 中国科学技术大学教授、博士生导师。主要研究方向包括人工智能和多媒体内容安全等,以第一或通讯作者在国际一流期刊和会议上发表学术论文100余篇,担任ACM TOMM等四个国际著名期刊编委。主持科研项目10余项,含国家重点研发计划重点专项项目1项、国家自然科学基金联合重点项目2项。获2023年度国家技术发明奖二等奖、2019年度国家自然科学奖二等奖、2022年度中国图象图形学学会青年科学家奖等奖励。
报告摘要:
本报告从生成内容安全与模型版权保护两个维度出发,探索解决生成式人工智能面临的有害信息防控、生成行为约束与知识产权保护三方面的问题,通过研究基于负偏好优化的精准概念擦除、多模态大模型输出内容安全对齐和跨模型架构的鲁棒语义水印嵌入,以提升生成式人工智能模型的可控性、防御性和通用性。