生成式人工智能模型安全技术研究

报告题目：生成式人工智能模型安全技术研究

报告人：谢洪涛中国科学技术大学教授/博导

报告时间：2026年4月28日 14:30

报告地点：先进技术中心513会议室

报告对象：感兴趣的教师、学生等

主办单位：伟德国际bevictor1946、科教融合人工智能学院

报告人简介：

谢洪涛中国科学技术大学教授、博士生导师。主要研究方向包括人工智能和多媒体内容安全等，以第一或通讯作者在国际一流期刊和会议上发表学术论文100余篇，担任ACM TOMM等四个国际著名期刊编委。主持科研项目10余项，含国家重点研发计划重点专项项目1项、国家自然科学基金联合重点项目2项。获2023年度国家技术发明奖二等奖、2019年度国家自然科学奖二等奖、2022年度中国图象图形学学会青年科学家奖等奖励。

报告摘要:

本报告从生成内容安全与模型版权保护两个维度出发，探索解决生成式人工智能面临的有害信息防控、生成行为约束与知识产权保护三方面的问题，通过研究基于负偏好优化的精准概念擦除、多模态大模型输出内容安全对齐和跨模型架构的鲁棒语义水印嵌入，以提升生成式人工智能模型的可控性、防御性和通用性。

网站首页

伟德概况

组织机构

本科生教育

研究生教育

师资队伍

学科与科研

党建园地

伟德国际

校友之家

招贤纳士

ENGLISH

生成式人工智能模型安全技术研究