
讲座预告:Evaluation Foundation For Model Editing
1、报告人: 孙飞(中国科学院计算技术研究所 副研究员)
2、报告题目: Evaluation Foundation For Model Editing
3、报告时间: 12月24日(周三) 14:00
4、报告地点: 柏彦大厦F12会议室1
5、邀请人: 张海楠
6、报告摘要: 模型编辑(Model Editing)旨在以低成本、可控的方式对大语言模型中的知识进行更新,是应对知识时效性与安全治理问题的重要技术路径。尽管近年来该方向在多个标准基准上取得了显著性能提升,但相关方法在实际应用场景中往往不尽如人意。本报告回顾并分析现有模型编辑评估范式,指出当前评估体系在任务构造、指标设计与实验设置等方面存在的若干问题,例如对 locality 指标的过度依赖以及 teacher forcing 机制的不合理使用。通过实证分析,我们揭示了基准评估与真实应用表现之间的系统性失配,并提出了更具现实相关性的评估思路,为模型编辑研究的可持续发展提供更加稳健的评估基础。
7、主讲人介绍:

孙飞 中国科学院计算技术研究所
孙飞,中科院计算所副研究员,硕士生导师,主要研究方向为推荐系统、自然语言处理和人工智能安全。近年来,在ACL、ICML、NeurIPS等国际顶级期刊会议发表论文70余篇,Google Scholar引用11000余次。连续入选Stanford全球前2%科学家,论文多次入选谷歌学术刊物指标榜单,获国际顶会RecSys 2019最佳长文提名奖、KnowFM@ACL2025 workshop最佳论文奖。长期担任NeurIPS、ICML、ACL、TACL等顶级学术期刊会议领域主席与评委。