前沿讲堂 | Evaluation Foundation For Model Editing-北京航空航天大学未来区块链与隐私计算北京高精尖创新中心

当前位置：首页 -> 新闻中心 -> 正文

前沿讲堂 | Evaluation Foundation For Model Editing

来源：作者：发布时间：2025-12-23 浏览次数：次

讲座预告：Evaluation Foundation For Model Editing

1、报告人：孙飞（中国科学院计算技术研究所副研究员）

2、报告题目： Evaluation Foundation For Model Editing

3、报告时间： 12月24日（周三） 14:00

4、报告地点：柏彦大厦F12会议室1

5、邀请人：张海楠

6、报告摘要：模型编辑（Model Editing）旨在以低成本、可控的方式对大语言模型中的知识进行更新，是应对知识时效性与安全治理问题的重要技术路径。尽管近年来该方向在多个标准基准上取得了显著性能提升，但相关方法在实际应用场景中往往不尽如人意。本报告回顾并分析现有模型编辑评估范式，指出当前评估体系在任务构造、指标设计与实验设置等方面存在的若干问题，例如对 locality 指标的过度依赖以及 teacher forcing 机制的不合理使用。通过实证分析，我们揭示了基准评估与真实应用表现之间的系统性失配，并提出了更具现实相关性的评估思路，为模型编辑研究的可持续发展提供更加稳健的评估基础。

7、主讲人介绍：

孙飞中国科学院计算技术研究所

孙飞，中科院计算所副研究员，硕士生导师，主要研究方向为推荐系统、自然语言处理和人工智能安全。近年来，在ACL、ICML、NeurIPS等国际顶级期刊会议发表论文70余篇，Google Scholar引用11000余次。连续入选Stanford全球前2%科学家，论文多次入选谷歌学术刊物指标榜单，获国际顶会RecSys 2019最佳长文提名奖、KnowFM@ACL2025 workshop最佳论文奖。长期担任NeurIPS、ICML、ACL、TACL等顶级学术期刊会议领域主席与评委。