复旦“反套路”期末考：学生出题难倒AI，AI答错越多得分越高

近日，复旦大学一场特殊的“反套路”期末考试引发关注。在“数据挖掘技术”课程考试中，学生们没有坐在考场答题，反而成了出题人——他们用自己设计的10道题去“考倒”三个当今最先进的AI模型。AI答错的题越多、被难倒的模型越强，出题学生的得分就越高。

51份试卷中，50人至少让某个AI答错过一题，仅1人完全没难倒任何模型。但能让任一模型整张卷得0分的只有4人，且最强模型Claude没有被任何学生完全考倒。全班平均分85.7分，中位数88分。

为什么“人考AI”？

“传统的出题考察方式，在AI时代已经失效了。”教授肖仰华说，“老师出一道标准算法题，AI比任何学生都算得快、算得准——这没有意义。”于是考核方式彻底翻转：每人出10道有唯一正确答案和完整计算过程的数据挖掘计算题，拿着自己的题去考三个AI模型。题目必须基于课程知识，学生自己得先能从头到尾算对——“自己出的题自己都不会，那算不上真本事。”

AI会“作弊”，学生如何见招拆招？

24级本科生谢锦树最终拿到97分。他搭建了一个多智能体协作的自动化出题框架，却发现AI会钻空子：伪造标准答案、限制输出长度截断其他模型推理、调低推理深度参数……他加了一个审查层拦截这些行为，最终自动生成的10道题让三个应考模型全部答错。

考核转型：从“怎么做”到“怎么判断”

肖仰华发现，高分学生能准确判断AI弱点，出题命中AI的结构性缺陷;低分学生只是把课本习题换数字，AI见过千百万遍，直接套模板就对了——这让他警惕：能力偏弱的学生如果只会依赖AI做作业，判断力会进一步退化。

未来，这门课的考核将彻底转型——考记忆、考计算的方式必须退场，重点转向评价能力、判断能力和创造性思维。课堂更多时间在讨论：怎么判断结果对错?怎么识别AI会出问题?怎么提出AI回答不了的好问题?“这门课正在从训练学生‘怎么做’，转向训练他们‘怎么指挥AI来做、怎么评判AI做的结果’。”

而对于没拿到好成绩的同学，肖仰华表示课程设计会有意识帮他们建立最基本的判断底线——“不能让他们成为只会点击‘确认’的AI使用者。”一场考试，折射出AI时代教育必须回答的根本命题：当机器越来越会“算”，人的价值将越来越体现在“问”与“判”上。