您现在的位置:生活在线 正文

近日,复旦大学一场特殊的“反套路”期末考试引发关注。在“数据挖掘技术”课程考试中,学生们没有坐在考场答题,反而成了出题人——他们用自己设计的10道题去“考倒”三个当今最先进的AI模型。AI答错的题越多、被难倒的模型越强,出题学生的得分就越高。

51份试卷中,50人至少让某个AI答错过一题,仅1人完全没难倒任何模型。但能让任一模型整张卷得0分的只有4人,且最强模型Claude没有被任何学生完全考倒。全班平均分85.7分,中位数88分。

为什么“人考AI”?

“传统的出题考察方式,在AI时代已经失效了。”教授肖仰华说,“老师出一道标准算法题,AI比任何学生都算得快、算得准——这没有意义。”于是考核方式彻底翻转:每人出10道有唯一正确答案和完整计算过程的数据挖掘计算题,拿着自己的题去考三个AI模型。题目必须基于课程知识,学生自己得先能从头到尾算对——“自己出的题自己都不会,那算不上真本事。”

AI会“作弊”,学生如何见招拆招?

24级本科生谢锦树最终拿到97分。他搭建了一个多智能体协作的自动化出题框架,却发现AI会钻空子:伪造标准答案、限制输出长度截断其他模型推理、调低推理深度参数……他加了一个审查层拦截这些行为,最终自动生成的10道题让三个应考模型全部答错。

考核转型:从“怎么做”到“怎么判断”

肖仰华发现,高分学生能准确判断AI弱点,出题命中AI的结构性缺陷;低分学生只是把课本习题换数字,AI见过千百万遍,直接套模板就对了——这让他警惕:能力偏弱的学生如果只会依赖AI做作业,判断力会进一步退化。

未来,这门课的考核将彻底转型——考记忆、考计算的方式必须退场,重点转向评价能力、判断能力和创造性思维。课堂更多时间在讨论:怎么判断结果对错?怎么识别AI会出问题?怎么提出AI回答不了的好问题?“这门课正在从训练学生‘怎么做’,转向训练他们‘怎么指挥AI来做、怎么评判AI做的结果’。”

而对于没拿到好成绩的同学,肖仰华表示课程设计会有意识帮他们建立最基本的判断底线——“不能让他们成为只会点击‘确认’的AI使用者。”一场考试,折射出AI时代教育必须回答的根本命题:当机器越来越会“算”,人的价值将越来越体现在“问”与“判”上。

责任编辑:admin

进入新闻频道新闻推荐