AI检测软件误判频发,学生为自证清白录屏数小时、保存编辑记录。诚信学子陷入焦虑,学术环境因AI作弊风波而扭曲。

23岁的 Leigh Burrell 是休斯敦市区大学计算机科学专业的二年级学生。开学几周后,她收到一条令人心跳骤停的通知:在一门必修写作课上,她的一篇模拟求职信作业被判零分,理由是教授怀疑她用人工智能聊天机器人代写。“我心跳都停了,”她回忆道。然而,《纽约时报》查阅的谷歌文档编辑历史显示,她花了两天时间起草和修改这篇作业。尽管如此,Turnitin 公司提供的反剽窃服务仍将其标记为人工智能生成文本。

为了挽回成绩,Burrell 陷入了一场漫长的申诉。她向英语系主任提交了一份15页的PDF,包含带时间戳的截图和写作过程笔记,最终才恢复了分数。这场风波让她深刻体会到,即使是诚实的学生,在人工智能作弊阴影笼罩的学术环境中,也可能步履维艰。下一次提交作业时,她上传了一段93分钟的YouTube视频,记录自己的写作全过程。“这很烦人,但为了安心,我必须这么做,”她说,语气中透着无奈。

人工智能工具如ChatGPT正在重塑教育生态。根据皮尤研究中心去年的调查,26%的青少年承认曾用ChatGPT完成作业,这一比例是前一年的两倍。学生用人工智能撰写文章、解决编程问题,迫使教师们四处寻找对策。然而,人工智能滥用及其不完善的检测系统,也让守规矩的学生深受其害。高中生、大学生和研究生在采访中坦言,他们常担心自己的原创作业被误判为人工智能生成,面临严重的学术后果。

为了自保,一些学生采取了近乎自我监控的极端措施。他们在做作业时录制数小时的屏幕视频,或刻意使用能详细记录按键历史的文字处理器。18岁的旧金山高三学生 Sydney Gill 分享了自己的经历:2023年末,她参加写作比赛的一篇文章被误判为人工智能生成。此后,她在撰写大学申请文书时总是疑神疑鬼。“这不算改变人生,但绝对影响了我未来的写作方式,”她感叹。

研究进一步印证了学生们的担忧。《华盛顿邮报》和《彭博商业周刊》报道,人工智能检测软件近年来成为热门行业,却常常误判原创作品。马里兰大学的研究人员测试了12款检测服务,发现它们平均有6.8%的时间错误地将人类文本标记为人工智能生成。研究作者、计算机科学副教授 Soheil Feizi 直言:“目前的检测器尚未成熟到可用于学校检测人工智能剽窃。” Turnitin 公司2023年承认,其软件误判人类句子的概率约为4%。OpenAI 的一款检测程序因9%的误判率,仅运行六个月便被终止。

学生们开始反抗。29岁的 Kelsey Auman 在布法罗大学公共卫生硕士项目毕业前一个月,被告知三份作业被 Turnitin 标记为人工智能生成。她联系了20人班级中的其他同学,发现五人收到类似通知,其中两人毕业被延误。Auman 惊恐自己可能无法按时毕业。她在ChatGPT普及前就完成了本科学习,从未想过要为自证清白而囤积证据。“你以为只要认真完成作业就没事,直到发现并非如此,”她说。经过与教授面谈和与学术诚信办公室的长篇邮件往来,她最终顺利毕业,未被指控学术不端。

Auman 发起的在线请愿书呼吁布法罗大学停用人工智能检测服务,已有超千人签名。她担心检测软件可能因“算法规范”以外的理由,错误惩罚非英语母语学生的作品。斯坦福大学2023年的研究发现,人工智能检测服务更容易误判非英语母语者的文本,尽管 Turnitin 对此提出异议。布法罗大学发言人 John Della Contrada 表示,学校不会因请愿而停用 Turnitin,但强调不会仅依赖检测软件判定学术不端,并保障学生的申诉权和初犯的补救机会。

一些学校已放弃人工智能检测功能。加州大学伯克利分校、范德堡大学和乔治城大学均因可靠性问题停用 Turnitin 的人工智能检测。伯克利教学与学习中心执行主任 Jenae Cohn 指出:“过度依赖技术可能损害师生关系,而非助力。”休斯敦市区大学则警告教师,Turnitin 等剽窃检测工具“结果不一致,易被误用”,但仍允许使用。

教师也在适应这一复杂局面。加州萨克拉门托科苏姆内斯河学院的教授 Kathryn Mayo 起初对 Copyleaks 和 Scribbr 的人工智能检测工具寄予厚望,以为能轻松应对学生作弊。然而,当她将自己的写作输入检测后,竟被判定部分由人工智能生成。“我尴尬极了,”她坦言。此后,她调整作业要求,增加个性化元素,希望降低学生用ChatGPT代写的可能性。面对疑似作弊的学生,她选择温和对话,了解写作过程。有时学生会羞涩承认作弊,有时则直接退课。

人工智能的普及让学术诚信变得前所未有地复杂。学生为自证清白疲于奔命,教师在信任与怀疑间摇摆,而检测工具的误判则让局面雪上加霜。正如 Burrell 所说:“我只是想好好学习,却要为没做过的事担惊受怕。”这场风波提醒我们,技术或许能辅助教育,却无法代替人与人之间的理解与信任。

本文译自 The New York Times,由 BALI 编辑发布。