原创论文被AI“冤枉”了怎么办?
- 来源:方圆 smarty:if $article.tag?>
- 关键字:原创,论文,学生 smarty:/if?>
- 发布时间:2025-06-21 12:16
原创论文被AI“冤枉”了怎么办?
文|方圆记者 黄莎 通讯员 杨子晗
AIGC检测出现的种种问题,让学生们苦不堪言:自己被AI“冤枉”了,找谁申冤呢?校方有没有权利要求学生自证
临近毕业季,不少学生都在埋头与论文“过审”较劲。以前,和学生们反复“拉扯”的是论文查重和降重,但现在,又多了个新角色——AIGC检测。
AIGC检测,通俗来说,就是看看文章中哪些部分是“人”写的、哪些部分是“AI”写的。目前,已经有部分高校要求学生论文进行AIGC检测,论文AI率过高的话将无法通过审查。
在AI时代,校方此举本是为了减少学术作弊行为,不让AI成为论文枪手,但学生们却反馈,自己辛辛苦苦原创的内容,却被AI冤枉成了AI生成,还陷入了“自证清白”的困境。
AIGC检测,到底靠不靠谱?
一般而言,AIGC检测结果会提供一个数字,“判定”文章有多少比例为原创,还会具体到某句话、某个段落是AI生成的概率。
理想情况下,这种检测结果能帮助审核者清楚了解文章中哪些部分涉嫌AI生成,有针对性地同作者沟通。但实际上,论文作者可能也会对此摸不着头脑:自己的想法、自己做的田野调查、自己做实验的数据、自己在键盘上敲下的字词……怎么组合起来却被判定为AI生成?
事实上,有苦说不出的不仅是学生,同样需要发表学术文章的学者也会对此感到无奈。有学者表示,自己和合作者一起耗时3年,追踪多个真实案例,逐字码了一个月的论文,上传至AIGC检测平台后,显示的AIGC率竟然超过了80%。
除了论文,名家经典作品可能也难逃高AI率。近日,媒体曝出,将朱自清的名篇《荷塘月色》上传至某常用论文检测系统后,结果显示,其AIGC率达到了62.88%。
《方圆》记者也将自己近日采写的部分稿件交由AI评判,同样发现,有的稿件被认定为存在AI生成内容。而且,同一篇稿件在不同的AIGC检测平台里,得到的AIGC率并不一致,有的标记的AI率为14%,有的检测平台则能还记者一个“清白”,显示AI率为0。
让《方圆》记者感到疑惑的是,个别检测平台里标记的高度疑似AI生成的段落,恰好是记者采访时采访对象所说的话。一词一句,都是“人”说出来的,为何反而被AI“窃取”?
目前看来,AIGC检测并不是那么可靠,这又是为什么?
中国政法大学网络法学研究所教授、人工智能法研究中心研究员郭旨龙表示,这种现象根本上是受限于AI的技术原理。“从原理上看,检测模型与生成模型的学习过程都是一样的。也就是说,两类模型在面对文本内容时,关注的重点可能是一样的。当检测模型试图区分本人的表达与AI的表达时,它并不知道这个人的写作风格是什么样,而只知道生成模型可能会生成什么样的内容,所以只会关注AI关注的那一部分。所以当它对比时,重合率可能会意外地高。类似于‘从门缝里看人’,只能看到与门缝范围一致的那一部分。”
郭旨龙也尝试让AI回答AI是怎么测AIGC率的,Deepseek给出的答案有:使用文本特征分析,包括词汇使用频率、句式结构、语法复杂度、主题一致性等;语言模型对比,即将输入文本与已知的AI生成文本进行对比,寻找相似性;统计模型,指的是通过统计分析来识别文本中是否存在AI生成的典型模式。
不同学校或研究机构对AIGC率的“合格”数值有不同的规定。有的学校要求AI率要在40%以内,有的要求不超过15%。那究竟该用怎样的标准呢?
郭旨龙表示,目前尚无令人满意的答案。“AIGC率在某个数字之下才算合格,‘合格’大概可以认为是达到了‘原创性’的要求,但学术上的‘原创性’是一个很难界定的概念,尤其是在知识更新飞速的今天,内涵的任何一点变动都有可能在某一层面上成为新的知识而具有相应的原创性。如果学生是照搬AIGC,自然是不合格的,但如果学生仅仅用以参考,那么什么程度的参考才能算合格呢?目前来看没有一个标准答案,任何AI率阈值的设置都是缺乏可解释性的。”
而且,郭旨龙提到,当前,生成式人工智能的发展目标是“能够像人一样与人交往”,这就意味着AIGC与一般人的表达将越来越相似,越来越难以区分,尤其是学生往往在正式使用AI之前,习惯于先训练,那么AI就会在这个过程中学习学生本人的表达。最终,本人的表达与AI的表达会变得很难区分。
被误判后,如何自证?
AIGC检测出现的种种问题,让学生们苦不堪言:自己被AI“冤枉”了,找谁申冤呢?校方有没有权利要求学生“自证”?
大成律师事务所高级合伙人、北京市律师协会数字经济与人工智能领域法律专业委员会副主任肖飒表示,根据教育部2016年发布的《高等学校预防与处理学术不端行为办法》第五条“高等学校是学术不端行为预防与处理的主体”以及2009年发布的《教育部关于严肃处理高等学校学术不端行为的通知》中规定“高等学校对本校有关机构或者个人的学术不端行为的查处负有直接责任”,高校对于学术不端行为的处理有着主动权并担任核心角色。
“学校与学生处于一种管理者与被管理人的关系,当学生被判定违反规章制度时,即可以推定为处于被管理人的角色,此时学校要求学生进行自证也有制度可循。但是,由于缺乏内部监管手段与处理规范,学校与学生常常处于不平等的地位,因此即使出现判断违例的情况,也需给出具体的判断理由,而非直接给出一个数字,让学生去自证。”肖飒说道。
郭旨龙认为,如果仅仅判定学生AI率过高,校方应当再进行人工审查,去除公式、引用文献等内容,对AI率过高的内容进行校对。如果此时AI率仍不达标,再让学生自证。
如果需要学生自证,该如何自证?
“参考之前一些涉及生成式AI的判例以及相关事件,建议学生们可以留存写作过程的完整证据链,如不同时间留存的不同版本的文档、实验日志等,可以有效地形成自证。”肖飒表示。
郭旨龙则表示,还可以改变论文审查流程,在答辩环节增设AIGC测试,当场检测AI率,当场让学生有针对性地答辩。
用AI降AI率,有何风险?
除了自证,更多时候,学生们会选择硬着头皮降AI率。有学生表示可以改标点符号,加语气助词,有的则把学术词汇替换成更为口语化的表达,还有的学生实在改不动了,干脆花钱让AI降AI率。
也就是说,一篇论文从“出生”到“审查通过”,AI这门生意,可以包括AI枪手、AI率检测和降AI率这3个环节。无论文章是否百分之百原创,想让论文过审,大概率都得花点钱。
用AI测AI率,再用AI降AI率。这些行为又会存在怎样的法律风险?
郭旨龙表示,这些行为可能涉嫌侵犯知识产权,AI可能将他人上传校阅的论文加以输出,构成不经意间的剽窃。
肖飒认为,使用AI降低AI率本身也是一种利用AI进行洗稿的学术不端行为。“从著作权的角度考虑,AI降重本身将会导致著作权归属不清。因算法黑箱的存在,究竟是否存在独立的人类智力劳动将难以界定,进行AI降重这个过程本身可能就会将原文的所有语言表达进行重构,譬如针对不同检测平台的标准,将长句断为数个短句、将所有的连接词进行个性化替换等。在这种情况下,被降重后的语言表达甚至难以与原文有‘实质性相似’,进行降重后的成果将难以被认定原创性。”
基于AIGC检测当下存在的种种缺陷,郭旨龙认为,各大高校和学术机构可以使用AIGC检测,但不能单独地将其作为一项长期措施。
“AIGC检测的政策成本很高,而由此带来的效益依然存疑。强制出台AIGC率的标准,并不能真的让那些想要偷懒的学生放弃使用AI,可能更多地会让那些仅仅想要尝试使用AI便利写作的学生投鼠忌器,进而影响AI在教育实践和学术创作中发挥功能。”郭旨龙说道。
查论文AI率,本意也是为了避免学生过度依赖AI生成,那校方能有什么其他解决办法吗?
郭旨龙表示,堵不如疏,而疏通亦有方法。用简单粗暴的方法限制甚至禁止,从微观而言,不可能达到令人满意的效果——论文写作不是当堂考试。从宏观上而言,也是在逆反社会发展潮流。因此,不如制定合适的AI应用规范,指引学生适度利用AI,正确地使用AI。但这不仅是高校的责任,更是整个教育体系的责任。
肖飒则建议,一方面,校方与教师应持续提升AI素养,深入理解AI生成的底层逻辑与特征,避免过度依赖单一工具而引发误判。同时,要注重构建多元、客观的学术评价体系,将论文内容质量、研究深度、创新能力等多维度纳入考量范围。另一方面,学术界与技术开发者也应携手合作,探索更精准的判定标准,完善学术写作平台与工具,使其兼具透明性、可控性与便捷性,方便学生留存创作轨迹,也便于校方追溯审查,从根本上降低争议与风险,共同营造风清气正、健康有序的学术科研环境。
