新型学术出版不端行为，用AI检测能轻松发现吗？

作者：河北领先文化时间：2024-04-12 阅读量：

2023年被称为AIGC（生成式人工智能）元年。随着人工智能技术迅猛发展，AIGC被广泛应用，引发强波技术浪潮，也成为全球经济缓慢复苏中难得的亮点。学术期刊作为出版圈最早与AIGC亲密接触的领域，在机遇与挑战并存下，保持着“强跟进”的姿态，用最实际的行动去研究、试错，并最终落地。

北京万方数据股份有限公司总经理梁冰关注到，从2023年起，AIGC应用广泛渗透到自然语言处理、图像生成、语音合成等多个领域。在教育领域，它能帮助教师准备教学资料；在医疗领域，它能辅助医生快速准确地诊断病情；在学术出版领域，AIGC更是充满存在感，大量有AIGC“创作”痕迹的学术论文流向期刊并被发表、引用。在工具层面，除了国外ChatGPT各个版本外，国内文心一言、通义千问、讯飞星火以及智谱清言等基于中文语境下的工具，也实现了多轮对话、文本生成、知识问答、代码编写、AI绘画等功能。

就像所有工具一样，AIGC在被用来进行行业升级的同时，也没有摆脱被滥用的命运。以期刊出版领域及学术写作为例，AIGC某些时候成为“学术造假”的帮凶，引发诸如学术不端、数据和隐私保护、内容虚假等一系列科技伦理问题。

“近几年，学术不端行为的复杂性和隐蔽性更加突出，具体表现为从早期单一的文本抄袭剽窃大行其道，演化到现阶段数据篡改、图像复用、虚假同行评议等多类型新问题层出不穷，尤其是2023年因‘人工智能自动生成内容’而撤稿的论文比例，较往年显著增加。”梁冰观察到，这一问题，逐渐成为学术期刊出版领域科研失信旧伤上叠加的新痛。科研、教育和出版领域用户通过各种渠道呼吁相关机构利用自身数据优势和技术积累研发相关技术，识别人工智能生成内容。

为了遏制这种滥用现象，防止AIGC技术对科研诚信的破坏力，《学术出版中AIGC使用边界指南》《生成式人工智能服务管理暂行办法》《负责任研究行为规范指引（2023）》等相关法律法规、监管政策、应用指南相继出台，中国知网（以下简称“知网”）、北京万方数据股份有限公司（以下简称“万方数据”）、重庆维普资讯有限公司（以下简称“维普”）等集信息内容管理解决方案与知识服务为一体的综合知识服务商，中华医学会杂志社等期刊出版单位，以及北京北大方正电子有限公司（以下简称“方正电子”）等深耕新闻出版行业的技术提供商，开始借助基于AI的检测工具，对文本结构、风格和模式进行分析，从而判断内容是否由AI生成，可谓是“以子之矛攻子之盾”。

以AI检测AIGC

抵制新型学术不端

“AIGC技术飞速发展，利用ChatGPT等技术在科研领域开展应用是不可阻挡的。科学合理地应用AIGC技术是可以被接受的，但作为科研成果的第一性，真实永远是确保人类科技文明发展的最低要求。我们要追随科技的发展规律，在利用AI技术的同时做好防范，制定事前防控、事中处理、事后惩戒的原则。”谈起对AIGC的态度时，中华医学会杂志社副社长刘冰说。

中华医学会杂志社于2023年年初开始筹划AIGC技术在期刊出版领域的应用场景。2023年7月，中华医学会杂志社学术期刊出版服务平台正式上线，成为国内首个将AIGC引入期刊采编评审系统的学术期刊出版单位。编辑可以通过这一AI写作检测工具，对所有投递至社内的论文进行扫描检测，查看AI写作的段落以及可疑度。此外，该应用已经在全文发布系统的论文全文页应用了基于大模型技术的智能问答系统。

刘冰介绍说，该应用研发投入了大量人力，包括部门负责人、产品经理、设计师、研发工程师等，均来自杂志社新媒体部门。新媒体部的骨干走访了全国各大大模型的技术公司，并与学界、出版界、科技界的专家开展了频繁的学术和技术交流。应用的内容资源主要是社里的指南文献，大模型技术引入所投入的资金成本，约在百万元级别。

相比单个期刊出版机构，知网、万方数据、维普等知识服务供应商/平台在AIGC技术研发与应用方面，起步相对更早。

为了应对新型学术不端行为，万方数据于2023年9月20日正式对外发布了万方文察V1.0版本，实现对科技论文的多维度综合查验，其中AIGC检测模块采用AIGC文本识别深度学习模型，利用神经网络的强大表达能力，通过AI生成文本和人类表达语言连贯性、逻辑性、结构等的区别来判断送检文段是AI生成的可能性。经过测试，对国内外主流通用大语言模型生成的中英文文本均有较好的识别效果，对于具体的学科类别也没有明显的限制。

谈及万方文察诞生的初衷，梁冰表示，一篇科技论文除了正文的文本内容外，还包括图像、数据、表格、公式、参考文献等诸多部分，期刊编辑或科研管理人员往往需要使用不同的工具去不同的平台送检，有着非常高的工作成本，也不便于对一篇论文提供综合性的判断。不仅如此，论文文本查重、图像检测、AIGC检测的结果准确性以及送检论文的安全性也是近年来大家关注的问题。“万方数据凭借多年的数据采集加工整合基础及技术积累，研发推出万方文察，就是希望能够将上述多项检测核查工作集成在一个系统中，便于评审或管理人员进行论文的一站式查验，辅助相关机构及管理部门对自己机构的成果论文全方位地把控，为教育、科研、出版、管理等诚信监管工作提供便捷的服务支撑。”

截至目前，已有50余家机构开通试用万方文察服务，覆盖出版、医学、高校等各领域客户。其中，过半的医院、高校均在使用后选择正式合作。“试用及推广过程中，客户普遍反映该产品综合多要素查验的理念符合当下国家对科技论文综合治理的要求，尤其是AIGC检测和图像检测功能在医院、医学院等广受好评，认为其一站式的服务方式能够有效地减轻自己突击集中检查工作及日常管理工作。”梁冰说。

北京万方数据股份有限公司科研诚信事业部主任凌锋告诉记者，万方文察目前在与国内知名高校专业团队合作的基础上，由公司组织人力自行研发，公司通过构建技术储备、数据基础、硬件设施等，以充分的数据资源和技术力量支撑用户的检测高峰。

知网从2022年开始筹划搭建AIGC检测服务系统，2023年9月基础版本正式发布上线。该系统以文本为检测对象，以知网结构化、碎片化和知识元化的高质量文献大数据资源为基础，基于预训练大语言模型算法逻辑，结合 “知识增强AIGC检测技术”和若干检测算法，从语言模式和语义逻辑两条链路，用AI检测AIGC，为引导和监管AIGC技术的科学合理使用、维护学术诚信和保护知识创新提供支持。目前，该系统支持检测国内外各类大模型生成的中文文本，还可支持期刊论文、学位论文、会议论文以及图书专著、科研成果、科技报告、课程作业检测等多个应用场景。

同样在2023年为学术出版领域提供新的检测工具的还有维普。记者了解到，2023年11月，维普AIGC检测服务上线。该服务基于公司研发的自主训练AI检测技术，可检测出国内外各类主流AI模型生成的文本内容，包括ChatGPT、文心一言、讯飞星火等。

方正鸿云学术出版云服务平台（以下简称“方正鸿云”）是方正电子自主研发的学术出版信息化平台。自2019年上线以来，助力期刊不断完善学术传播生态，与Pubmed、Medline、EI、Scopus等60余家第三方实现对接，并与万方文察、中华医学会杂志社等机构携手合作，推动多维度的诚信问题查验，探索在提升学术质量、提高科研效率方面合作的可能性。方正电子基于方正鸿云大模型持续推出更多AI场景，论文的AI导读能力、医学指南自动问答机器人、自动生成论文视频、智能审校等应用场景都在产品中陆续得到体现。

值得一提的是，对业界来说，垂类大模型从研究到落地，赚钱的飞轮一直难以转动起来。目前，市场上依托AIGC技术构建的论文检测服务，大多同时面向 B端用户与 C端用户，按篇计价；若批量检测，则将进一步协商定价。

AI写作的尺度谁来定义？

人工智能写作工具的应用整体正呈不断升高的趋势，集资源、聚人力、掷重金建设的AI写作监测系统效果究竟如何？是造干货，还是赶噱头，一时间备受关注。

记者观察到，“重复率检测”的查重报告明确标注出具体的重复痕迹，而“AIGC检测”报告只是指出某些文本AIGC的“置信度”，并不能回答为什么是这个值。知网官方平台以“疑似生成比”概念来定义AIGC检测结果，在可视化报告单中标示整体和片段的AIGC值。维普为用户提供的分析报告包括疑似AIGC分布程度、疑似AIGC片段分布图、疑似AIGC片段汇总、全文标注等方面的信息。疑似比例为三档：70%～80%被列为轻度疑似；80%～90%被列为中度疑似；90%以上被列为重度疑似。

据了解，AI智能写作面世后，疑似AI生成比超过30%的论文数量占比明显增多，甚至出现了部分60%～90%的情况。综述类文章是使用AI的重灾区，但目前期刊还缺乏相关的评价标准和处理机制。

刘冰发现，经过半年多的应用，中华医学会杂志社已经利用其系统检测了5万余篇论文，发现部分论文的疑似AI生成比超过30%，主要分布在科普文章、述评、综述等文献类型。

实际上，在应对创新观点、理念、实验方法等方面的抄袭剽窃，尚未有十分合理有效的检测工具算法，AI检测工具也存在误识别的情况，仍有较长的提升和完善之路。因此，算法工具只是用来辅助编辑、管理者、评审专家的工作，提高工作效率，通过检测出的结果快速定位疑似问题，但最终的判别还是需要人来主导，不能单独靠某一个算法工具的结果就下定论、一刀切。

梁冰认为，“目前业界在论文AI成分检测方面，尚未形成统一的标准，只是根据各家内部的算法为用户提供一个参考，每家的定位标准、算法加权与最终生成的比例可能会不同，但大体相当。各编辑部也尚在摸索AI写作的尺度，并结合专家和编委会的意见对文章进行综合评价。现阶段审核的真正核心是发现到底有没有出现不合理使用AIGC的问题，而非仅凭AI生成比的高低作出查处。”

还有什么不能被AI取代？

AIGC作为先进生产力日益融入产业，学术出版行业生态也随之发生演变。“AIGC技术对出版的破坏力有多大”成为学术期刊领域的重要议题之一，有研究明确展示出利用ChatGPT生成的英文学术摘要足以骗过期刊审稿人。然而，人们逐渐发现，AIGC检测技术仍处在萌芽期，对于AI生成的虚假图片、虚假数据进行识别仍是难点，其准确性还无法超越高级编辑。换言之，即使引入了智能检测技术，人工审查机制依旧具有不可替代的关键作用。

梁冰以期刊出版领域及学术写作为例，从多方面分析了AIGC在其中产生的正负两面性影响。

从作者角度，AIGC可以提供创作灵感，整理文献综述和资料，提高创作效率和质量，同时AIGC应用降低了写作门槛，使更多人有机会将想法细化成文。但过度依赖AIGC会导致作者创作能力下降，失去独立思考和创新能力，不正确地使用也会有生成内容的版权问题，容易侵犯到他人的知识产权。

从出版评审角度，AI工具可以自动生成文档、图片等，减轻编辑在稿件润色、排版等方面基础工作；除此之外，AI工具还可以自动进行文档关键要素提取与分析，帮助评审专家及编辑快速对稿件的主要内容、研究方向以及意识形态等进行把控监管。但过度依赖AIGC影响到作者们的创造性思维和思想创新，会导致投稿量激增但稿件内容过度同质化，反而又加大了评审工作量。

可见AIGC对于学术出版领域是一把“双刃剑”，既要充分利用其带来的便利，也要警惕其潜在的滥用风险。

据梁冰判断，未来类似AI写作等利用新型技术手段完成文献的占比会越来越多，类似的学术不端行为会愈演愈烈。编辑和评审专家要做好文献审查的把门人，努力做到事前预防，事中监控，把学术不端不良影响控制在最小范围内；同时学术出版机构也可以通过出版联盟等加强对作者、编辑及专家的教育培训，引导大家正确认识AIGC，正确掌握和使用AIGC。“更重要的是，科研与学术主体应该把主要精力放在创新与优质内容生产上，学者、机构、国家相关部门配合起来。当前国家对科研诚信环境愈加重视，相信整体科研生态体系会不断好转，在未来4~5年内，当前的不良学术现象会得到根本性改观。”

中国科学技术信息研究所评价中心科研诚信研究组负责人郑雯雯博士曾在接受采访中表示，尽管国家出台了相应的规则，但从外部监督到行业自治还需要一个过程。AIGC的使用涉及包含研究人员、出版机构、相关行业组织、政府等方方面面。如何厘清各方关系，各司其职是关键。

始于场景

终于价值

通过这一次如此认真地审视技术与学术出版的关系，学术期刊出版人将AI背后的价值分层看得更清更远，判断“更聚焦”或许会带来更多选择。而要摆脱技术焦虑，就要学会扎根业务场景，基于在To B 领域长时间的行业积累，以及对客户的深刻洞察，优化提升现有技术，积极融合新技术，才能更好地解决客户的问题。

刘冰坦言，“目前，中华医学会杂志社学术期刊出版服务平台的AIGC功能尚比较单一，仅限于常用大模型的技术，还需要在两大方向上继续演进，一是模型的专业化，需要借助于医学专业大模型；二是构建知识库，但目前知识库的构建尚需要大量的技术储备和流程再造。在出版适配性方面暂时没有进行流程的改造。但未来考虑开展基于RAG（Retrieval-Augmented Generation，检索增强生成）的知识库建设方案，还需要统筹考虑，为大模型的训练和知识库的积累配置相关的学术编辑和临床专家团队。AIGC从效能上对编辑出版工作在传播内容的生成、现有资源的综述等方面提供了支撑，在推进出版传播方面我们将继续加强探索应用。同时，利用好数据喂养培育精模型也是未来发展的重要考量。”

梁冰谈道，虽然万方文察已经实现了对AIGC的识别，但当下AI技术发展非常迅速，生成模型已经从3.5发展到4.0，与人本身表达的差异在逐渐减小，如何提升AIGC检测的算法，使其跟得上AI生成算法的优化速度，也是万方数据要面临的挑战。他举例说，首先，在图像检测方面，一是检测效率的提升需要大量服务器的支撑，万方数据也在不断投入来加强计算资源的建设；二是图像库的建设也是难点，众所周知图像库容量越大，图像复用的查全率就会越高；三是目前不论是万方文察还是市面上其他图像检测产品，基本是做图像复用的检测，图像篡改检测作为技术难点目前还存在难点，而无论是PS工具的广泛应用还是当下AI工具对于图像生成的辅助，都对图像的原创性、合理性、科学性产生了不小的影响，也对图像检测工具的查准提出了更高要求。针对AI生成文本特征的检测也要在产品的算法层面不断提升，以提高识别准确度，降低误识别率。

对于深耕AIGC的方向，万方数据有着明确的目标。“以人工智能为例的新技术还存在很大的挖掘与利用空间，不断提升技术方法、推出新的应用是未来做知识服务需要把握的重点之一。未来，万方数据将不断开发创新技术与传统技术相结合的新产品与新服务。”梁冰表示。

来源：中国出版传媒商报

上一篇：“AI＋作业”是帮手还是枪手？

下一篇：2024年政府工作报告释放了哪些重要教育政策信号？

新型学术出版不端行为，用AI检测能轻松发现吗？

联系我们contact us