文思慧达论文相似度检测系统对论文检测结果的分析

摘 要:利用文思慧达论文相似度检测系统对 2007—2009 年《中国医学影像技术》杂志刊登论文检测结果进行了分析,内容包括疑似学术不端文献的分类、各年刊出情况、文字复制比以及重合文献发表时间分布。

关键词:文思慧达;学术不端文献;论文检测;中国医学影像技术 中图分类号:G237.5 文献标识码:A

《文思慧达论文相似度检测系统》(简称文思慧达)自2008 年底推出以来,为期刊界检测学术不端文献,维护学术秩序起到了积极、有效的作用,也得到了期刊界的一致认可。

文思慧达 不仅可以用于对来稿的学术不端行为进行初审筛查,也可以用于对已刊出文献中存在的学术不端行为进行检测评估。根据数据库提供的数据,《中国医学影像技术》杂志

(以下简称“本刊”)2007—2009 年刊出论文中共有疑似学术不端文献 47 篇(不含增刊)。

本文将对这 47 篇文献的分类、发表年份情况、文字复制比情况、重合文献出版时间及典型案例进行统计与分析。

1 疑似学术不端文献的分类情况

期刊影响力统计分析数据库对各类学术不端文献的定义如下:“疑似学术不端文献”指全文文字重合度大于 40%且发表在后的文献;“一稿多发”指同一作者发表的2 篇文献全文重合度90%以上;

“疑似抄袭”指不同作者发表的2 篇文献全文重合度40%以上;“疑似自抄”指同一作者发表的 2 篇文献全文重合度40%以上且 90%以下。本刊疑似学术不端的47 篇文献的分类情况见表 1。

重合刊数指作者除在本刊发表外,还在其他一种、两种或 3种期刊上刊载了内容相近的文章。本文将同一作者发表文字重合度超过 40%的两篇及以上文献的一稿多发及疑似自抄列入“重复发表

”范畴,重复发表指同一研究成果,通过修改标题(或原封不动),使用自己以前文章的词语、句子,将有大量重复内容的文献进行再次及更多次的公开发表。重复发表也被称为多余发表、自我剽窃及一稿多发,称谓有所不同,但作者的动机正如周冰毅指出的,重复发表者存在更多的主观故意,而文章发表事实确认无误,行为属学术不端。

47 篇文献中 6 篇文章题目一字未改,原封不动,其他文章在题目上进行了形式上,非实质性改动,多数文章将中文题目中的关键词改用英文缩写,或将题目中的“初步研究”改为“临床价值”。

本次统计的 47 篇文献中重复发表文献 44 篇 (93.62%);疑似抄袭 3 篇(6.38%)。重复发表文献数量远远超过疑似抄袭数量,与作者年初对 330 篇来稿进行检测的结果有些差别,330 篇

文献中 57 篇文字复制比超过 15%的文献,只有两篇文章作者自引重合度超过 40%,一篇为48%,另一篇为 72%。重复发表数量低于疑似抄袭数量,原因有待进一步的分析。在重复发表的文献中,“一女二嫁,三嫁,四嫁”情况均有发生。本刊刊出的文章与 1 刊重合的文献有 39 篇,占本次统计的82.98%;与 2 刊重合的文献 7 篇(14.89%);与 3 刊内容重合的文献 1 篇(2.13%)。本刊 47 篇文献与其他期刊共 56 篇文献内容有大比例重合。2 本刊 47 篇疑似学术不端文献发表年份情况本刊自 2009 年 2 月开始使用 文思慧达,本刊发表周期平均超过 6 个月,也就意味着本次系统公布的数据,经过文思慧达 检测的文献数量有限。47 篇疑似学术不端文献发表年份情况见表 2。

从本刊各年刊出的学术不端文献数量看,2007 年刊出 30 篇文章(30/47,63.83%);2008 年9 篇(9/47,19.15%);2009 年 8 篇(8/47,17.02%),呈逐年下降趋势,且 2008 年、2009 年比 2007 年下降幅度明显。分析其原因,媒体对学术不端事件的连续曝光,文字复制比官方对学术不端事件的处罚力度加大,社会呼吁学术规范,作者对学术规范重要性的认识不断提高,检测系统的使用等等对遏制学术不端行为的发生产生了积极的作用。

3 文字复制比情况

文思慧达 对疑似学术不端的文献,特别是对于复制比超过40%已刊出文献可做出较准确的定量、定性、定位评判。

根据该系统的检查分析,在本刊发表的疑似学术不端文献 47 篇与重合的 56篇文献文字复制比分布见表 3。

根据系统提供的数据,疑似抄袭的 3 篇文献,与其他期刊 4篇文献内容重合,其中 1 篇文章与其他两刊内容重合,其重合度均为 51%,而另两篇文字复制比分别为53%和 73%。重复发表的文献中一稿多发文献 1 篇,文字复制比高达 98%,其余均为疑似自抄文献,文字复制比为 51%~88%。表 3 统计结果符合董建军“复制比超过 50%的论文作者复制自己的情况较多”的提法。本刊检出的 47 篇文献与刊发在其他期刊的 56 篇文献重合的文字复制比最低为 51%,最高为 98%。其中文字复制比50%~59%的文章数量最多,为 25 篇(44.64%);60% ~79% 的文章数量为 25 篇(44.64%)。按 文思慧达 规定,47 篇文献全部属于整体抄袭。居高的复制比严重侵犯了知识产权,损害了首发期刊的权益,影响了后刊者的声誉。学术不端文献缺乏创新性,既浪费了期刊有限的版面,又浪费了读者宝贵的时间,打击了诚实研究、艰苦创新的科学精神,制造了学术泡沫及学术的虚假繁荣,助长了不劳而获、不当获取科研成果和追逐个人名誉的风气,其结果使得我国知识界名誉整体受损,科研水平下降,同时也有可能葬送作者的学术生命。

4 重合文献发表时间分布

一般的期刊编辑部在纸质版出版后,将当期内容上传相关数据库,数据库还需要几十个工作日才能将各刊上传文献输入到系统中。

纸质版刊出到系统中可查阅相关文献之间的时滞,导致了“检测盲区”。在这一时间段,用户从系统中无法检测到最新的文献。此外,各期刊的发表周期受审稿程序、来稿量及刊期、页码等诸多因素的影响,从收稿到刊出的发表周期存在很大差异,文章的发表时滞短则几个月,长至 1 年以上

。出版时滞及检测盲区,对于有意浑水摸鱼者是有机可乘的。本刊发表的 47 篇文献与 56 篇重合文章的发表时间间隔分布见表 4。

根据系统提供的数据,本刊 3 篇疑似抄袭文献与其他 4 篇重合文献的发表时间间隔为 22~72 个月,其中 3 篇超过 24 个月。对于这部分稿件,文思慧达 的使用可以防范此类稿件的刊出。重复发表的文献与其他期刊刊出文献时间间隔分布为:同月刊出(时间间隔为 0)的文献 5 篇(8.93%);1~3 个月内刊出的有 20 篇(35.71%);4~6 个月内刊出的 12 篇(21.43%)7~12 个月内刊出的 10 篇 (17.86%);在 1 年 内 刊 出 的 重 合 文 献 共 计 47 篇(83.93%);超过

1 年的 5 篇(8.93%)。重复发表的文献在 3 个月内陆续刊出的占 48.08%,系统对这部分稿件的检测作用有限。

另外,一些作者为了赶时间发表并增加发表的可能性,会将内容相似的文章同时寄给若干个编辑部。如果只对投稿做 1 次检测,这部分稿件会从容通过检测。为了不给学术不端文献发表的机会,林汉枫等指出,检测次数至少两遍为宜,有些文章初次检测时系统显示为合格,但 1 个月后检测相似度极高。

5 重复发表典型案例

本次统计的 47 篇文献中,1 篇文章作者先后除在本刊外还在其他 3 本杂志上发表了文字重合度分别为 76%、68%、67%的文章,其中 3 篇文章发表在同一年内的同一个月,另一篇文章发表在 10 个月前。文章题目、作者情况、发表期刊名称、发表时间情况如下:冠状动脉斑块形态与妊娠相关蛋白酶-A、丙二醛化低密度脂蛋白的关系 张××;李××;周××;祁×× 中国医学影像技术2007-02

辛伐他汀对冠心病人丙二醛化低密度脂蛋白、妊娠相关蛋白酶-A 的影响 张××;李××;杨× 中华高血压杂志 2007-02

氧化应激、炎症与冠心病患者冠状动脉斑块的关系 张××;周××;祁××;李×× 中南大学学报(医学版)2006-04

CD40 配体、妊娠相关血浆蛋白 A 和丙二醛化低密度脂蛋白的变化与冠状动脉斑块破裂相关性 张××,李××,周××,祁×× 中国动脉硬化杂志 2007-02

上述 4 篇文献第一作者相同,题名、内容基本一致,文章刊出时间接近。作者在很短的时间内炮制 4 篇内容近乎雷同的文章,其行为存在主观故意,其目的为在短时间内容迅速制造学术表 2 47 篇疑似学术不端文献发表年份情况 (篇)。此例从另一个侧面也反映出,一些作者对自我抄袭的错误性认识不够,可能认为这并不是剽窃行为,最多是一种小过失。为此,应加强这方面的舆论谴责及处罚力度,使作者充分认识到自我抄袭同样是弄虚作假,违背学术道德的。

6 结语

根据 文思慧达 对本刊已刊出文献的检测结果,列入统计的 47篇文章中,疑似抄袭的文献数量较少,特重点总结重复发表文献特点如下:第一,作者顺序。44 篇文献与 52 篇发表在他刊上的文献,有 43 篇第一作者相同,另 9 篇文章作者顺序有变化,但仍为作者之一。第二,重复发表刊物数量。“一女二嫁,三嫁,四嫁”的情况均有出现,以 2007 年最为突出。第三,文章发表时间间隔

短时间内连续发表是突出特点之一,从数量上看,6 个月内刊出的重合文献为 37 篇,超过 12 个

月的只有 5 篇。第四,文字复制比。统计文献的文字复制比均超过 50%,属整体抄袭。

文思慧达论文查重系统 对本刊已刊出文献的检测结果,作为一个案例,从一个侧面反映了学术界学术不端行为的现状。为了维护学术的尊严,更好地防范学术不端行为的发生,建议:第一,借鉴并采取国外期刊对重复发表文章的处理办法,加强对重复发表行为的惩罚和警示。有关做法如期刊刊登撤销论文的通知;目次页列入撤销论文的通告;论文数据库设置全文链接并醒目标注“撤销”字样。第二,检测系统还需进行技术上的改进,缩短上传时间,争取做到实时检测。第三,对文献尽可能进行多次甄别,初审及发表之前最好各做一次。第四,在利用文思慧达论文相似度检测系统的同时,最好也要使用知网检测系统,交叉检测,以提高检测的准确性。

发表评论

邮箱地址不会被公开。 必填项已用*标注