
又到一年的毕业季,很多同学都在询问论文查重是什么?哪里查?重复率高了该怎么办?希望这篇文章能帮你解答疑惑,顺利毕业。
一、是什么?
为了避免学术抄袭,在毕业论文、学术期刊论文等通常会进行论文查重检测。论文查重主要是将论文和现有论文、书籍、报刊、互联网信息等构成的数据库进行比对,文中对和数据库重复的字段进行标注,最后得出整篇论文的重复率。论文的重复率也叫抄袭率,论文查重,就是查的这个重复率。
二、论文查重哪里去查?
由于现在对于论文查重越来越重视,论文查重系统也比较多,甚至是鱼龙混杂。传统主流的论文查重系统是、维普和万方,后来逐渐崛起paperpass、paperrater、paperyy、checkpass和gocheck等,有些同学上述的应该大都听过或看到过,他们都有什么区别,自己用的时候该选哪个呢?
1、知网学术不端。这基本是最权威的,大部分高校和期刊都会选择知网进行查重。知网的优点是和大部分高校是一致的,自己查重的话最接近学校的结果。缺点是:知网不支持个人检测,个人只能去淘宝购买;其次知网价格较高,平时价格250元左右,毕业高峰时会更贵,不差钱的同学可以忽略这条。
知网现在也分为多个系统,有VIP5.0/tmlc2、期刊、小分解/小论文、PMLC等。这里就不详细说他们的区别了,大体VIP5是硕士和博士论文,期刊顾名思义就是期刊论文(期刊内也会分科技期刊和社科期刊),小分解其实和VIP5类似,但检测方法上有所区别,PMLC主要是本专科检测。上述系统主要区别还是在于对比的数据库和检测字符数不同。
注意都是按篇计算的,后面的系统都是按字符来算的。
2、维普和gocheck,这两个为什么放在一起说,因为原来他们可以算是一家。当时两家进行了合作,gocheck代理了,对外都说是一家,维普主要是面对高校等,gocheck是面对个人的。虽然现在分家,注意现在是两家了,但分家时间不长,所以数据库和算法应该还是大同小异的。维普和知网数据库接近,价格维普在2块左右/千字符,gocheck在1元/千字符。
3、万方数据库大家写论文的时候应该看它家的文献不少吧,很多高校的文献库知网和万方是标配。但在论文查重方面,万方优点是很便宜,1.5元以内/万字符,缺点也很明显,数据库太小,很多其实都查不出来。这是数据库最小的一个系统了,可以用,但不能太当真,除非你们学校用的是这个系统。
4、Paperpass和paperrater,这两个放在一起说,因为这两个系统也基本一样,互联网时代新崛起的主要两个系统。两个数据库基本一致,都很大,包含了互联网的信息,所以网上抄的也不行哦。自己查过的很多人估计都是用的都是这两个中的一个。这两个的优点是数据库大,价格还便宜,大家用得多。但是要注意的是,这两个系统因为算法和数据库的原因,整体会比知网要严,也就是查出来的重复率比知网要高,一些常用句和时间可能也会被标记重复了。最近提了价,1.5元/千字符,paperrater还是1元/千字符。
5、paperyy和checkpass,这两个出的时间比较晚,但从使用反馈来讲,整体效果也不错,但稍差paperpass和paperrater。但是优点在于便宜,paperyy2元以内/万字符,checkpass目前是1元/万字符。注意,是万字符。
6、综合建议:
最好先清楚学校是使用什么系统,和学校保持一致是最安全的。当不知道的时候,不缺钱的建议用知网(知网最便宜的性价比最高),能省钱的建议用性价比高的paperpass和paperrater。或者采用组合的方式,初稿用paperpass和paperrater检测和修改,定稿送学校前用知网检测。
三、如何降低论文重复率
查重除了自查有没有问题,很重要的一点就是要把重复的进行修改,确保学校查重能顺利通过。
是按段落的,检测到13个相同的字,就认为是雷同,所以连续相同的,不要超过13个字,段落里面提示相似度是多少,然后综合起来;中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。
知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足3里面的前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。
对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。
paperpass和paperrater是在此基础上有一个比对作用,看看这句话里面与别的论文里面长度相似或相近的话中相似的字数,体现出相似的程度,比如这句话与另一句话有55%的相似,万方的是6个字开始检测重复率,当一段话里面重复的地方多的时候,每六个字就会变成红色,检测的机制还不错,可惜数据库太小了,没有优势。
尽量用同义词替代,比如:损坏=破坏;渠道=途径;原理=基本思路;不可见=隐藏;优点尤其突出=优势尽显无疑,大多数=大部分,等等,提前检测出来的报告里面,标红的地方是重点修改区域,拿paperpass来说,有三种颜色,绿色的不用修改,黄色的部分,如果不是大面积的话,如就一两句话,可以不修改,红色的是必须修改的。
改变句子的主动被动语态,比如:数字水印为多媒体数据文件在认证、防伪、防篡改、保障数据安全和完整性等方面提供了有效的技术手段。=在多媒体制品的认证、防伪、防修改和传送安全以及完整性保障方面,可以采用数字水印的检测作为有力的检测手段。
将大段文字转为图片。具体的做法是,将需要转化的文字剪切(最好是整行剪切),然后在原位置进行“选择性粘贴”——〉“图片(windows图元文件)”即可将文字转化为文件。目前的检测系统对图片是无能为力的,所以次检测的时候,重合率自然会有所降低。但是这样做的坏处也是显而易见的,首先会减少您的论文总字数;再一个,这种做法有那么一点点短视,从长远角度考虑,不到逼不得已的境地,不推荐同学用这种方法。(慎用!)
自己制作表格,将文字叙述转化为表格的形式。目前系统对表格的重合支持的也不好。因此,将文字论述转化为表格的形式体现出来,是一个好办法。什么?表格你也要原样COPY?那我就低调的保持沉默了。
如果大段引用某篇文献时又实在不知道该如何修改引用的内容时,将引用的段落中句子的顺序打乱,也会部分降低重合率,最好打乱的过程中稍作修改效果会更好。但是这样的修改不可能将重合的文字全部消除哦。
四、对于重复率的要求
每个学校相关规定不同,部分学校规定复写率与引用率30%以下,部分学校规定在20%以下,也有学校规定在10%以下,现在基本在20%以下就没有问题;而期刊部一般超过30%,则直接退稿。
五、其他
引用率不能等同于抄袭率,不能作为判断是否抄袭的依据,它仅反映引用部分占整个论文的比重,但引用率过高将可能是引用过度,该行为亦是学术不端的一种,具体规定请参考各单位要求。




