原创性检测

确定是否抄袭提交的工作,而不是它的声音更难。考虑到互联网上的数十万本书和数百千亿的网页,然后意识到这一数量的文本继续以指数速度增长。那么,我们的提交人技术如何升至比较文件对巨大收集文件的挑战,这是一个继续发展的巨大文件?我们认识到,搜索引擎等谷歌,雅虎和Bing将永远在索引内容中最好是最好的,因此我们利用他们的API搜索他们的巨大数据商店。
当您提交给PaperRater时,您的文本将分成较小的部分,然后将其与搜索巨头谷歌,雅虎和Bing的搜索巨头索引的书籍,期刊,研究文章和网页中有超过20亿页进行比较。。低原始性分数表示可以在其他地方找到提交的文档的全部或一部分。可以显示可能匹配输入文本的文档,以便教师可以验证潜在匹配是否代表抄袭或假阳性。高创始分数表示未在Internet上搜索在Internet上找到的NONE或几乎无。还应注意,在检查抄袭之前没有删除引用。因此,许多引号可以歪斜最初的分数。