The invention discloses a terminal-based paper duplication checking method, a terminal and a storage medium. The method comprises steps: responding to the user's paper duplication request; matching the paper with the text content in the preset database to determine the similarity between the paper and the text content; and displaying at least one document on the terminal display interface at the same time. Three pages: the first paper document page for receiving the user's editing modification instructions, the second paper document page for displaying the corresponding tagged statements in the paper when the similarity exceeds the preset threshold, and the page for indexing and displaying the corresponding text content of the statement. So that users can directly modify the reference of the paper according to the position marked in the original paper, and no longer need to search for the statement that needs to be modified in the document according to the check-and-check report; besides, there is no need to switch between documents repeatedly, which makes the operation simple and reduces the modification time.
【技术实现步骤摘要】
基于终端的论文查重方法、终端及存储介质
本专利技术涉及计算机
,尤其涉及基于终端的论文查重方法、终端及计算机可读存储介质。
技术介绍
院校学生或科研工作者在自身研究的技术方向上取得一定技术成果时,需要进行论文的发表。而在论文发表之前,需要对论文的重复率进行反复检测,以避免其中大量篇幅与已公开文献重复,从而影响论文本身的价值。目前已有的论文查重软件在进行查重时主要是根据用户上传的论文进行检测,然后在检测完成后生成查重检测报告,该查重检测报告详细记录有用户提交的论文中哪句话与已公开文献的相似度过高以及对应的相似来源。用户则需要从论文查重软件中下载该查重检测报告,并根据查重检测报告进行相关内容的修改,然后再次将论文上传至论文查重软件,直至论文的重复率符合要求为止。这种论文查重方法存在如下问题:用户在对照查重检测报告的内容进行相应修改时,需要根据查重检测报告的内容在论文文档中查找需要修改的段落或语句,此外对照修改时还需要在两个独立的文档间进行反复切换,因此修改操作麻烦且耗费时间长。
技术实现思路
基于此,本专利技术提供一种基于终端的论文查重方法、终端及计算机可读存储介质,用于解决问题。第一方面,本专利技术提供一种基于终端的论文查重方法,包括步骤:响应用户的论文查重请求;将所述论文与预设数据库中的文本内容进行指纹匹配,以确定所述论文与所述文本内容间的相似度;在终端显示界面上同时显示至少三个页面;所述至少三个页面包括:用于接收所述用户的编辑修改指令的第一论文文档页面,专用于显示所述相似度超过预设阈值时所述论文中对应标记的语句的第二论文文档页面,以及用于索引和显示所述 ...
【技术保护点】
1.一种基于终端的论文查重方法,其特征在于,包括步骤:响应用户的论文查重请求;将所述论文与预设数据库中的文本内容进行指纹匹配,以确定所述论文与所述文本内容间的相似度;在终端显示界面上同时显示至少三个页面;所述至少三个页面包括:用于接收所述用户的编辑修改指令的第一论文文档页面,专用于显示所述相似度超过预设阈值时所述论文中对应标记的语句的第二论文文档页面,以及用于索引和显示所述语句对应的所述文本内容的页面。
【技术特征摘要】
1.一种基于终端的论文查重方法,其特征在于,包括步骤:响应用户的论文查重请求;将所述论文与预设数据库中的文本内容进行指纹匹配,以确定所述论文与所述文本内容间的相似度;在终端显示界面上同时显示至少三个页面;所述至少三个页面包括:用于接收所述用户的编辑修改指令的第一论文文档页面,专用于显示所述相似度超过预设阈值时所述论文中对应标记的语句的第二论文文档页面,以及用于索引和显示所述语句对应的所述文本内容的页面。2.根据权利要求1所述的基于终端的论文查重方法,其特征在于,所述终端显示界面上还设有查重按钮;所述在终端显示界面上同时显示至少三个页面的步骤之后还包括:通过所述查重按钮侦测用户的点击操作,并在侦测到所述用户的点击操作时触发重新确定所述论文与所述文本内容间的相似度;根据重新确定的相似度,更新所述第二论文文档页面。3.根据权利要求1所述的基于终端的论文查重方法,其特征在于,所述将所述论文与预设数据库中的文本内容进行指纹匹配,以确定所述论文与所述文本内容间的相似度的步骤包括:获取预设数据库中所有的文本内容分别对应的指纹以及所述论文的总字数;对所述论文进行切分以形成论文单元,并以所述论文单元作为输入数据,通过相似性哈希算法计算每个所述论文单元分别对应的论文单元指纹;从所有的文本内容分别对应的指纹中,查找与论文单元指纹相似的所有指纹;根据查找到的所有相似的指纹,加载对应的相似文本内容;根据所述相似文本内容、所述论文单元以及所述论文的总字数,计算所述论文与所述文本内容间的相似度。4.根据权利要求3所述的基于终端的论文查重方法,其特征在于,所述文本内容分别对应的指纹为N位指纹;所述获取预设数据库中所有的文本内容分别对应的指纹以及所述论文的总字数的步骤之后还包括:将所有文本内容分别对应的指纹分成M块,以形成M个指纹分块,其中每个指纹分块具有N/M位指纹;以具有N/M位的指纹为关键词,为M个指纹分块分别建立倒排索引;所述根据查找到的所有相似的指纹,加载对应的相似文本内容的步骤包括:确定每个相似的指纹所属的指纹分块;以所述相似的指纹为关键词,从该关键词所属指纹分块所在倒排索引中查找所述相似的指纹对应的相似文本内容。5.根据权利要求4所述的基于终端的论文查重方法,其特征在于,所述论文单元指纹为N位指纹;所述从所有的文本内容分别对应的指纹中,查找与论文单元指纹相似的所有指纹的步骤包括:将所有论文单元指纹分成M块,以形成M个论文指纹分块,其中每个论文指纹分块具有N/M位指纹;依次将每个论文指纹分块与每个指纹分块进行比较,以查找出相似的所有指纹。6.根据权利要求3所述的基于终端的论文查重方法,其特征在于,所述根据所述相似文本内容、所述论文单元以及所述论文的总字数,计算所述论文与所述文本内容间的相似度的步骤包括:根据所述相似文本内容,从所有的论文单元中查找出每个相似文本内容对应的相似论文单元;对...
【专利技术属性】
技术研发人员:张勇,李威,
申请(专利权)人:湖南写邦科技有限公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。