高等院校学位论文格式智能检测系统及方法技术方案

技术编号:37991227 阅读:9 留言:0更新日期:2023-06-30 10:05
本发明专利技术公开了高等院校学位论文格式智能检测系统及方法,属于智能检测技术领域。该系统包括论文解析服务模块、论文格式检测主服务模块和11个子模块;其中解析服务模块用于读取并解析论文文件,生成论文格式中间文件;检测主服务模块根据论文格式中间文件,将论文文件的不同部分内容分别输入对应的子模块检测,并接收、汇总检测结果,生成论文格式自查表;与现有技术相比,本发明专利技术的系统中各个模块在检测过程中不相互依赖,且可以并行运行,有效提高检测速度;在此基础上,实现了对论文格式更完整更细致的检测,帮助作者对论文格式进行查找并、修正,直至符合要求;且该系统可以在本地设备运行,保证论文信息的安全性。保证论文信息的安全性。保证论文信息的安全性。

【技术实现步骤摘要】
高等院校学位论文格式智能检测系统及方法


[0001]本专利技术属于智能检测
,尤其涉及高等院校学位论文格式智能检测系统及方法。

技术介绍

[0002]在当代,论文是一种描述各领域学术研究成果的文章,是探讨学术问题、进行学术研究的一种方式,也是体现作者所从事研究工作成果的主要表现,是作者申请学位的重要依据。各院校及社会机构对于论文的撰写都有着严格的要求,特别是论文的格式要严格遵守规范,文章的查重率需要在特定的范围之内。作者在撰写论文的过程中,往往会注重于对研究结果、技术核心等的描述而忽略对格式上的规范处理,为了写出的论文符合要求,需要在最后对论文的格式进行检查修正处理。
[0003]但论文往往是一篇篇幅较长、内容结构较为复杂的文章,涉及的格式要求很多,光靠作者人工检查难免会产生疏忽,因此需要一个智能检测系统来对文章进行自动检测。如专利号为CN111488724A的技术公开了一种论文格式检测方法,从字体、字号、是否对齐、段前距、段后距、行间距等来检查论文的格式,但检测内容不全面,忽略了对论文其他格式的检测,如图、表、标题、摘要等部分;如专利号为CN114386400A的技术则公开了一种基于有限状态机的毕业论文格式检测方法,相较于专利CN111488724A的技术则实现了更详细的检测内容,但检测部分仍旧不够细致,且该技术基于有限状态机的方式运行,即按顺序对各检测模块进行检测,无法实现并行处理,效率交低。另外,还存在一种论文格式检测网站,需要用户将论文提交到远程服务器检测,可能存在安全问题,导致未公开的论文泄露、查重率升高等情况。
[0004]因此,亟须提供高等院校学位论文格式智能检测系统及方法,实现对论文格式更细致完整的检测、且检测效率更高、更安全。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术提供了高等院校学位论文格式智能检测系统及方法,可以对更安全、更细致、完整地检测论文格式是否符合要求,且有效提高检测效率。
[0006]本专利技术的技术方案是这样实现的:
[0007]高等院校学位论文格式智能检测系统,包括论文解析服务模块、论文格式检测主服务模块和若干个子模块;
[0008]所述论文解析服务模块用于读取并解析论文文件,生成论文格式中间文件;
[0009]所述论文格式检测主服务模块根据得到的论文格式中间文件,将论文文件的不同格式内容分别输入对应的子模块检测,并接收、汇总各子模块的检测结果,生成论文格式自查表,论文格式自查表可以向作者展示论文的格式检查结果,帮助作者实现论文格式自查及修改;
[0010]所述子模块包括封面检测模块、摘要检测模块、标题检测模块、论文结构检测模
块、页眉页脚检测模块、段落检测模块、公式图标检测模块、图检测模块、表格检测模块、算法检测模块和参考文献检测模块中的一种或多种。
[0011]作为以上方案的进一步优化,所述封面检测模块中,检测项及合格标准为:题目居中对齐;若题目长度超过一行,每一行都需要加下划线且各行的下划线等齐;横线处填写的作者姓名、指导教师姓名等内容需居中对齐;论文的封面和扉页上的指导教师姓名和职称信息准确且一致;即对于论文中关于作者等信息下方都设有下划线,下划线上方的文字居中对齐,且封面上和扉页上的内容要对应一致;
[0012]所述摘要检测模块中,检测项及合格标准为:摘要中包含各章节的关键问题、研究方法;英文缩写规范;关键词数量;关键词以逗号或分号分开,且最后一个关键词后无标点符号;
[0013]所述标题检测模块中,检测项及合格标准为:标题行无标点符号;标题都为名词或名词短语,而不是带主谓语的句子;标题无中文简称或英文缩写;论文的题目和章、节、小节标题之间无前后矛盾、重复或混乱;
[0014]所述论文结构检测模块中,检测项及合格标准为:不存在只有一个分条目的章或节;不存在篇幅太短的章或节,即章节的字数不能小于预设的最小篇幅阈值;依据毕业论文要求分级编码序号;序号标点使用正确;子标题在父标题的正文内容之后;
[0015]所述页眉页脚检测模块中,检测项及合格标准为:页面包含页眉、页脚和页码且各页面采用同一格式;
[0016]所述段落检测模块中,检测项及合格标准为:段落字数不能超过预设定的值;不存在一段文字作为一小节;不存在一个字占据一行;缩进、正文字体和段落文字的行距的使用都符合现行论文标准规范;
[0017]所述公式图标检测模块中,检测项及合格标准为:论文中的同一个符号都为正体或都为斜体;每个公式都按章编号;每个公式在正文中的引用方法为“如式(X

X)”;代码符号与数学符号无非法混用;
[0018]所述图检测模块中,检测项及合格标准为:每个图按章编号且拥有图标题;图标题的字号比正文小半号;每个图在正文中的引用方法为“如图x.x”;每个图都不跨页展示;图的前后无大片空白;多个图并列要分别标序号;坐标图的横、纵坐标及单位在图中准确标注;
[0019]所述表格检测模块中,检测项及合格标准为:每个表格按章编号且拥有表标题;表标题及表中的文字的字号比正文小半号;每个表格都不跨页展示;每个表格在正文中的引用方法为“如表x.x”;
[0020]所述算法检测模块中,检测项及合格标准为:每个算法都不跨页展示;算法中,除注释外,都为中文或伪代码;
[0021]所述参考文献检测模块中,检测项及合格标准为:参考文献的数量为30至50篇;近5年的论文和专著数量不少于参考文献总数的1/3;英文论文数量不少于参考文献总数的1/2;类型为专著([M])的参考文献不超过5本;卷期号页码齐全,卷期号页码格式统一;书、期刊、会议论文统一规范;分隔作者、题目、期刊会议名称、卷期号页码的标点的使用统一且符合规范;中英文英文期刊名的字体格式统一;作者名引用规范;参考文献在正文中都有引用,并按正文中出现的先后次序罗列;参考文献上标检测。
[0022]作为以上方案的进一步优化,所述图检测模块中,图的提取识别方法为基于VGG16神经网络模型进行的分类预测方法。
[0023]作为以上方案的进一步优化,所述表格检测模块中和所述图检测模块中,坐标及表格的识别方法为基于tesseract

ocr的文本识别技术。
[0024]作为以上方案的进一步优化,所述论文格式自查表为包含不同格式的检测结果的输出结果表,每个检测项在论文格式自查表上的信息包括检测项描述、检测结果、错误统计和整改建议。
[0025]本专利技术还公开了高等院校学位论文格式智能检测方法,应用了上述的高等院校学位论文格式智能检测系统,包括以下步骤:
[0026]S1、读取pdf格式或docx格式的论文文件,将文件输入论文解析服务模块;
[0027]S2、论文解析服务模块根据选择的文章检测粒度对论文文件进行解析,得到包含不同节点的论文格式中间文件;作者可以自由根据对论文格式的严格程度的需求,在开始论文检测之前预先设置系统的配置文件,选择不同的文章检测粒度。...

【技术保护点】

【技术特征摘要】
1.高等院校学位论文格式智能检测系统,其特征在于,包括论文解析服务模块、论文格式检测主服务模块和若干个子模块;所述论文解析服务模块用于读取并解析论文文件,生成论文格式中间文件;所述论文格式检测主服务模块根据得到的论文格式中间文件,将论文文件的不同格式内容分别输入对应的子模块检测,并接收、汇总各子模块的检测结果,生成论文格式自查表;所述子模块包括封面检测模块、摘要检测模块、标题检测模块、论文结构检测模块、页眉页脚检测模块、段落检测模块、公式图标检测模块、图检测模块、表格检测模块、算法检测模块和参考文献检测模块中的一种或多种。2.根据权利要求1所述的高等院校学位论文格式智能检测系统,其特征在于,所述封面检测模块中,检测项及合格标准为:题目居中对齐;若题目长度超过一行,每一行都需要加下划线且各行的下划线等齐;横线处填写的作者姓名、指导教师姓名等内容需居中对齐;论文的封面和扉页上的指导教师姓名和职称信息准确且一致;所述摘要检测模块中,检测项及合格标准为:摘要中包含各章节的关键问题、研究方法;英文缩写规范;关键词数量;关键词以逗号或分号分开,且最后一个关键词后无标点符号;所述标题检测模块中,检测项及合格标准为:标题行无标点符号;标题都为名词或名词短语,而不是带主谓语的句子;标题无中文简称或英文缩写;论文的题目和章、节、小节标题之间无前后矛盾、重复或混乱;所述论文结构检测模块中,检测项及合格标准为:不存在只有一个分条目的章或节;不存在篇幅太短的章或节,即章节的字数不能小于预设的最小篇幅阈值;依据毕业论文要求分级编码序号;序号标点使用正确;子标题在父标题的正文内容之后;所述页眉页脚检测模块中,检测项及合格标准为:页面包含页眉、页脚和页码且各页面采用同一格式;所述段落检测模块中,检测项及合格标准为:段落字数不能超过预设定的值;不存在一段文字作为一小节;不存在一个字占据一行;缩进、正文字体和段落文字的行距的使用都符合现行论文标准规范;所述公式图标检测模块中,检测项及合格标准为:论文中的同一个符号都为正体或都为斜体;每个公式都按章编号;每个公式在正文中的引用方法为“如式(X

X)”;代码符号与数学符号无非法混用;所述图检测模块中,检测项及合格标准为:每个图按章编号且拥有图标题;图标题的字号比正文小半号;每个图在正文中的引用方法为“如图x.x”;每个图都不跨页展示;图的前后无大片空白;多个图并列要分别标序号;坐标图的横、纵坐标及单位在图中准确标注;所述表格检测模块中,检测项及合格标准为:每个表格按章编号且拥有表标题;表标题及表中的文字的字号比正文小半号;每个表格都不跨页展示;每个表格在正文中的引用方法为“如表x.x”;所述算法检测模块中,检测项及合格标准为:每个算法都不跨页展示;算法中,除注释外,都为中文或伪代码;所述参考文献检测模块中,检...

【专利技术属性】
技术研发人员:黄翰雷丰强周灿苗李昊轩崔书中曹捷
申请(专利权)人:微科智检佛山市科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1