基于模板的文献自动排版方法及装置制造方法及图纸

技术编号:39811403 阅读:13 留言:0更新日期:2023-12-22 19:28
本申请一些实施例中公开了一种基于模板的文献自动排版方法

【技术实现步骤摘要】
基于模板的文献自动排版方法及装置


[0001]本申请涉及文献排版的
,尤其涉及一种基于模板的文献自动排版方法

装置

电子设备及存储介质


技术介绍

[0002]依据

学术出版规范
CYT 171

2019》、《
学位论文编写规则
》(
标准号
GB/T 7713.1

2006)
等国标规范文件,科技期刊

高校对学术论文的格式有严格要求,论文质量是内容和形式的统一,合格的论文不仅内容要有创新,形式也应遵循学术规范和相关国家标准

论文规范性涉及到字体字号

段落格式

摘要

目录

图表

参考文献等上百项要求

为了满足论文

文献格式的要求,创作者根据论文

文献格式要求手动进行文献格式的排版,手动进行文献格式调整排版费时费力,排版工作量巨大


技术实现思路

[0003]本申请提供一种基于模板的文献自动排版方法

装置

电子设备及存储介质,该方法中在对待处理文献净化

自动标注的基础上通过结合模块化排版模板,实现论文

文献的自动化排版,节省作者规范格式排版的时间,一定程度上减轻用户排版工作量,提升工作效率

[0004]第一方面,本申请实施例提供一种基于模板的文献自动排版方法,包括:
[0005]对待排版文献进行自动净化,得到第一待排版文献;
[0006]对所述第一待排版文献进行自动标注,得到包括标注项的第二待排版文献;
[0007]定义排版模板,所述排版模板包括第一预设标注项和与所述第一预设标注项对应的排版要求;
[0008]利用所述排版模板中的第一预设标注项和对应的排版要求,对所述包括标注项的第二待排版文献进行自动排版

[0009]在一些实施例中,所述对所述第一待排版文献进行自动标注,得到包括标注项的第二待排版文献的步骤包括:
[0010]根据预设特征对所述待排版文献进行划分,得到题录部分和正文部分;
[0011]分别对所述题录部分和正文部分利用第二预设标注项的标注规则进行标注,得到包括标注项的第二待排版文献

[0012]在一些实施例中,所述对所述题录部分利用第二预设标注项的标注规则进行标注的步骤包括:
[0013]判断所述题录部分是否包括预设特征词;
[0014]如果包括预设特征词,则判断所述题录部分中与所述预设特征词相关联的内容是否符合与所述预设特征词对应第二预设标注项的标注规则;
[0015]如果符合与所述预设特征词对应第二预设标注项的标注规则,则对与所述预设特征词相关联的内容进行标注,确定标注项为与所述预设特征词对应第二预设标注项;
[0016]判断所述题录部分中除去与所述预设特征词关联的内容的第一剩余内容中,是否存在符合与预设项目对应第二预设标注项的标注规则;
[0017]如果存在符合与所述预设项目对应第二预设标注项的标注规则的内容,则对符合预设项目对应第二预设标注项的标注规则的内容进行标注,确定标注项为与所述预设项目对应第二预设标注项

[0018]在一些实施例中,所述对所述正文部分利用第二预设标注项的标注规则进行标注的步骤包括:
[0019]从所述正文部分中筛选出图表;
[0020]判断所述图表的前后段落,是否符合与题目和注释对应第二预设标注项的标注规则;
[0021]如果符合与所述题目和注释对应第二预设标注项的标注规则,则对与所述图表的前后段落进行标注,确定标注项为题目和注释对应的第二预设标注项;
[0022]从所述正文部分中除去所述图表的题目和注释的第二剩余内容,筛选出标题标号;
[0023]根据所述标题标号,划分小标题级别;
[0024]按照所述小标题级别对所述标题标号对应小标题进行标注,确定标注项为与所述小标题级别对应的第二预设标注项;
[0025]判断所述正文部分中除去所述题目

注释和小标题的第三剩余内容中,是否存在符合与公式和段落对应的第二预设标注项的标注规则的内容;
[0026]如果存在符合与公式对应第二预设标注项的标注规则的内容,则对符合与公式对应第二预设标注项对应标注规则的内容进行标注,确定标注项为与所述公式对应的第二预设标注项;
[0027]如果符合与段落对应第二预设标注项的标注规则,则对符合与段落对应第二预设标注项对应标注规则的内容进行标注,确定标注项为与所述段落对应的第二预设标注项

[0028]在一些实施例中,所述第二预设标注项的标注规则包括多个子规则;所述方法还包括:
[0029]获取所述子规则的置信度和权重;
[0030]根据所述标注规则中的所有子规则的置信度和权重,确定标注置信度;
[0031]如果所述标注置信度小于预设标注置信度,发送报错消息

[0032]在一些实施例中,所述定义排版模板的步骤包括:
[0033]根据排版要求,设置配置文件;其中,所述配置文件中包括预设标注项

以及包括与所述预设标注项对应的位置域名和样式名称的排版要求

[0034]在一些实施例中,所述利用所述排版模板中的第一预设标注项和对应的排版要求,对所述包括标注项的第二待排版文献进行自动排版的步骤包括:
[0035]从所述配置文件中查找与标注项相同的第一预设标注项;
[0036]将所述第二待排版文献中的与第一预设标注项相同的标注项对应的文献内容,按照与所述第一预设标注项对应的位置域名进行填充,并按照样式名称修改所述文献内容的样式

[0037]第二方面,本申请实施例还提供一种基于模板的文献自动排版装置,包括:
[0038]净化单元,用于对待排版文献进行自动净化,得到第一待排版文献;
[0039]自动标注单元,用于对所述第一待排版文献进行自动标注,得到包括标注项的第二待排版文献;
[0040]定义单元,用于定义排版模板,所述排版模板包括第一预设标注项和与所述第一预设标注项对应的排版要求;
[0041]自动排版单元,用于利用所述排版模板中的第一预设标注项和对应的排版要求,对所述包括标注项的第二待排版文献进行自动排版

[0042]第三方面,本申请实施例还提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述的基于模板的文献自动排版方法的步骤

[0043]第四方面,本申请实施例还提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于模板的文献自动排版方法,其特征在于,包括:对待排版文献进行自动净化,得到第一待排版文献;对所述第一待排版文献进行自动标注,得到包括标注项的第二待排版文献;定义排版模板,所述排版模板包括第一预设标注项和与所述第一预设标注项对应的排版要求;利用所述排版模板中的第一预设标注项和对应的排版要求,对所述包括标注项的第二待排版文献进行自动排版
。2.
根据权利要求1所述的方法,其特征在于,所述对所述第一待排版文献进行自动标注,得到包括标注项的第二待排版文献的步骤包括:根据预设特征对所述待排版文献进行划分,得到题录部分和正文部分;分别对所述题录部分和正文部分利用第二预设标注项的标注规则进行标注,得到包括标注项的第二待排版文献
。3.
根据权利要求2所述的方法,其特征在于,所述对所述题录部分利用第二预设标注项的标注规则进行标注的步骤包括:判断所述题录部分是否包括预设特征词;如果包括预设特征词,则判断所述题录部分中与所述预设特征词相关联的内容是否符合与所述预设特征词对应第二预设标注项的标注规则;如果符合与所述预设特征词对应第二预设标注项的标注规则,则对与所述预设特征词相关联的内容进行标注,确定标注项为与所述预设特征词对应第二预设标注项;判断所述题录部分中除去与所述预设特征词关联的内容的第一剩余内容中,是否存在符合与预设项目对应第二预设标注项的标注规则;如果存在符合与所述预设项目对应第二预设标注项的标注规则的内容,则对符合预设项目对应第二预设标注项的标注规则的内容进行标注,确定标注项为与所述预设项目对应第二预设标注项
。4.
根据权利要求2所述的方法,其特征在于,所述对所述正文部分利用第二预设标注项的标注规则进行标注的步骤包括:从所述正文部分中筛选出图表;判断所述图表的前后段落,是否符合与题目和注释对应第二预设标注项的标注规则;如果符合与所述题目和注释对应第二预设标注项的标注规则,则对与所述图表的前后段落进行标注,确定标注项为题目和注释对应的第二预设标注项;从所述正文部分中除去所述图表的题目和注释的第二剩余内容,筛选出标题标号;根据所述标题标号,划分小标题级别;按照所述小标题级别对所述标题标号对应小标题进行标注,确定标注项为与所述小标题级别对应的第二预设标注项;判断所述正文部分中除去所述题目

注释和小标题的第三剩余内容中,是否存在符合与公式和段落对应的第二预设标注项的...

【专利技术属性】
技术研发人员:员战强行鹏程袁仁慧
申请(专利权)人:山西同方知网数字出版技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1