本发明专利技术实施例公开了一种导出带MathType公式的Word文档方法、装置、电子设备及存储介质,涉及文档处理技术领域。该方法包括:接收将数据内容导出为Word文档的导出请求;对数据内容进行解析处理,获得解析内容;判断解析内容中是否存在公式,如果存在,则根据解析内容,生成包括latex公式的Word基础文档;获取latex公式,根据latex公式,获取latex公式对应的MathType公式;将基础Word文档中的latex公式替换为MathType公式,导出带MathType公式的Word文档。高效完整地还原生产系统生产的内容到Word文档,提高了从生产到排版最终交付物环节的效率;自动生成Word文档,无需对Word文档进行二次审校;Word文档中的公式支持MathType、OMML、latex格式,满足对公式的多场景支持;机器自动转换公式为MathType,无需使用MathType程序进行手动转换。
Methods, devices, electronic devices and storage media for exporting word documents with MathType formula
【技术实现步骤摘要】
导出带MathType公式的Word文档方法、装置、电子设备及存储介质
本专利技术涉及文档处理
,尤其涉及一种导出带MathType公式的Word文档方法、装置、电子设备及存储介质。
技术介绍
在如今的教育行业,为了实现多人协同、高效地完成教学内容的生产,各教育公司都会研发自己的内容生产系统,作为生产系统交付排版公司的最终产物。并且,在教学内容出版过程中,教学资料需要以word文档的形式交付给排版公司,对于文档中存在公式的,需要以MathType的方式显示在word文档中。如何高效的生产带公式word文档就成为了极其重要的一环,目前市面上并没有系统可以实现此需求。对于内容导出为word,网络上有不少解决方案,但是对于内容的格式及样式还原方面,并没有可以很好的支持案例;对于word文档中的公式,市面上的解决方案都是基于word自带的公式格式OMML来生成带公式的word文档,没有基于生成mathType公式的带公式word文档的解决方案;传统的方式都是生成word文档公式以latex码或OMML公式,然后通过mathType软件将这些公式转换为mathType公式,效率低下且不稳定。
技术实现思路
本申请涉及到的名词解释:(1)Latex:一种生成数学公式的排版系统语言;模块的唯一标记,用于追踪数据。(2)MathType:MathType是一款专业的数学公式编辑器,兼容Officeword,excel等700多种程序,用于编辑数学试卷、书籍、报刊、论文、幻灯演示等文档轻松输入各种复杂的数学公式和符号。(3)MathML:一个用于描述数学公式、符号的一种XML标记语言。(4)OMML:OfficeMathML的缩写,是微软对数学公式的一种XML标记语言(5)OOXML:OfficeOpenXML的缩写,是由微软公司为Office2007产品开发的技术规范,现已成为国际文档格式标准,兼容前国际标准开放文档格式和中国文档标准“标文通”(外语简称:UOF)。于2006年12月成为ECMA标准。(6)Word:是微软公司的一个文字处理器应用程序。(7)JSON:是一种轻量级的数据交换格式。它基于ECMAScript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。(8)API(ApplicationProgrammingInterface,应用程序接口)函数:是一些预先定义的函数。(9)wmf是WindowsMetafile的缩写,简称图元文件,它是微软公司定义的一种Windows平台下的图形文件格式。(10)bin是二进制文件,其用途依系统或应用而定。一种文件格式binary的缩写。一个后缀名为".bin"的文件,只是表明它是binary格式。(11)公式:用数学符号或文字表示各个数量之间的关系的式子,具有普遍性,适合于同类关系的所有问题。(12)sdk:即软件开发工具包,是一些被软件工程师用于为特定的软件包、软件框架、硬件平台、操作系统等创建应用软件的开发工具的集合,一般而言SDK即开发Windows平台下的应用程序所使用的SDK。它可以简单的为某个程序设计语言提供应用程序接口API的一些文件,但也可能包括能与某种嵌入式系统通讯的复杂的硬件。一般的工具包括用于调试和其他用途的实用工具。SDK还经常包括示例代码、支持性的技术注解或者其他的为基本参考资料澄清疑点的支持文档。(12)hash:一般翻译做散列、杂凑,或音译为哈希,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。有鉴于此,为了解决或部分解决上述技术问题,本专利技术实施例提供了一种导出带MathType公式的Word文档方法、装置、电子设备及存储介质,将各类文档可视化编辑平台生成的数据以标准的数据格式(JSON),高效完整地生成并导出带MathType公式的Word文档。根据本专利技术的一个方面,提供了一种导出带MathType公式的Word文档方法,包括:接收将数据内容导出为Word文档的导出请求;对所述数据内容进行解析处理,获得解析内容;判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;获取所述latex公式,根据所述latex公式,获取所述latex公式对应的MathType公式;将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。可选地,所述根据所述latex公式,获取所述latex公式对应的MathType公式包括:判断所述latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将所述latex公式转换为MathType公式;如果存在,则直接将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。可选地,所述方法还包括:调用MathType官方sdk,将所述latex公式转换为MathType公式后,将latex所述公式对应的MathType公式保存至预存公式库;将所述latex公式的latex码转换为hash值;将所述hash值作为所述latex公式的索引值保存至预存公式库,通过所述hash值判断所述latex公式是否已转换为MathType公式。可选地,所述将所述latex公式转换为MathType公式包括:生成MathType公式对应的wmf文件和bin文件,将所述wmf文件和bin文件的内容以base64编码的形式放入缓存。可选地,所述方法还包括:对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;和/或,全程监控导出状态,如果监测到出错信息,则捕获所述出错信息,并进行报警;和/或,对所述导出请求和所述latex公式进行管理。根据本专利技术的另一个方面,提供了一种导出带MathType公式的Word文档装置,包括:导出请求接收模块,用于接收将数据内容导出为Word文档的导出请求;解析模块,用于对所述数据内容进行解析处理,获得解析内容;判断处理模块,用于判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;目标公式获取模块,用于获取所述lat本文档来自技高网...
【技术保护点】
1.一种导出带MathType公式的Word文档方法,其特征在于,包括:/n接收将数据内容导出为Word文档的导出请求;/n对所述数据内容进行解析处理,获得解析内容;/n判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;/n获取所述latex公式,根据所述latex公式,获取所述latex公式对应的MathType公式;/n将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。/n
【技术特征摘要】
1.一种导出带MathType公式的Word文档方法,其特征在于,包括:
接收将数据内容导出为Word文档的导出请求;
对所述数据内容进行解析处理,获得解析内容;
判断解析内容中是否存在公式,如果存在,则根据所述解析内容,生成包括latex公式的Word基础文档;
获取所述latex公式,根据所述latex公式,获取所述latex公式对应的MathType公式;
将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
2.如权利要求1所述的方法,其特征在于,所述根据所述latex公式,获取所述latex公式对应的MathType公式包括:
判断所述latex公式对应的MathType公式是否存在于预存公式库,如果不存在,则调用MathType官方sdk,将所述latex公式转换为MathType公式;
如果存在,则直接将所述基础Word文档中的latex公式替换为所述MathType公式,导出带MathType公式的Word文档。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
调用MathType官方sdk,将所述latex公式转换为MathType公式后,将latex所述公式对应的MathType公式保存至预存公式库;将所述latex公式的latex码转换为hash值;
将所述hash值作为所述latex公式的索引值保存至预存公式库,通过所述hash值判断所述latex公式是否已转换为MathType公式。
4.如权利要求2或3所述的方法,其特征在于,所述将所述latex公式转换为MathType公式包括:
生成MathType公式对应的wmf文件和bin文件,将所述wmf文件和bin文件的内容以base64编码的形式放入缓存。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
对于多个导出请求,按照导出请求时间、来源及导出优先级权值进行导出资源的分配;
和/或,
全程监控导出状态,如果监测到出错信息,则捕获所述出错信息,并进行报警;
和/或,
对所述导出请求和所述latex公式进行管理。
6.一种导出带MathType公式的Word文档装置,其特征在于,包括:
导出请求接收模块,用于接收将数据内容导出为Word文档的导出请求;
解析模块,用于对所述数据内容进行解析处理,获得解析内容;
判断处理模块,用于判断解析内容中是否存...
【专利技术属性】
技术研发人员:高超,
申请(专利权)人:小船出海教育科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。