字体库匹配方法、装置及设备制造方法及图纸

技术编号:23342976 阅读:26 留言:0更新日期:2020-02-15 03:45
本发明专利技术实施例提供的一种字体库匹配方法、装置及设备,通过在识别出第一字体库为匹配错误的字体库时,将终端中未加载过的第二字体库循环加载到待处理文档中的文本中。每加载一个第二字体库并编码得到第二文本数据时,识别第二文本数据是否包含乱码文本数据,当不包含时,则表明匹配到了正确的字体库,得到该不包含乱码文本数据的第二字体库就可以被确定为目标字体库,从而在文档出现因字体库匹配错误而导致的乱码时,自动匹配目标字体库,避免后续显示文档内容时出现乱码。

Font library matching method, device and equipment

【技术实现步骤摘要】
字体库匹配方法、装置及设备
本专利技术涉及文字处理
,特别是涉及一种字体库匹配方法、装置及设备。
技术介绍
乱码指的是文档内容在电子设备上不能显示为正确的字符,而显示为其他无意义的字符。在电子设备上显示文档的文本内容时,可以基于文档中的文本内容的字体信息,以及与字体信息对应的字体库标识信息,在电子设备中查找到具有与字体信息对应的字体库标识信息的字体库,作为与文档匹配的字体库,将该字体库加载到该文本内容,从而显示正确的文本内容。通常情况下,文档中的文本内容的字体信息是在编辑得到该文档时生成、并携带在文档中的,与编辑该文档时所使用的字体库的字体库标识信息存在对应关系,当文档编辑完成时,该文档中字体信息与字体库标识信息的对应关系将不再变更。同时,同一字体库在不同操作系统中可能具有不同的字体库标识信息,因此,当编辑文档的文本内容的电子设备和显示文档的文本内容的电子设备具有不同的操作系统时,可能造成字体信息所对应的字体库标识信息出现了变更,而在查找与文档匹配的字体库时,依然按照操作系统变更前、文档中未变更的字体信息与字体库标识信息的对应关系进行查找。此时,由于变更后的字体库标识信息不再适用于未变更的字体信息与字体库标识信息的对应关系,因此,会出现由字体库查找错误所导致的字体库匹配错误,进而使文档内容在电子设备上显示时出现乱码。
技术实现思路
本专利技术实施例的目的在于提供一种字体库匹配方法、装置及设备,以实现在文档出现因字体库匹配错误而导致的乱码时,自动匹配正确的字体库,从而避免后续显示文档内容时出现乱码。具体技术方案如下:第一方面,本专利技术实施例提供了一种字体库匹配方法,应用于终端,该终端中存储多个字体库,该方法包括:获取并根据待处理文档的字体信息,确定与字体信息对应的字体库标识信息;根据字体库标识信息,选取终端中具有字体库标识信息的第一字体库加载到待处理文档中的文本中,对待处理文档中的文本进行编码,得到编码后的第一文本数据;采用预设的乱码识别算法,识别编码后的第一文本数据;当识别出编码后的第一文本数据中包含乱码文本数据,则选取终端中未加载过的文本中的第二字体库,对待处理文档中的文本进行编码,得到编码后的第二文本数据;采用预设的乱码识别算法,识别编码后的第二文本数据;当识别出编码后的第二文本数据中包含乱码文本数据,则执行选取所述终端中未加载过的第二字体库,对待处理文档中的文本进行编码,得到编码后的第二文本数据;当识别出编码后的第二文本数据中不包含乱码文本数据,则确定第二字体库为目标字体库。第二方面,本专利技术实施例提供了一种字体库匹配装置,该装置包括:获取模块,用于获取并根据待处理文档的字体信息,确定与字体信息对应的字体库标识信息;编码模块,用于根据字体库标识信息,选取所述终端中具有字体库标识信息的第一字体库加载到待处理文档中的文本中,对待处理文档中的文本进行编码,得到编码后的第一文本数据;识别模块,用于采用预设的乱码识别算法,识别编码后的第一文本数据;编码模块,还用于在识别模块识别出编码后的第二文本数据中包含乱码文本数据时,选取终端中未加载过的第二字体库,对待处理文档中的文本进行编码,得到编码后的第二文本数据;识别模块,还用于采用预设的乱码识别算法,识别编码后的第二文本数据;当识别出编码后的第二文本数据中不包含乱码文本数据,则确定第二字体库为目标字体库。第三方面,本专利技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现上述第一方面提供的字体库匹配方法的步骤。第四方面,本专利技术实施例提供了一种计算机可读存储介质,该存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面提供的字体库匹配方法的步骤。本专利技术实施例提供的一种字体库匹配方法、装置及设备,通过采用预设的乱码识别算法,识别由具有字体库标识信息的第一字体库加载并编码得到的编码后的第一文本数据。当识别出编码后的第一文本数据中包含乱码文本数据,则表明第一字体库为匹配错误的字体库。基于该识别结果,选取终端中未加载过的第二字体库,对待处理文档中的文本进行编码,得到编码后的第二文本数据。采用预设的乱码识别算法,识别编码后的第二文本数据。当识别出编码后的第二文本数据中包含乱码文本数据,则表明第二字体库为匹配错误的字体库,则继续选取终端中未加载过的第二字体库,对待处理文档中的文本进行编码,得到编码后的第二文本数据。由此,在识别出第一字体库为匹配错误的字体库时,将终端中未加载过的第二字体库循环加载到待处理文档中的文本中,且每加载一个第二字体库并编码得到第二文本数据时,对第二文本数据进行乱码文本数据识别。当识别出第二文本数据不包含乱码文本数据时,则表明匹配到了正确的字体库,得到该不包含乱码文本数据的第二字体库就可以被确定为目标字体库,从而在文档出现因字体库匹配错误而导致的乱码时,自动匹配目标字体库,避免后续显示文档内容时出现乱码。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例的字体库匹配方法的流程示意图;图2为本专利技术另一实施例的字体库匹配方法的流程示意图;图3为本专利技术图2所示另一实施例中步骤S206中判断编码后的文本数据中是否存在生僻字的具体流程示意图;图4为本专利技术一实施例的字体库匹配装置的结构示意图;图5为本专利技术另一实施例的字体库匹配装置的结构示意图;图6为本专利技术一实施例的电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。针对文档出现因字体库匹配错误而导致的乱码现象,为了能够自动匹配正确的字体库,从而避免后续显示文档内容时出现乱码,本专利技术实施例提供了一种字体库匹配方法、装置及设备。下面首先对本专利技术一实施例的文档内容的乱码修复方法进行介绍。如图1所示,本专利技术一实施例的文档内容的乱码修复方法的流程,应用于存储了多个字体库的终端,该方法可以包括以下步骤:S101,获取并根据待处理文档的字体信息,确定与字体信息对应的字体库标识信息。在具体实施中,待处理文档可以是各种含有文本的文档。例如:待处理文档可以是doc、wps等格式的文字处理文档,ppt、dps等格式的演示文稿文档,xls、et等格式的表格文档,pdf格式的可移植本文档来自技高网...

【技术保护点】
1.一种字体库匹配方法,其特征在于,应用于终端,所述终端中存储多个字体库,所述方法包括:/n获取并根据待处理文档的字体信息,确定与所述字体信息对应的字体库标识信息;/n根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据;/n采用预设的乱码识别算法,识别所述编码后的第一文本数据;/n当识别出所述编码后的第一文本数据中包含乱码文本数据,则选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;/n采用预设的乱码识别算法,识别所述编码后的第二文本数据;/n当识别出所述编码后的第二文本数据中包含乱码文本数据,则执行所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;/n当识别出所述编码后的第二文本数据中不包含乱码文本数据,则确定所述第二字体库为目标字体库。/n

【技术特征摘要】
1.一种字体库匹配方法,其特征在于,应用于终端,所述终端中存储多个字体库,所述方法包括:
获取并根据待处理文档的字体信息,确定与所述字体信息对应的字体库标识信息;
根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据;
采用预设的乱码识别算法,识别所述编码后的第一文本数据;
当识别出所述编码后的第一文本数据中包含乱码文本数据,则选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;
采用预设的乱码识别算法,识别所述编码后的第二文本数据;
当识别出所述编码后的第二文本数据中包含乱码文本数据,则执行所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;
当识别出所述编码后的第二文本数据中不包含乱码文本数据,则确定所述第二字体库为目标字体库。


2.根据权利要求1所述的方法,其特征在于,所述获取并根据待处理文档的字体信息,确定与所述字体信息对应的字体库标识信息,包括:
获取待处理文档的多个字体信息;
针对各字体信息,根据该字体信息确定与该字体信息对应的字体库标识信息;
在所述根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据之前,所述方法还包括:
根据所述各字体信息对所述待处理文档中所有文本进行分类,将各字体信息对应的文本分别作为目标文本;
确定每个目标文本中的目标文字的字数;
所述根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据,包括:
针对各字体信息和各目标文本,根据该字体信息对应的字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述目标文本中,对所述目标文本进行编码,得到所述目标文本对应的编码后的第一文本数据;
所述采用预设的乱码识别算法,识别所述编码后的第一文本数据,包括:
判断编码后的第一文本数据中是否有生僻字;
若有生僻字,则根据每个目标文本中生僻字的字数和目标文字的字数,计算生僻字在所述目标文本中的占有率;
判断所述生僻字在所述目标文本中的占有率是否大于第一预设阈值;
若所述生僻字在所述目标文本中的占有率大于第一预设阈值,则识别出所述编码后的第一文本数据中包含乱码文本数据。


3.根据权利要求2所述的方法,其特征在于,所述判断编码后的第一文本数据中是否有生僻字,包括:
从预存的字频表中获得每个目标文字的字频;
如果所述目标文字的字频低于预设生僻字的字频阈值,则确定该目标文字为生僻字。


4.根据权利要求2所述的方法,其特征在于,在所述判断出所述生僻字在所述目标文本中的占有率不大于第一预设阈值之后,所述方法还包括:
判断所述生僻字在所述目标文本中的占有率是否小于第二预设阈值,所述第二预设阈值小于所述第一预设阈值;
若所述生僻字在所述目标文本中的占有率小于第二预设阈值,则识别出所述编码后的第一文本数据中没有乱码文本数据;
若不小于所述第二预设阈值,则向用户输出是否需要修复文档提示;
在接收到用户输入的需要修复文档指令后,确定所述编码后的第一文本数据中包含乱码文本数据,并返回执行所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据。


5.根据权利要求2所述的方法,其特征在于,所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据,包括:
针对各字体信息和各目标文本,选取所述终端中未加载过的第二字体库,对所述目标文本进行编码,得到到所述目标文本对应的编码后的第二文本数据;
所述采用预设的乱码识别算法,识别所述编码后的第二文本数据,包括:
判断所述目标文本对应的编码后的第二文本数据中是否有生僻字;
若无生僻字,则识别出所述编码后的第二文本数据中不包含乱码文本数据;
若有生僻字,则执行下述步骤:
根据每个目标文本中生僻字的字数和目标文字的字数,计算生僻字在所述目标文本中的占有率;
判断所述生僻字在所述目标文本中的占有率是否大于所述第一预设阈值;
若所述生僻字在所述目标文本中的占有率大于所述第一预设阈值,则识别出所述编码后的第二文本数据中包含乱码文本数据。


6.根据权利要求5所述的方法,其特征在于,在所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据之前,所述方法还包括:
针对各字体信息和各目标文本,根据该字体信息对应的字体库标识信息,选取所述终端中未加载过的、具有所述字体库标识信息的第二字体库,对所述目标文本进行编码,得到所述目标文本对应的编码后的第二文本数据;
采用预设的乱码识别算法,识别所述目标文本对应的编码后的第二文本数据;
当识别出所述目标文本对应的编码后的第二文本数据中包含乱码文本数据,则执行所述...

【专利技术属性】
技术研发人员:冷志峰张作兵
申请(专利权)人:珠海金山办公软件有限公司北京金山办公软件股份有限公司广州金山移动科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1