【技术实现步骤摘要】
字体库匹配方法、装置及设备
本专利技术涉及文字处理
,特别是涉及一种字体库匹配方法、装置及设备。
技术介绍
乱码指的是文档内容在电子设备上不能显示为正确的字符,而显示为其他无意义的字符。在电子设备上显示文档的文本内容时,可以基于文档中的文本内容的字体信息,以及与字体信息对应的字体库标识信息,在电子设备中查找到具有与字体信息对应的字体库标识信息的字体库,作为与文档匹配的字体库,将该字体库加载到该文本内容,从而显示正确的文本内容。通常情况下,文档中的文本内容的字体信息是在编辑得到该文档时生成、并携带在文档中的,与编辑该文档时所使用的字体库的字体库标识信息存在对应关系,当文档编辑完成时,该文档中字体信息与字体库标识信息的对应关系将不再变更。同时,同一字体库在不同操作系统中可能具有不同的字体库标识信息,因此,当编辑文档的文本内容的电子设备和显示文档的文本内容的电子设备具有不同的操作系统时,可能造成字体信息所对应的字体库标识信息出现了变更,而在查找与文档匹配的字体库时,依然按照操作系统变更前、文档中未变更的字体信息与字体库标识信息的对应关系进行查找。此时,由于变更后的字体库标识信息不再适用于未变更的字体信息与字体库标识信息的对应关系,因此,会出现由字体库查找错误所导致的字体库匹配错误,进而使文档内容在电子设备上显示时出现乱码。
技术实现思路
本专利技术实施例的目的在于提供一种字体库匹配方法、装置及设备,以实现在文档出现因字体库匹配错误而导致的乱码时,自动匹配正确的字体库,从而避免后续显示文档内 ...
【技术保护点】
1.一种字体库匹配方法,其特征在于,应用于终端,所述终端中存储多个字体库,所述方法包括:/n获取并根据待处理文档的字体信息,确定与所述字体信息对应的字体库标识信息;/n根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据;/n采用预设的乱码识别算法,识别所述编码后的第一文本数据;/n当识别出所述编码后的第一文本数据中包含乱码文本数据,则选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;/n采用预设的乱码识别算法,识别所述编码后的第二文本数据;/n当识别出所述编码后的第二文本数据中包含乱码文本数据,则执行所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;/n当识别出所述编码后的第二文本数据中不包含乱码文本数据,则确定所述第二字体库为目标字体库。/n
【技术特征摘要】
1.一种字体库匹配方法,其特征在于,应用于终端,所述终端中存储多个字体库,所述方法包括:
获取并根据待处理文档的字体信息,确定与所述字体信息对应的字体库标识信息;
根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据;
采用预设的乱码识别算法,识别所述编码后的第一文本数据;
当识别出所述编码后的第一文本数据中包含乱码文本数据,则选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;
采用预设的乱码识别算法,识别所述编码后的第二文本数据;
当识别出所述编码后的第二文本数据中包含乱码文本数据,则执行所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据;
当识别出所述编码后的第二文本数据中不包含乱码文本数据,则确定所述第二字体库为目标字体库。
2.根据权利要求1所述的方法,其特征在于,所述获取并根据待处理文档的字体信息,确定与所述字体信息对应的字体库标识信息,包括:
获取待处理文档的多个字体信息;
针对各字体信息,根据该字体信息确定与该字体信息对应的字体库标识信息;
在所述根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据之前,所述方法还包括:
根据所述各字体信息对所述待处理文档中所有文本进行分类,将各字体信息对应的文本分别作为目标文本;
确定每个目标文本中的目标文字的字数;
所述根据所述字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述待处理文档中的文本中,对所述待处理文档中的文本进行编码,得到编码后的第一文本数据,包括:
针对各字体信息和各目标文本,根据该字体信息对应的字体库标识信息,选取所述终端中具有所述字体库标识信息的第一字体库加载到所述目标文本中,对所述目标文本进行编码,得到所述目标文本对应的编码后的第一文本数据;
所述采用预设的乱码识别算法,识别所述编码后的第一文本数据,包括:
判断编码后的第一文本数据中是否有生僻字;
若有生僻字,则根据每个目标文本中生僻字的字数和目标文字的字数,计算生僻字在所述目标文本中的占有率;
判断所述生僻字在所述目标文本中的占有率是否大于第一预设阈值;
若所述生僻字在所述目标文本中的占有率大于第一预设阈值,则识别出所述编码后的第一文本数据中包含乱码文本数据。
3.根据权利要求2所述的方法,其特征在于,所述判断编码后的第一文本数据中是否有生僻字,包括:
从预存的字频表中获得每个目标文字的字频;
如果所述目标文字的字频低于预设生僻字的字频阈值,则确定该目标文字为生僻字。
4.根据权利要求2所述的方法,其特征在于,在所述判断出所述生僻字在所述目标文本中的占有率不大于第一预设阈值之后,所述方法还包括:
判断所述生僻字在所述目标文本中的占有率是否小于第二预设阈值,所述第二预设阈值小于所述第一预设阈值;
若所述生僻字在所述目标文本中的占有率小于第二预设阈值,则识别出所述编码后的第一文本数据中没有乱码文本数据;
若不小于所述第二预设阈值,则向用户输出是否需要修复文档提示;
在接收到用户输入的需要修复文档指令后,确定所述编码后的第一文本数据中包含乱码文本数据,并返回执行所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据。
5.根据权利要求2所述的方法,其特征在于,所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据,包括:
针对各字体信息和各目标文本,选取所述终端中未加载过的第二字体库,对所述目标文本进行编码,得到到所述目标文本对应的编码后的第二文本数据;
所述采用预设的乱码识别算法,识别所述编码后的第二文本数据,包括:
判断所述目标文本对应的编码后的第二文本数据中是否有生僻字;
若无生僻字,则识别出所述编码后的第二文本数据中不包含乱码文本数据;
若有生僻字,则执行下述步骤:
根据每个目标文本中生僻字的字数和目标文字的字数,计算生僻字在所述目标文本中的占有率;
判断所述生僻字在所述目标文本中的占有率是否大于所述第一预设阈值;
若所述生僻字在所述目标文本中的占有率大于所述第一预设阈值,则识别出所述编码后的第二文本数据中包含乱码文本数据。
6.根据权利要求5所述的方法,其特征在于,在所述选取所述终端中未加载过的第二字体库,对所述待处理文档中的文本进行编码,得到编码后的第二文本数据之前,所述方法还包括:
针对各字体信息和各目标文本,根据该字体信息对应的字体库标识信息,选取所述终端中未加载过的、具有所述字体库标识信息的第二字体库,对所述目标文本进行编码,得到所述目标文本对应的编码后的第二文本数据;
采用预设的乱码识别算法,识别所述目标文本对应的编码后的第二文本数据;
当识别出所述目标文本对应的编码后的第二文本数据中包含乱码文本数据,则执行所述...
【专利技术属性】
技术研发人员:冷志峰,张作兵,
申请(专利权)人:珠海金山办公软件有限公司,北京金山办公软件股份有限公司,广州金山移动科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。