System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请实施例涉及网络模型,尤其涉及一种小语种字体生成方法、装置、计算机设备、计算机可读存储介质、计算机程序产品。
技术介绍
1、为了提高文字识别模型对小语种文字的识别正确率,需要大量的小语种文字的样本数据,以对文字识别模型进行训练。因此,如何得到大量的训练样本数据便变得至关重要。针对小语种文字的样本数据包括多种字体,往往是通过收集已有的小语种数据或者人工手动设计的。由于懂小语种的人比较少,小语种文字本身数据量和已有字体也少,因此针对小语种文字的样本数据的采集相当困难。而且,人工手动设计小语种字体的效率比较低,人工成本却很高。
2、需要说明的是,上述内容并不必然是现有技术,也不用于限制本申请的专利保护范围。
技术实现思路
1、本申请实施例提供一种小语种字体生成方法、装置、计算机设备、计算机可读存储介质、计算机程序产品,以解决或缓解上面提出的一项或更多项技术问题。
2、本申请实施例的一个方面提供了一种小语种字体生成方法,所述方法包括:
3、获取参考字符和待处理字符,所述参考字符为参考字体的非小语种字符,所述待处理字符为小语种字符;
4、将所述参考字符和所述待处理字符输入字体生成模型的解码器,对所述参考字符提取文字样式特征,对所述待处理字符提取文字结构特征;
5、通过编码器融合所述文字样式特征和所述文字结构特征,以使所述待处理字符学习所述参考字符的字体样式,生成所述待处理字符对应的小语种字体,所述字体生成模型是基于异构聚合专家模
6、可选地,所述对所述参考字符提取文字样式特征,对所述待处理字符提取文字结构特征,包括:
7、将所述参考字符和所述待处理字符拆解为笔画维度编码;
8、基于所述笔画维度编码,分析所述待处理字符的文字结构特征和所述参考字符的文字样式特征。
9、可选地,所述融合所述文字样式特征和所述文字结构特征,以使所述待处理字符学习所述参考字符的字体样式,生成所述待处理字符对应的小语种字体,包括:
10、根据所述待处理字符的文字结构特征,找到与所述文字结构特征对应的所述参考字符的笔画;
11、获取所述笔画对应的所述文字样式特征,并通过模拟所述文字样式特征,生成所述待处理字符对应的小语种字体。
12、可选地,所述方法还包括:
13、在所述字体生成模型中通过异构聚合专家模型将每个字符的文字结构特征和文字样式特征进行解耦,所述异构聚合专家模型采用双分支结构,其中第一分支处理字符的通道信息,第二分支处理字符的空间信息,并聚合所述第一分支输出的通道信息和所述第二分支输出的空间信息。
14、可选地,所述字体生成模型根据多语种样本数据进行训练得到,且所述多语种样本数据包含所述参考字符对应的语种,不包含所述待处理字符对应的小语种。
15、可选地,所述字体生成模型的训练过程包括:
16、获取多语种样本数据,所述多语种样本数据为非小语种的字符样本;
17、根据所述多语种样本数据训练所述字体生成模型;
18、通过至少一种损失函数评估模型效果,得到最终训练好的所述字体生成模型。
19、可选地,所述通过至少一种损失函数评估模型效果包括:
20、采用内容-风格同质性损失函数监督所述字体生成模型的编码器,以进一步增加所述文字结构特征和所述文字样式特征之间的异质性,所述内容-风格同质性损失函数基于所述文字结构特征和所述文字样式特对应的向量之间的距离得到,所述距离越大,所述内容-风格同质性损失函数越小。
21、本申请实施例的另一个方面提供了一种小语种字体生成装置,所述装置包括:
22、获取模块,用于获取参考字符和待处理字符,所述参考字符为参考字体的非小语种字符,所述待处理字符为小语种字符;
23、生成模块,用于将所述参考字符和所述待处理字符输入字体生成模型的解码器,对所述参考字符提取文字样式特征,对所述待处理字符提取文字结构特征;通过编码器融合所述文字样式特征和所述文字结构特征,以使所述待处理字符学习所述参考字符的字体样式,生成所述待处理字符对应的小语种字体,所述字体生成模型是基于异构聚合专家模型得到的。
24、本申请实施例的另一个方面提供了一种计算机设备,包括:
25、至少一个处理器;及
26、与所述至少一个处理器通信连接的存储器;
27、其中:所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
28、本申请实施例的另一个方面提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机指令,所述计算机指令被处理器执行时实现如上所述的方法。
29、本申请实施例的另一个方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述的方法。
30、本申请实施例采用上述技术方案可以包括如下优势:
31、通过基于异构聚合专家模型的字体生成模型实现跨语种字体生成,提升小语种字体生成效率,而且不需要低资源的小语种样本数据也可以训练出有效的模型,可以解决小语种的字体库有限或不存在的难题,使得小语种有更多的字体,也可以节省设计小语种字体的人力成本。
本文档来自技高网...【技术保护点】
1.一种小语种字体生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述参考字符提取文字样式特征,对所述待处理字符提取文字结构特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述融合所述文字样式特征和所述文字结构特征,以使所述待处理字符学习所述参考字符的字体样式,生成所述待处理字符对应的小语种字体,包括:
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述字体生成模型根据多语种样本数据进行训练得到,且所述多语种样本数据包含所述参考字符对应的语种,不包含所述待处理字符对应的小语种。
6.根据权利要求5所述的方法,其特征在于,所述字体生成模型的训练过程包括:
7.根据权利要求6所述的方法,其特征在于,所述通过至少一种损失函数评估模型效果包括:
8.一种小语种字体生成装置,其特征在于,所述装置包括:
9. 一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7所述方法的步骤。
...【技术特征摘要】
1.一种小语种字体生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述参考字符提取文字样式特征,对所述待处理字符提取文字结构特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述融合所述文字样式特征和所述文字结构特征,以使所述待处理字符学习所述参考字符的字体样式,生成所述待处理字符对应的小语种字体,包括:
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述字体生成模型根据多语种样本数据进行训练得到,且所述多语种样本数据包含所述参考字符对应的语种,不包含所述待处理字...
【专利技术属性】
技术研发人员:张婕蕾,王伟杭,
申请(专利权)人:上海幻电信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。