本发明专利技术涉及一种存在模糊态的字轮图像数字识别方法,具体包括以下步骤:获取状态提取器的训练集,以及获取分类器的训练集;使用状态提取器的训练集对状态提取器进行训练,使用分类器的训练集对分类器进行训练;将待识别样本输入训练后的状态提取器,得到状态变量,将状态变量输入训练后的分类器,输出分类结果。本发明专利技术对连续变化的图像或没有明确分类界限的图像进行有效的识别处理,比如字轮图像数字的识别,使用构造的状态提取器对待识别样本的特征状态进行提取,得到状态变量,根据状态变量经隶属函数后得到的隶属度,将待识别样本送入隶属度相应的分类器中,从而对待识别样本进行正确的分类。
【技术实现步骤摘要】
一种存在模糊态的字轮图像数字识别方法
本专利技术涉及图像识别
,特别涉及一种存在模糊态的字轮图像数字识别方法。
技术介绍
图像信息的处理是当今技术的一种重要课题,近些年随着深度学习方法的发展,对于图像识别问题已经给出了较为成熟的解决方案,在车牌识别、文本识别等场景中取得了落地应用。但目前学界研究的主要是具有明确分类界线的图像识别问题,而实际场景中常存在着一些界线模糊的图像分类问题。比如字轮图像数字的识别是一种典型的界线模糊图像分类问题,因为字轮转动是一个连续的过程,既有可能出现字轮中完整字符的情况,比如如图1所示出现的字符“5”为完整的字符,或者出现的字符“6”也是完整的字符,也可能出现半字符的情况,比如出现的字符“5”和字符“6”的中间状态,更多的可能是介于完整字符与半字符之间的情况。可以将完整字符和半字符的情况称为“确定状态”,将介于完整字符和半字符之间的情况称为“模糊态”。在图像识别的场景中,若忽略处于模糊态的数据,将会导致图像识别模型无法准确有效的识别处于模糊态的图像,也就难以推广应用。若对处于模糊态的数据强行进行类别的划分,又会造成模型在训练过程中的迭代不收敛。因此,对于这些连续变化的场景或者没有明确分类界线的图像识别问题进行有效的处理,使得其能够被分类,是图像识别中非常重要的问题。
技术实现思路
本专利技术的目的在于对连续变化的图像或没有明确分类界限的图像进行有效的识别处理,比如字轮图像数字的识别,提供一种存在模糊态的字轮图像数字识别方法。为了实现上述专利技术目的,本专利技术实施例提供了以下技术方案:一种存在模糊态的字轮图像数字识别方法,具体包括以下步骤:获取状态提取器的训练集,以及获取分类器的训练集;使用状态提取器的训练集对状态提取器进行训练,使用分类器的训练集对分类器进行训练;将待识别样本输入训练后的状态提取器,得到状态变量,将状态变量输入训练后的分类器,输出分类结果。所述获取状态提取器的训练集的步骤,包括:从数据集中筛选出确定状态的数据,舍弃模糊态的数据,并对筛选出来的确定状态的数据进行状态标注,状态标注后的数据形成确定状态训练集,作为状态提取器的训练集;所述状态标注包括完整字符状态标注、半字符状态标注;所述获取分类器的训练集的步骤,包括:对数据集中的所有数据进行分类标注,分类标注后的数据作为分类器的训练集;所述分类标注包括字符标注。所述使用状态提取器的训练集对状态提取器进行训练的步骤,包括:预训练状态特征提取结构:使用确定状态训练集对状态特征提取结构进行预训练,得到状态特征提取结构的参数;特征度量学习:每次向状态特征提取结构中随机输入两个样本以及这两个样本之间的距离,训练以状态特征提取结构为基础的状态提取器;构造确定状态的特征集:选取每个确定状态训练集中与同状态其余样本距离之和最小的一个样本,作为该确定状态的特征样本,将该特征样本添加到确定状态的特征集中,直到确定状态的特征集内存储了代表N个确定状态的N个特征。所述使用分类器的训练集对分类器进行训练的步骤,包括:将分类标注的训练集输入训练后的状态提取器,得到状态变量x0;所述状态变量x0经N个特征所对应的N个隶属函数后,映射得到该状态变量对各模糊集的隶属度;根据N个隶属函数对应的N个模糊集的隶属度获取各模糊集的水平截集作为分类器的训练集对分类器进行训练,得到N个分类器。所述将待识别样本输入训练后的状态提取器,得到状态变量,将状态变量输入训练后的分类器,输出分类结果的步骤,包括:将待识别样本输入训练后的状态提取器,得到状态变量x;所述状态变量x经N个特征所对应的N个隶属函数后,映射得到该状态变量x分别对N个模糊集的隶属度;根据得到的隶属度将输入的待识别样本进行唯一通路选择,选择进入其中一个模糊集对应的分类器中;经该分类器后进行识别,输出该待识别样的分类结果。所述将待识别样本输入训练后的状态提取器,得到状态变量x的步骤,包括:将待识别样本的状态特征与确定状态的特征集中的N个特征作比较,计算出N个距离值,形成状态变量x。与现有技术相比,本专利技术的有益效果:本专利技术对连续变化的图像或没有明确分类界限的图像进行有效的识别处理,比如字轮图像数字的识别,使用构造的状态提取器对待识别样本的特征状态进行提取,得到状态变量,根据状态变量经隶属函数后得到的隶属度,将待识别样本送入隶属度相应的分类器中,从而对待识别样本进行正确的分类。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为字轮图像数字的转动过程示意图;图2为本专利技术状态提取器的训练过程示意图;图3为本专利技术分类器的训练过程示意图;图4为本专利技术待识别样本的识别过程示意图;图5为本专利技术待识别样本在识别过程中提取状态变量的示意图;图6为本专利技术实施例模糊集示意图;图7为本专利技术状态特征提取结构设计示意图;图8为本专利技术状态分类网络设计示意图;图9为本专利技术状态提取器设计示意图;图10为本专利技术分类器结构设计示意图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。实施例:在实现本方案之前,对模糊集的概念进行说明,设论域为X,对于传统的集合A,有,假设存在一个元素,那么元素要么属于集合A,要么不属于集合A,因此由集合A可以确定一个映射关系:,其中,对于模糊集中元素与集合的关系具有不确定性,因此映射,,则称确定了论域X的一个模糊集,称为模糊集的隶属函数,称为元素对模糊集的隶属度,反映了元素对模糊集的隶属程度。在论域X中,给定一个模糊集,由对于的隶属度大于水平值(阈值)的元素组成的集合,叫做该模糊集的水平截集。用公式表示为,即为模糊集的水平截集。本专利技术通过下述实例来说明技术方案的实现过程:定义字轮表盘中两个确定状态:完整字符的情况为状态1,半字符的情况为状态0,完整字符和半字符之间的情况为模糊态,即确定状态的数据集本文档来自技高网...
【技术保护点】
1.一种存在模糊态的字轮图像数字识别方法,其特征在于:具体包括以下步骤:/n获取状态提取器的训练集,以及获取分类器的训练集;/n使用状态提取器的训练集对状态提取器进行训练,使用分类器的训练集对分类器进行训练;/n将待识别样本输入训练后的状态提取器,得到状态变量,将状态变量输入训练后的分类器,输出分类结果。/n
【技术特征摘要】
1.一种存在模糊态的字轮图像数字识别方法,其特征在于:具体包括以下步骤:
获取状态提取器的训练集,以及获取分类器的训练集;
使用状态提取器的训练集对状态提取器进行训练,使用分类器的训练集对分类器进行训练;
将待识别样本输入训练后的状态提取器,得到状态变量,将状态变量输入训练后的分类器,输出分类结果。
2.根据权利要求1所述的方法,其特征在于:
所述获取状态提取器的训练集的步骤,包括:从数据集中筛选出确定状态的数据,舍弃模糊态的数据,并对筛选出来的确定状态的数据进行状态标注,状态标注后的数据形成确定状态训练集,作为状态提取器的训练集;所述状态标注包括完整字符状态标注、半字符状态标注;
所述获取分类器的训练集的步骤,包括:对数据集中的所有数据进行分类标注,分类标注后的数据作为分类器的训练集;所述分类标注包括字符标注。
3.根据权利要求2所述的方法,其特征在于:所述使用状态提取器的训练集对状态提取器进行训练的步骤,包括:
预训练状态特征提取结构:使用确定状态训练集对状态特征提取结构进行预训练,得到状态特征提取结构的参数;
特征度量学习:每次向状态特征提取结构中随机输入两个样本以及这两个样本之间的距离,训练以状态特征提取结构为基础的状态提取器;
构造确定状态的特征集:选取每个确定状态训练集中与同状态其余样本距离之和最小的一个样本,作为该...
【专利技术属性】
技术研发人员:朱炼,赵勇,常关羽,牛富增,贾忠友,
申请(专利权)人:成都千嘉科技有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。