认知属性选择方法、类别属性确定方法及系统和存储介质技术方案

技术编号:32460219 阅读:17 留言:0更新日期:2022-02-26 08:47
本发明专利技术公开了认知属性选择方法、类别属性确定方法及系统和存储介质,认知属性选择方法包括如下步骤:获取样本集中的各个属性的取值;计算样本集中各个属性取其对应的各个值的概率;计算样本集中各个属性取其对应的各个值时所获得的额外信息量;根据概率和额外信息量确定样本集中各个属性的平均熵减;取平均熵减中的最大平均熵减所对应的属性为所选择的属性。本发明专利技术取最大平均熵减所对应的属性为优选认知属性,通过认知目标的该优选认知属性的值筛选样本集可以获得关于认知目标类别属性的最多信息,从而可以尽快确定认知目标的类别属性,提高了认知目标类别属性的认知效率。提高了认知目标类别属性的认知效率。提高了认知目标类别属性的认知效率。

【技术实现步骤摘要】
认知属性选择方法、类别属性确定方法及系统和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于样本集的认知属性的选择方法、认知目标类别属性的确定方法及系统和存储介质。

技术介绍

[0002]人工智能
经常遇到目标分类的问题,目标分类的核心是根据已知样本集中样本的某些特征,判断某个目标属于哪种已知的样本类,这个问题的实质为确定该目标的类别属性,然后根据目标的类别属性将其划分到样本集中某个已知的样本类中,以完成目标分类的任务。目标分类在各项技术中已得到广泛应用,如我们日常使用的图像识别、手写数字识别、语音识别等都可以归结为认知技术中的目标分类。
[0003]认知技术是人工智能领域的产物,它通过系统的感知能力获取目标的特定属性的取值,确定目标的类别属性等等。在基于样本集的目标类别认知系统中,首先会根据已认知对象形成包含已认知对象的各属性、各属性的取值及已认知对象所属类别的样本集,后续对类别属性未知的认知目标进行识别以获取其类别属性时,需要依次获取认知目标的各个属性的取值,根据这些取值来筛选样本集,从而找到样本集中与认知目标属性取值一致的样本,根据该样本的类别确定认知目标的类别属性。可见,目标类别属性的认知过程中获取认知目标属性的取值尤为重要。
[0004]认知目标的类别属性可能由其全部属性的取值共同决定,也可能由其部分属性的取值即可决定,在其部分属性的取值就可以确定其类别属性的情况下,只需获取认知目标的该部分属性的取值即可,无需获取认知目标的全部属性的属性值,而传统目标认知技术中通常通过获取认知目标的全部属性的取值确定认知目标的类别属性,从而增加了获取认知目标的属性取值以及根据属性取值筛选样本集的计算时间等成本。进一步地,专利技术人发现,在多个属性共同决定认知目标的类别属性的情况下,获取认知目标的属性的先后顺序也会影响确定认知目标类别属性的效率和成本,那些能为确定认知目标的类别属性贡献最大的属性应该被优先选择。

技术实现思路

[0005]本专利技术的目的是解决现有技术在确定认知目标的类别属性时无先后顺序地使用认知目标的全部属性的取值筛选样本集而造成的目标类别属性认知效率低下的技术问题。
[0006]为实现上述专利技术目的,本专利技术具体采用如下技术方案:
[0007]一方面,提供了一种基于样本集的认知属性的选择方法,所述认知属性用于确定认知目标的类别属性,所述方法包括:
[0008]获取所述样本集中的各个属性的取值;
[0009]计算所述样本集中各个属性取其对应取值的概率;
[0010]计算所述样本集中各个属性取其对应的取值所获得的额外信息量;
[0011]根据所述概率和所述额外信息量确定所述样本集中各个属性的平均熵减;
[0012]取所述平均熵减中的最大平均熵减,所述最大平均熵减所对应的属性为所选择的认知属性。
[0013]优选地,所述概率的计算方法为:
[0014][0015]其中,为当所述样本集中属性U的取值为U
j
时的概率,为所述样本集中属性U的取值为U
j
的样本的个数,N为所述样本集中样本的总个数。
[0016]优选地,所述额外信息量根据第一信息量和第二信息量确定,所述第一信息量为所述样本集的综合信息量,所述第二信息量为所述样本集中各个属性取其对应取值时所对应的样本的所属类别的信息量。
[0017]进一步地优选地,所述第一信息量的具体计算方法为:
[0018][0019]I
i


P
i
·
log
a
P
i

[0020][0021]其中,I为所述第一信息量,表示所述样本集的综合信息量,n为所述样本集中的类别的总个数,I
i
为所述样本集中类别i的信息量,P
i
为所述样本集中所述类别i中样本的个数与所述样本集中样本的总个数的比值,k
i
为所述样本集中所述类别i中样本的个数,N为所述样本集中样本的总个数,a>1。
[0022]进一步地优选地,a=2,由此计算得出的结果代表信息量的度量单位为比特,比特为二进制。
[0023]进一步地优选地,根据所述第一信息量和第二信息量确定所述额外信息量的具体方法为:
[0024][0025]其中,为所述额外信息量,表示所述样本集中属性U的取值为U
j
时额外所获得的信息量,I为所述第一信息量,表示所述样本集的综合信息量,为所述第二信息量,表示所述样本集中属性U的取值为U
j
时所对应的样本的所属类别M的信息量。
[0026]优选地,所述平均熵减表示通过所述样本集中至少一个属性确定所述认知目标的类别属性所获得的平均信息量,具体计算方法为:
[0027][0028]其中,为所述样本集中属性U的平均熵减,表示通过属性U确定所述认知目标的类别属性所获得的平均信息量,为当所述样本集中属性U的取值为U
j
时的概率,为所述额外信息量,表示所述样本集中属性U的取值为U
j
时额外所获得的信息量。
[0029]另一方面,还提供了一种基于样本集的认知目标类别属性的确定方法,包括如下步骤:
[0030]利用如上所述的一种基于样本集的认知属性的选择方法选择认知属性;
[0031]获取认知目标的所述认知属性的取值;
[0032]利用所述认知目标的所述认知属性的取值筛选所述样本集获得样本子集,以所述样本子集中的样本对应的类别确定所述认知目标的类别属性。
[0033]优选地,以所述样本子集中的样本对应的类别确定认知目标的类别属性包括:
[0034]判断所述样本子集是否为空集,如果是,则认知目标的类别属性认知失败;否则:
[0035]判断所述样本子集中的样本是否具有单一的类别属性,如果是,则认知目标的类别属性认知成功,即为该所述单一的类别属性;否则判断所述样本集的所有属性是否都已被选择过,如果是,则认知目标的类别属性认知失败;否则:
[0036]将样本子集作为新的样本集,循环执行前述一种基于样本集的认知目标类别属性的确定方法中的步骤,直到认知目标的类别属性认知成功或认知失败。
[0037]优选地,样本集中已被选择过的属性不参与该循环步骤的执行。
[0038]另一方面,还提供了一种基于样本集的认知属性的选择系统,所述系统包括存储器、处理器及存储在所述存储器并可在所述处理器上运行的程序,所述程序在被所述处理器执行时实现上述一种基于样本集的认知属性的选择方法的步骤。
[0039]另一方面,还提供了一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一个程序,所述至少一个程序可被至少一个处理器执行,所述至少一个程序在被所述至少一个处理器执行时实现上述一种基于样本集的认知属性的选择方法的步骤。
[0040]另一方面,还提供了一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于样本集的认知属性的选择方法,所述认知属性用于确定认知目标的类别属性,其特征在于,所述方法包括:获取所述样本集中的各个属性的取值;计算所述样本集中各个属性取其对应取值的概率;计算所述样本集中各个属性取其对应取值时所获得的额外信息量;根据所述概率和所述额外信息量确定所述样本集中各个属性的平均熵减;取所述平均熵减中的最大平均熵减,所述最大平均熵减所对应的属性为所选择的认知属性。2.根据权利要求1所述的一种基于样本集的认知属性的选择方法,其特征在于,所述概率的计算方法为:其中,为当所述样本集中属性U的取值为U
j
时的概率,为所述样本集中属性U的取值为U
j
的样本的个数,N为所述样本集中样本的总个数。3.根据权利要求1所述的一种基于样本集的认知属性的选择方法,其特征在于,所述额外信息量根据第一信息量和第二信息量确定,所述第一信息量为所述样本集的综合信息量,所述第二信息量为所述样本集中各个属性取其对应取值时所对应的样本的所属类别的信息量。4.根据权利要求3所述的一种基于样本集的认知属性的选择方法,其特征在于,所述第一信息量的具体计算方法为:I
i


P
i
·
log
a
p
i
,其中,I为所述第一信息量,表示所述样本集的综合信息量,n为所述样本集中的类别的总个数,I
i
为所述样本集中类别i的信息量,p
i
为所述样本集中所述类别i中样本的个数与所述样本集中样本的总个数的比值,k
i
为所述样本集中所述类别i中样本的个数,N为所述样本集中样本的总个数,a>1。5.根据权利要求4所述的一种基于样本集的认知属性的选择方法,其特征在于,a=2,由此计算得出的结果代表信息量的度量单位为比特,比特为二进制。6.根据权利要求3所述的一种基于样本集的认知属性的选择方法,其特征在于,根据所述第一信息量和第二信息量确定所述额外信息量的具体方法为:其中,为所述额外信息量,表示所述样本集中属性U的取值为U
j
时额外所获得的信息量,I为所述第一信息量,表示所述样本集的综合信息量,为所述第二信息量,表示所述样本集中属性U的取值为U
j
时所对应的样本的所属类别M的信息量。
7.根据权利要求1所述的一种基于样本集的认知属性的选择方法,其特征在于,所述平均熵减表示通过所述样本集中至少一个属性确定所述认知目标的类别属性所获得的平均信息量,具体计算方法为:其中,为所述样本集中属性U的平均...

【专利技术属性】
技术研发人员:邓少冬
申请(专利权)人:西安米克斯智能技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1