【技术实现步骤摘要】
认知属性选择方法、类别属性确定方法及系统和存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种基于样本集的认知属性的选择方法、认知目标类别属性的确定方法及系统和存储介质。
技术介绍
[0002]人工智能
经常遇到目标分类的问题,目标分类的核心是根据已知样本集中样本的某些特征,判断某个目标属于哪种已知的样本类,这个问题的实质为确定该目标的类别属性,然后根据目标的类别属性将其划分到样本集中某个已知的样本类中,以完成目标分类的任务。目标分类在各项技术中已得到广泛应用,如我们日常使用的图像识别、手写数字识别、语音识别等都可以归结为认知技术中的目标分类。
[0003]认知技术是人工智能领域的产物,它通过系统的感知能力获取目标的特定属性的取值,确定目标的类别属性等等。在基于样本集的目标类别认知系统中,首先会根据已认知对象形成包含已认知对象的各属性、各属性的取值及已认知对象所属类别的样本集,后续对类别属性未知的认知目标进行识别以获取其类别属性时,需要依次获取认知目标的各个属性的取值,根据这些取值来筛选样本集,从而找到样本集中与认知目标属性取值一致的样本,根据该样本的类别确定认知目标的类别属性。可见,目标类别属性的认知过程中获取认知目标属性的取值尤为重要。
[0004]认知目标的类别属性可能由其全部属性的取值共同决定,也可能由其部分属性的取值即可决定,在其部分属性的取值就可以确定其类别属性的情况下,只需获取认知目标的该部分属性的取值即可,无需获取认知目标的全部属性的属性值,而传统目标认知技术中通常 ...
【技术保护点】
【技术特征摘要】
1.一种基于样本集的认知属性的选择方法,所述认知属性用于确定认知目标的类别属性,其特征在于,所述方法包括:获取所述样本集中的各个属性的取值;计算所述样本集中各个属性取其对应取值的概率;计算所述样本集中各个属性取其对应取值时所获得的额外信息量;根据所述概率和所述额外信息量确定所述样本集中各个属性的平均熵减;取所述平均熵减中的最大平均熵减,所述最大平均熵减所对应的属性为所选择的认知属性。2.根据权利要求1所述的一种基于样本集的认知属性的选择方法,其特征在于,所述概率的计算方法为:其中,为当所述样本集中属性U的取值为U
j
时的概率,为所述样本集中属性U的取值为U
j
的样本的个数,N为所述样本集中样本的总个数。3.根据权利要求1所述的一种基于样本集的认知属性的选择方法,其特征在于,所述额外信息量根据第一信息量和第二信息量确定,所述第一信息量为所述样本集的综合信息量,所述第二信息量为所述样本集中各个属性取其对应取值时所对应的样本的所属类别的信息量。4.根据权利要求3所述的一种基于样本集的认知属性的选择方法,其特征在于,所述第一信息量的具体计算方法为:I
i
=
‑
P
i
·
log
a
p
i
,其中,I为所述第一信息量,表示所述样本集的综合信息量,n为所述样本集中的类别的总个数,I
i
为所述样本集中类别i的信息量,p
i
为所述样本集中所述类别i中样本的个数与所述样本集中样本的总个数的比值,k
i
为所述样本集中所述类别i中样本的个数,N为所述样本集中样本的总个数,a>1。5.根据权利要求4所述的一种基于样本集的认知属性的选择方法,其特征在于,a=2,由此计算得出的结果代表信息量的度量单位为比特,比特为二进制。6.根据权利要求3所述的一种基于样本集的认知属性的选择方法,其特征在于,根据所述第一信息量和第二信息量确定所述额外信息量的具体方法为:其中,为所述额外信息量,表示所述样本集中属性U的取值为U
j
时额外所获得的信息量,I为所述第一信息量,表示所述样本集的综合信息量,为所述第二信息量,表示所述样本集中属性U的取值为U
j
时所对应的样本的所属类别M的信息量。
7.根据权利要求1所述的一种基于样本集的认知属性的选择方法,其特征在于,所述平均熵减表示通过所述样本集中至少一个属性确定所述认知目标的类别属性所获得的平均信息量,具体计算方法为:其中,为所述样本集中属性U的平均...
【专利技术属性】
技术研发人员:邓少冬,
申请(专利权)人:西安米克斯智能技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。