数据类别属性的确定方法及装置、存储介质、电子装置制造方法及图纸

技术编号:30329312 阅读:16 留言:0更新日期:2021-10-10 00:31
本发明专利技术实施例提供了一种数据类别属性的确定方法及装置、存储介质、电子装置,该方法包括:将目标数据输入至目标网络模型中,得到目标网络模型输出的目标数据的第一特征和第二特征,其中,第一特征用于表示目标数据的特征均值,第二特征用于表示目标数据的特征方差;利用第一特征和第二特征确定目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率;基于目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率确定目标数据的类别属性。通过本发明专利技术,可以解决相关技术中对外部数据的分类不准确的问题,达到准确分类数据的效果。到准确分类数据的效果。到准确分类数据的效果。

【技术实现步骤摘要】
数据类别属性的确定方法及装置、存储介质、电子装置


[0001]本专利技术实施例涉及数据处理领域,具体而言,涉及一种数据类别属性的确定方法及装置、存储介质、电子装置。

技术介绍

[0002]在真实世界中,几乎所有的分类模型在实际使用的时候都会面临一个问题,需要处理不属于任何一个已知类别的外部数据,一般分类的方法都会强制的把数据分类到其中一个已知的类别中。
[0003]开集分类问题(open

set problem)不仅仅包含0~9的数字类别,还包含其他如A~Z等等的未知类别,但是这些未知的类别并没有标签,分类器无法知道这些未知类别里面图像的具体类别,如:是否是A,这些许许多多的不同类别图像共同构成了一个类别:未知类别,在检测里面我们叫做背景类别(background),而开集分类问题即:区分这10个类别且拒绝其他未知类别。
[0004]现有技术中公开的开集分类方法,在训练的时候增加了很多类别,但在预测的时候仍然面临外部数据的问题。
[0005]针对上述技术问题,相关技术中尚未提出有效的解决方案。

技术实现思路

[0006]本专利技术实施例提供了一种数据类别属性的确定方法及装置、存储介质、电子装置,以至少解决相关技术中对外部数据的分类不准确的问题。
[0007]根据本专利技术的一个实施例,提供了一种数据类别属性的确定方法,包括:将目标数据输入至目标网络模型中,得到上述目标网络模型输出的上述目标数据的第一特征和第二特征,其中,上述第一特征用于表示上述目标数据的特征均值,上述第二特征用于表示上述目标数据的特征方差;利用第一特征和第二特征确定目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率;基于目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率确定目标数据的类别属性。
[0008]根据本专利技术的另一个实施例,提供了一种数据类别属性的确定装置,包括:第一输入模块,用于将目标数据输入至目标网络模型中,得到上述目标网络模型输出的上述目标数据的第一特征和第二特征,其中,上述第一特征用于表示上述目标数据的特征均值,上述第二特征用于表示上述目标数据的特征方差;第一确定模块,用于利用第一特征和第二特征确定目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率;第二确定模块,用于基于目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率确定目标数据的类别属性。
[0009]在一个示例性实施例中,上述第一确定模块,包括:第一输入单元,用于将上述第一特征输入至分类器,得到上述分类器计算的上述目标数据归属的上述目标数据类别,其中,上述第二特征还用于表示上述分类器的输出特征;第一确定单元,用于基于第一特征的
特征均值和第二特征的特征方差、第一参数以及预设数据类别确定目标数据归属于目标数据类别的概率。
[0010]在一个示例性实施例中,上述第二确定模块,包括以下之一:第二确定单元,用于在上述概率大于或等于预设阈值的情况下,确定上述目标数据归属于上述目标数据类别;第三确定单元,用于在上述概率小于上述预设阈值的情况下,确定上述目标数据属于异常数据类别。
[0011]在一个示例性实施例中,上述装置还包括:第二输入模块,用于将目标数据输入至目标网络模型中,得到上述目标网络模型输出的上述目标数据的第一特征和第二特征之前,将确定的样本数据中的内部数据和外部数据按照第一预设比例输入至原始网络模型中,得到上述原始网络模型输出的第三特征和第四特征,其中,上述第三特征用于表示上述内部数据和上述外部数据的特征均值,上述第四特征用于表示上述内部数据和上述外部数据的特征方差,上述外部数据用于表示无归属类别的数据,上述内部数据用于表示有归属类别的数据;第一分离模块,用于按照第二预设比例分离上述第三特征和上述第四特征;第一训练模块,用于按照上述第三特征和上述第四特征训练上述原始网络模型,得到上述目标网络模型。
[0012]在一个示例性实施例中,第一训练模块,包括:第四确定单元,用于确定特征记忆库,其中,上述特征记忆库用于存储上述样本数据的特征分布;第五确定单元,用于确定上述第三特征与上述特征记忆库之间的第一距离,以确定上述内部数据所归属的数据类别的第一概率;第六确定单元,用于确定上述第四特征与上述特征记忆库之间的第二距离,以确定上述外部数据所归属的数据类别的第二概率;第一训练单元,用于基于上述第一概率和上述第二概率训练上述原始网络模型,得到上述目标网络模型。
[0013]根据本专利技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0014]根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0015]通过本专利技术,通过将目标数据输入至目标网络模型中,得到目标网络模型输出的目标数据的第一特征和第二特征,其中,第一特征用于表示目标数据的特征均值,第二特征用于表示目标数据的特征方差;利用第一特征和第二特征确定目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率;基于目标数据所归属的目标数据类别,以及目标数据归属于目标数据类别的概率确定目标数据的类别属性。在固定分类个数的基础上,可以有效确定目标数据属于内部数据还是外部数据,保证了分类的准确性,避免将外部数据误分类成已知类别。因此,可以解决相关技术中对外部数据的分类不准确的问题,达到准确分类数据的效果。
附图说明
[0016]图1是本专利技术实施例的一种数据类别属性的确定方法的移动终端的硬件结构框图;
[0017]图2是根据本专利技术实施例的数据类别属性的确定方法的流程图;
[0018]图3是根据本专利技术实施例的训练流程图;
[0019]图4是根据本专利技术实施例的不确定性估计模块中的内部数据处理流程图;
[0020]图5是根据本专利技术实施例的不确定性估计模块中的外部数据的处理流程图;
[0021]图6是根据本专利技术实施例的测试流程图;
[0022]图7是根据本专利技术实施例的数据类别属性的确定装置的结构框图。
具体实施方式
[0023]下文中将参考附图并结合实施例来详细说明本专利技术的实施例。
[0024]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0025]本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本专利技术实施例的一种数据类别属性的确定方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据类别属性的确定方法,其特征在于,包括:将目标数据输入至目标网络模型中,得到所述目标网络模型输出的所述目标数据的第一特征和第二特征,其中,所述第一特征用于表示所述目标数据的特征均值,所述第二特征用于表示所述目标数据的特征方差;利用所述第一特征和所述第二特征确定所述目标数据所归属的目标数据类别,以及所述目标数据归属于所述目标数据类别的概率;基于所述目标数据所归属的目标数据类别,以及所述目标数据归属于所述目标数据类别的概率确定所述目标数据的类别属性。2.根据权利要求1所述的方法,其特征在于,利用所述第一特征和所述第二特征确定所述目标数据所归属的目标数据类别,以及所述目标数据归属于所述目标数据类别的概率,包括:将所述第一特征输入至分类器,得到所述分类器计算的所述目标数据归属的所述目标数据类别,其中,所述第二特征还用于表示所述分类器的输出特征;基于所述第一特征的特征均值和所述第二特征的特征方差、第一参数以及预设数据类别确定所述目标数据归属于所述目标数据类别的概率。3.根据权利要求1所述的方法,其特征在于,基于所述目标数据所归属的目标数据类别,以及所述目标数据归属于所述目标数据类别的概率确定所述目标数据的类别属性,包括以下之一:在所述概率大于或等于预设阈值的情况下,确定所述目标数据归属于所述目标数据类别;在所述概率小于所述预设阈值的情况下,确定所述目标数据属于异常数据类别。4.根据权利要求1所述的方法,其特征在于,将目标数据输入至目标网络模型中,得到所述目标网络模型输出的所述目标数据的第一特征和第二特征之前,所述方法还包括:将确定的样本数据中的内部数据和外部数据按照第一预设比例输入至原始网络模型中,得到所述原始网络模型输出的第三特征和第四特征,其中,所述第三特征用于表示所述内部数据和所述外部数据的特征均值,所述第四特征用于表示所述内部数据和所述外部数据的特征方差,所述外部数据用于表示无归属类别的数据,所述内部数据用于表示有归属类别的数据;按照第二预设比例分离所述第三特征和所述第四特征;按照所述第三特征和所述第四特征训练所述原始网络模型,得到所述目标网络模型。5.根据权利要求4所述的方法,其特征在于,按照所述第三特征和所述第四特...

【专利技术属性】
技术研发人员:郭思郁王宁波
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1