用于输出数据的方法和装置制造方法及图纸

技术编号:18019306 阅读:50 留言:0更新日期:2018-05-23 05:23
本申请实施例公开了用于输出数据的方法和装置。该方法的一具体实施方式包括:提取目标图像中的特征数据,得到特征数据集合;基于预设的第一相似度阈值,对特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;从至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;对于用于比较的至少一个特征数据聚类中的每个特征数据聚类,从特征数据集合中的、不属于用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据;从各个待输出特征数据中,选择第一预设数量个特征数据并输出。该实施方式提高了对大量数据进行分类的效率。

【技术实现步骤摘要】
用于输出数据的方法和装置
本申请实施例涉及计算机
,具体涉及图像识别
,尤其涉及用于输出数据的方法和装置。
技术介绍
随着计算机技术的发展,图像识别的领域越来越光,而对图像进行识别,常用的方法是利用图像识别模型。在对图像识别模型进行训练时,需要首先对样本数据进行标注。现有的标注方法是对样本数据进行人工筛选和标注。
技术实现思路
本申请实施例提出了用于输出数据的方法和装置。第一方面,本申请实施例提供了一种用于输出数据的方法,该方法包括:提取目标图像中的特征数据,得到特征数据集合;基于预设的第一相似度阈值,对特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;从至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;对于用于比较的至少一个特征数据聚类中的每个特征数据聚类,从特征数据集合中的、不属于用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据,其中,数类间相似度用于表征特征数据与特征数据聚类之间的相似程度;从各个待输出特征数据中,选择第一预设数量个特征数据并输出。在一些实施例中,从至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类,包括:将至少一个特征数据聚类划分为至少一个特征数据聚类组;对于至少一个特征数据聚类组中的每个特征数据聚类组,从该特征数据聚类组中提取第二预设数量个特征数据聚类;从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类。在一些实施例中,将至少一个特征数据聚类划分为至少一个特征数据聚类组,包括:基于特征数据聚类包括的特征数据的数量,确定至少一个数量区间,其中,至少一个数量区间涵盖的数值范围包含至少一个特征数据聚类中的每个特征数据聚类包括的特征数据的数量;对于至少一个数量区间中的每个数量区间,将包括的特征数据的数量处于该数量区间的特征数据聚类组合为特征数据聚类组。在一些实施例中,从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类,包括:确定所提取出的各个特征数据聚类两两之间的类间相似度,其中,类间相似度用于表征特征数据聚类之间的相似程度;将所确定出的类间相似度大于预设的第三相似度阈值的类间相似度对应的特征数据聚类合并为用于比较的特征数据聚类;将所确定出的类间相似度小于等于第三相似度阈值的类间相似度对应的特征数据聚类确定为用于比较的特征数据聚类。在一些实施例中,特征数据为向量数据;以及确定所提取出的各个特征数据聚类两两之间的类间相似度,包括:对于所提取出的各个特征数据聚类中的每个特征数据聚类,确定该特征数据聚类包括的特征数据的平均特征数据,其中,平均特征数据为各个特征向量中的相同位置的向量元素的均值所组成的向量;确定所确定出的各个平均特征数据两两之间的相似度;将所确定出的平均特征数据之间的相似度确定为对应的特征数据聚类之间的类间相似度。在一些实施例中,数类间相似度通过如下步骤确定:确定特征数据与特征数据聚类中的每个特征数据的相似度;将所确定出的各个相似度中的最大的相似度确定为数类间相似度。在一些实施例中,从各个待输出特征数据中,选择第一预设数量个特征数据并输出,包括:对于用于比较的至少一个特征数据聚类中的每个特征数据聚类,基于预设的第四相似度阈值,对该特征数据聚类对应的待输出特征数据进行聚类运算,得到该特征数据聚类的相似聚类;从所确定出的各个相似聚类包括的特征数据中选择第一预设数量个特征数据并输出。第二方面,本申请实施例提供了一种用于输出数据的装置,该装置包括:提取单元,配置用于提取目标图像中的特征数据,得到特征数据集合;运算单元,配置用于基于预设的第一相似度阈值,对特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;选择单元,配置用于从至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;第一确定单元,配置用于对于用于比较的至少一个特征数据聚类中的每个特征数据聚类,从特征数据集合中的、不属于用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据,其中,数类间相似度用于表征特征数据与特征数据聚类之间的相似程度;输出单元,配置用于从各个待输出特征数据中,选择第一预设数量个特征数据并输出。在一些实施例中,选择单元,包括:划分模块,配置用于将至少一个特征数据聚类划分为至少一个特征数据聚类组;提取模块,配置用于对于至少一个特征数据聚类组中的每个特征数据聚类组,从该特征数据聚类组中提取第二预设数量个特征数据聚类;确定模块,配置用于从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类。在一些实施例中,划分模块,包括:第一确定子单元,配置用于基于特征数据聚类包括的特征数据的数量,确定至少一个数量区间,其中,至少一个数量区间涵盖的数值范围包含至少一个特征数据聚类中的每个特征数据聚类包括的特征数据的数量;组合子单元,配置用于对于至少一个数量区间中的每个数量区间,将包括的特征数据的数量处于该数量区间的特征数据聚类组合为特征数据聚类组。在一些实施例中,确定模块,包括:第二确定子单元,配置用于确定所提取出的各个特征数据聚类两两之间的类间相似度,其中,类间相似度用于表征特征数据聚类之间的相似程度;合并子单元,配置用于将所确定出的类间相似度大于预设的第三相似度阈值的类间相似度对应的特征数据聚类合并为用于比较的特征数据聚类;第三确定子单元,配置用于将所确定出的类间相似度小于等于第三相似度阈值的类间相似度对应的特征数据聚类确定为用于比较的特征数据聚类。在一些实施例中,特征数据为向量数据;以及第二确定子单元,进一步配置用于:对于所提取出的各个特征数据聚类中的每个特征数据聚类,确定该特征数据聚类包括的特征数据的平均特征数据,其中,平均特征数据为各个特征向量中的相同位置的向量元素的均值所组成的向量;确定所确定出的各个平均特征数据两两之间的相似度;将所确定出的平均特征数据之间的相似度确定为对应的特征数据聚类之间的类间相似度。在一些实施例中,用于输出数据的装置还包括:第二确定单元,配置用于确定特征数据与特征数据聚类中的每个特征数据的相似度;第三确定单元,配置用于将所确定出的各个相似度中的最大的相似度确定为数类间相似度。在一些实施例中,输出单元,包括:运算模块,配置用于对于用于比较的至少一个特征数据聚类中的每个特征数据聚类,基于预设的第四相似度阈值,对该特征数据聚类对应的待输出特征数据进行聚类运算,得到该特征数据聚类的相似聚类;输出模块,配置用于从所确定出的各个相似聚类包括的特征数据中选择第一预设数量个特征数据并输出。第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于输出数据的方法和装置,通过提取图像中的特征数据,得到特征数据集合,本文档来自技高网...
用于输出数据的方法和装置

【技术保护点】
一种用于输出数据的方法,包括:提取目标图像中的特征数据,得到特征数据集合;基于预设的第一相似度阈值,对所述特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;从所述至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;对于所述用于比较的至少一个特征数据聚类中的每个特征数据聚类,从所述特征数据集合中的、不属于所述用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据,其中,数类间相似度用于表征特征数据与特征数据聚类之间的相似程度;从各个待输出特征数据中,选择第一预设数量个特征数据并输出。

【技术特征摘要】
1.一种用于输出数据的方法,包括:提取目标图像中的特征数据,得到特征数据集合;基于预设的第一相似度阈值,对所述特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;从所述至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;对于所述用于比较的至少一个特征数据聚类中的每个特征数据聚类,从所述特征数据集合中的、不属于所述用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据,其中,数类间相似度用于表征特征数据与特征数据聚类之间的相似程度;从各个待输出特征数据中,选择第一预设数量个特征数据并输出。2.根据权利要求1所述的方法,其中,所述从所述至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类,包括:将所述至少一个特征数据聚类划分为至少一个特征数据聚类组;对于所述至少一个特征数据聚类组中的每个特征数据聚类组,从该特征数据聚类组中提取第二预设数量个特征数据聚类;从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类。3.根据权利要求2所述的方法,其中,所述将所述至少一个特征数据聚类划分为至少一个特征数据聚类组,包括:基于特征数据聚类包括的特征数据的数量,确定至少一个数量区间,其中,所述至少一个数量区间涵盖的数值范围包含所述至少一个特征数据聚类中的每个特征数据聚类包括的特征数据的数量;对于所述至少一个数量区间中的每个数量区间,将包括的特征数据的数量处于该数量区间的特征数据聚类组合为特征数据聚类组。4.根据权利要求2所述的方法,其中,所述从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类,包括:确定所提取出的各个特征数据聚类两两之间的类间相似度,其中,类间相似度用于表征特征数据聚类之间的相似程度;将所确定出的类间相似度大于预设的第三相似度阈值的类间相似度对应的特征数据聚类合并为用于比较的特征数据聚类;将所确定出的类间相似度小于等于所述第三相似度阈值的类间相似度对应的特征数据聚类确定为用于比较的特征数据聚类。5.根据权利要求4所述的方法,其中,特征数据为向量数据;以及所述确定所提取出的各个特征数据聚类两两之间的类间相似度,包括:对于所提取出的各个特征数据聚类中的每个特征数据聚类,确定该特征数据聚类包括的特征数据的平均特征数据,其中,平均特征数据为各个特征向量中的相同位置的向量元素的均值所组成的向量;确定所确定出的各个平均特征数据两两之间的相似度;将所确定出的平均特征数据之间的相似度确定为对应的特征数据聚类之间的类间相似度。6.根据权利要求1所述的方法,其中,数类间相似度通过如下步骤确定:确定特征数据与特征数据聚类中的每个特征数据的相似度;将所确定出的各个相似度中的最大的相似度确定为数类间相似度。7.根据权利要求1-6之一所述的方法,其中,所述从各个待输出特征数据中,选择第一预设数量个特征数据并输出,包括:对于所述用于比较的至少一个特征数据聚类中的每个特征数据聚类,基于预设的第四相似度阈值,对该特征数据聚类对应的待输出特征数据进行聚类运算,得到该特征数据聚类的相似聚类;从所确定出的各个相似聚类包括的特征数据中选择第一预设数量个特征数据并输出。8.一种用于输出数据的装置,包括:提取单元,配置用于提取目标图像中的特征数据,得到特征数据集合;运算单元,配置用于基于预设的第一相似度阈值,对所述特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚...

【专利技术属性】
技术研发人员:车丽美
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1