【技术实现步骤摘要】
用于输出数据的方法和装置
本申请实施例涉及计算机
,具体涉及图像识别
,尤其涉及用于输出数据的方法和装置。
技术介绍
随着计算机技术的发展,图像识别的领域越来越光,而对图像进行识别,常用的方法是利用图像识别模型。在对图像识别模型进行训练时,需要首先对样本数据进行标注。现有的标注方法是对样本数据进行人工筛选和标注。
技术实现思路
本申请实施例提出了用于输出数据的方法和装置。第一方面,本申请实施例提供了一种用于输出数据的方法,该方法包括:提取目标图像中的特征数据,得到特征数据集合;基于预设的第一相似度阈值,对特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;从至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;对于用于比较的至少一个特征数据聚类中的每个特征数据聚类,从特征数据集合中的、不属于用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据,其中,数类间相似度用于表征特征数据与特征数据聚类之间的相似程度;从各个待输出特征数据中,选择第一预设数量个特征数据并输出。在一些实施例中,从至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类,包括:将至少一个特征数据聚类划分为至少一个特征数据聚类组;对于至少一个特征数据聚类组中的每个特征数据聚类组,从该特征数据聚类组中提取第二预设数量个特征数据聚类;从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类。在一些实施例中,将至少一个特征数据聚类划分为至少一个特征数据聚类组,包括:基于特征 ...
【技术保护点】
一种用于输出数据的方法,包括:提取目标图像中的特征数据,得到特征数据集合;基于预设的第一相似度阈值,对所述特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;从所述至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;对于所述用于比较的至少一个特征数据聚类中的每个特征数据聚类,从所述特征数据集合中的、不属于所述用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据,其中,数类间相似度用于表征特征数据与特征数据聚类之间的相似程度;从各个待输出特征数据中,选择第一预设数量个特征数据并输出。
【技术特征摘要】
1.一种用于输出数据的方法,包括:提取目标图像中的特征数据,得到特征数据集合;基于预设的第一相似度阈值,对所述特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚类;从所述至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类;对于所述用于比较的至少一个特征数据聚类中的每个特征数据聚类,从所述特征数据集合中的、不属于所述用于比较的至少一个特征数据聚类的特征数据中,确定与该特征数据聚类的数类间相似度大于第二相似度阈值且小于第一相似度阈值的特征数据作为待输出特征数据,其中,数类间相似度用于表征特征数据与特征数据聚类之间的相似程度;从各个待输出特征数据中,选择第一预设数量个特征数据并输出。2.根据权利要求1所述的方法,其中,所述从所述至少一个特征数据聚类中选择用于比较的至少一个特征数据聚类,包括:将所述至少一个特征数据聚类划分为至少一个特征数据聚类组;对于所述至少一个特征数据聚类组中的每个特征数据聚类组,从该特征数据聚类组中提取第二预设数量个特征数据聚类;从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类。3.根据权利要求2所述的方法,其中,所述将所述至少一个特征数据聚类划分为至少一个特征数据聚类组,包括:基于特征数据聚类包括的特征数据的数量,确定至少一个数量区间,其中,所述至少一个数量区间涵盖的数值范围包含所述至少一个特征数据聚类中的每个特征数据聚类包括的特征数据的数量;对于所述至少一个数量区间中的每个数量区间,将包括的特征数据的数量处于该数量区间的特征数据聚类组合为特征数据聚类组。4.根据权利要求2所述的方法,其中,所述从所提取出的各个特征数据聚类中,确定用于比较的至少一个特征数据聚类,包括:确定所提取出的各个特征数据聚类两两之间的类间相似度,其中,类间相似度用于表征特征数据聚类之间的相似程度;将所确定出的类间相似度大于预设的第三相似度阈值的类间相似度对应的特征数据聚类合并为用于比较的特征数据聚类;将所确定出的类间相似度小于等于所述第三相似度阈值的类间相似度对应的特征数据聚类确定为用于比较的特征数据聚类。5.根据权利要求4所述的方法,其中,特征数据为向量数据;以及所述确定所提取出的各个特征数据聚类两两之间的类间相似度,包括:对于所提取出的各个特征数据聚类中的每个特征数据聚类,确定该特征数据聚类包括的特征数据的平均特征数据,其中,平均特征数据为各个特征向量中的相同位置的向量元素的均值所组成的向量;确定所确定出的各个平均特征数据两两之间的相似度;将所确定出的平均特征数据之间的相似度确定为对应的特征数据聚类之间的类间相似度。6.根据权利要求1所述的方法,其中,数类间相似度通过如下步骤确定:确定特征数据与特征数据聚类中的每个特征数据的相似度;将所确定出的各个相似度中的最大的相似度确定为数类间相似度。7.根据权利要求1-6之一所述的方法,其中,所述从各个待输出特征数据中,选择第一预设数量个特征数据并输出,包括:对于所述用于比较的至少一个特征数据聚类中的每个特征数据聚类,基于预设的第四相似度阈值,对该特征数据聚类对应的待输出特征数据进行聚类运算,得到该特征数据聚类的相似聚类;从所确定出的各个相似聚类包括的特征数据中选择第一预设数量个特征数据并输出。8.一种用于输出数据的装置,包括:提取单元,配置用于提取目标图像中的特征数据,得到特征数据集合;运算单元,配置用于基于预设的第一相似度阈值,对所述特征数据集合中的特征数据进行聚类运算,得到至少一个特征数据聚...
【专利技术属性】
技术研发人员:车丽美,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。