训练分类模型和数据分类的方法及装置制造方法及图纸

技术编号：29874278 阅读：13 留言：0更新日期：2021-08-31 23:49

本公开提供了训练分类模型和数据分类的方法及装置，涉及人工智能领域，具体涉及计算机视觉和深度学习技术，具体可用于智能交通场景下。具体实现方案为：获取样本集和预先训练的分类模型，其中，分类模型包括至少两个卷积层，每个卷积层通过一个全连接层和一个分类层连接；将样本集输入分类模型，得到每个分类层输出的预测结果，其中，预测结果包括每个样本所属类别的预测概率；基于每个分类层输出的预测结果计算每个分类层的概率阈值；根据每个分类层的概率阈值设置分类模型的停止预测条件。从而可实现根据数据识别的难易程度选择不同层的分类模型进行预测，在保证准确率的同时降低了预测时间，提高了预测速度。

全部详细技术资料下载

【技术实现步骤摘要】
训练分类模型和数据分类的方法及装置
本公开人工智能领域，具体涉及计算机视觉和深度学习技术，具体可用于智能交通场景下，尤其涉及训练分类模型和数据分类的方法及装置。
技术介绍
随着人工智能技术的不断发展，深度学习技术被广泛应用于数据分析与处理中，成为了工作和生活中必不可少的数据处理方法。现有的分类模型不论数据是否难易识别，都采用相同的网络进行处理。这样会导致预测时间过长，无法在有限时间内获得最大正确率，限制了分类模型的应用范围。
技术实现思路
本公开提供了一种训练分类模型和数据分类的方法、装置、设备、存储介质以及计算机程序产品。根据本公开的第一方面，提供了一种训练分类模型的方法，包括：获取样本集和预先训练的分类模型，其中，分类模型包括至少两个卷积层，每个卷积层通过一个全连接层和一个分类层连接；将样本集输入分类模型，得到每个分类层输出的预测结果，其中，预测结果包括每个样本所属类别的预测概率；基于每个分类层输出的预测结果计算每个分类层的概率阈值；根据每个分类层的概率阈值设置分类模型的停止预测条件。根据本公开的第二方面，提供了一种数据分类的方法，包括：将待分类的数据输入采用第一方面的方法训练的分类模型中；将第一个卷积层作为当前卷积层，执行如下分类步骤：通过当前卷积层、当前全连接层和当前分类层对数据进行预测，得到最大预测概率；若最大预测概率大于当前分类层的概率阈值，则停止预测，并将最大预测概率对应的类别作为所述数据的类别；否则，将当前卷积层的输出结果输入到下一个卷积层，将下一卷积层作为

【技术保护点】
1.一种训练分类模型的方法，包括：/n获取样本集和预先训练的分类模型，其中，所述分类模型包括至少两个卷积层，每个卷积层通过一个全连接层和一个分类层连接；/n将所述样本集输入所述分类模型，得到每个分类层输出的预测结果，其中，所述预测结果包括每个样本所属类别的预测概率；/n基于每个分类层输出的预测结果计算每个分类层的概率阈值；/n根据每个分类层的概率阈值设置所述分类模型的停止预测条件。/n

【技术特征摘要】
1.一种训练分类模型的方法，包括：
获取样本集和预先训练的分类模型，其中，所述分类模型包括至少两个卷积层，每个卷积层通过一个全连接层和一个分类层连接；
将所述样本集输入所述分类模型，得到每个分类层输出的预测结果，其中，所述预测结果包括每个样本所属类别的预测概率；
基于每个分类层输出的预测结果计算每个分类层的概率阈值；
根据每个分类层的概率阈值设置所述分类模型的停止预测条件。

2.根据权利要求1所述的方法，其中，所述基于每个分类层输出的预测结果计算每个分类层的概率阈值，包括：
执行如下确定步骤：从预定的数据比例组合集中选择目标组合；根据每个分类层输出的预测结果确定出所述目标组合对应的每个分类层的规划值；基于每个分类层输出的预测结果计算所述目标组合对应的正确率；
重复执行上述确定步骤，直到所述数据比例组合集遍历完毕，得到每个数据比例组合对应的正确率；
将正确率最高的数据比例组合对应的每个分类层的规划值作为每个分类层的概率阈值。

3.根据权利要求2所述的方法，其中，所述基于每个分类层输出的预测结果计算所述目标组合对应的正确率，包括：
基于每个分类层输出的预测结果确定出每个样本在每个分类层的最大预测概率；
对于每个分类层，遍历每个样本，若该样本在该分类层的最大预测概率大于该分类层的规划值，则将该样本在该分类层的最大预测概率作为正确率进行累加。

4.根据权利要求3所述的方法，其中，所述预测结果包括每个样本的预测时间；以及
所述方法还包括：
对于每个分类层，基于进行正确率累加的样本的预测时间计算该分类层的总预测时间；
基于每个分类层的总预测时间计算所述分类模型的总预测时间；
若所述分类模型的总预测时间大于预定时间阈值，则将所述目标组合对应的正确率过滤掉。

5.根据权利要求4所述的方法，其中，所述基于进行正确率累加的样本的预测时间计算该分类层的总预测时间，包括：
基于进行正确率累加的样本的预测时间计算该分类层的平均预测时间；
计算所述平均预测时间与预定抖动值之和作为该分类层的总预测时间。

6.根据权利要求3所述的方法，其中，所述预测结果包括每个样本的运算次数；以及
所述方法还包括：
对于每个分类层，基于进行正确率累加的样本的运算次数计算该分类层的总运算次数；
基于每个分类层的总运算次数计算所述分类模型的总运算次数；
若所述分类模型的总运算次数大于预定次数阈值，则将所述目标组合对应的正确率过滤掉。

7.根据权利要求1-6中任一项所述的方法，其中，所述分类模型通过如下步骤训练：
获取训练数据集和分类模型，其中，所述训练数据集中的训练数据具有类别标签；
执行如下训练步骤：从所述训练数据集中选取训练数据；将所选取的训练数据输入所述分类模型，得到每个分类层输出的预测概率；基于所选取的训练数据的类别标签和每个分类层输出的预测概率计算总损失值；若所述总损失值小于目标值，则所述分类模型训练完成；
若所述总损失值不小于目标值，则调整所述分类模型的相关参数，继续执行上述训练步骤。

8.一种数据分类的方法，包括：
将待分类的数据输入采用权利要求1-7中任一项所述的方法训练的分类模型中；
将第一个卷积层作为当前卷积层，执行如下分类步骤：通过当前卷积层、当前全连接层和当前分类层对所述数据进行预测，得到最大预测概率；若所述最大预测概率大于当前分类层的概率阈值，则停止预测，并将所述最大预测概率对应的类别作为所述数据的类别；
否则，将当前卷积层的输出结果输入到下一个卷积层，将下一卷积层作为当前卷积层继续执行上述分类步骤。

9.一种训练分类模型的装置，包括：
获取单元，被配置成获取样本集和预先训练的分类模型，其中，所述分类模型包括至少两个卷积层，每个卷积层通过一个全连接层和一个分类层连接；
预测单元，被配置成将所述样本集输入所述分类模型，得到每个分类层输出的预测结果，其中，所述预测结果包括每个样本所属类别的预测概率...

【专利技术属性】
技术研发人员：王卡风，须成忠，熊昊一，李兴建，窦德景，
申请(专利权)人：北京百度网讯科技有限公司，澳门大学智慧城市物联网国家重点实验室，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人