基于图像的内容识别方法及装置制造方法及图纸

技术编号：44128352 阅读：6 留言：0更新日期：2025-01-24 22:47

本发明专利技术公开了一种基于图像的内容识别方法及装置。其中，该方法包括：获取待识别的图像，并对所述待识别的图像进行预处理；提取所述预处理后的图像中的特征信息，所述特征信息包括边缘特征、纹理特征和颜色特征；基于所述特征信息，利用图像识别模型进行图像分类，生成对应的预测内容标签，并基于所述预测内容标签，对所述待识别的图像进行内容识别并输出识别结果。本发明专利技术解决了现有技术基于图像进行内容识别的识别结果不准确的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，具体而言，涉及一种基于图像的内容识别方法及装置。

技术介绍

1、随着虚拟现实和人工智能技术的快速发展，虚拟数字人在诸多领域中得到了广泛的应用，例如虚拟助手、虚拟娱乐、教育和医疗等。传统的虚拟数字人交互技术主要基于语音输入进行互动。然而，随着用户对虚拟体验需求的提升，单一的语音交互已无法满足日益复杂的应用场景。特别是在某些图像为主的应用场景中，如虚拟形象设计、虚拟场景生成等，用户需要通过图像与虚拟数字人进行更加直观和高效的交互。

2、目前，基于图像的内容识别技术已经在计算机视觉领域取得了一定进展，能够识别图像中的边缘、纹理、颜色等特征信息，并进行分类和内容识别。然而，现有技术在图像内容识别准确性和适应性方面仍存在一定的局限性，尤其是在与虚拟数字人的交互中，现有的图像识别方法可能无法精确地理解图像内容，导致交互结果不够理想。

3、因此，亟需一种改进的基于图像的内容识别方法，能够在与虚拟数字人的交互过程中，通过输入图像精准识别图像内容，生成对应的预测标签，并结合虚拟数字人技术，使用户能够通过图像与虚拟数字人进行自然、准确和高效的交互。

4、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本专利技术实施例提供了一种基于图像的内容识别方法及装置，以至少解决现有技术基于图像进行内容识别的识别结果不准确的技术问题。

2、根据本专利技术实施例的一个方面，提供了一种基于图像的内容识别方法，包括：获取待识别的图

3、根据本专利技术实施例的另一方面，还提供了一种基于图像的内容识别装置，包括：预处理模块，被配置为获取待识别的图像，并对所述待识别的图像进行预处理；提取模块，被配置为提取所述预处理后的图像中的特征信息，所述特征信息包括边缘特征、纹理特征和颜色特征；识别模块，被配置为基于所述特征信息，利用图像识别模型进行图像分类，生成对应的类别标签，并基于所述类别标签，对所述待识别的图像进行内容识别并输出识别结果。

4、在本专利技术实施例中，获取待识别的图像，并对所述待识别的图像进行预处理；提取所述预处理后的图像中的特征信息，所述特征信息包括边缘特征、纹理特征和颜色特征；基于所述特征信息，利用图像识别模型进行图像分类，生成对应的预测内容标签，并基于所述预测内容标签，对所述待识别的图像进行内容识别并输出识别结果。通过上述方案，解决了现有技术基于图像进行内容识别的识别结果不准确技术问题。

本文档来自技高网...

【技术保护点】

1.一种基于图像的内容识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述图像识别模型是通过以下训练得到的，包括：

3.根据权利要求2所述的方法，其特征在于，使用教师模型对训练数据进行预测，生成所述训练数据的软标签，包括：

4.根据权利要求2所述的方法，其特征在于，使用所述教师模型生成的所述软标签来训练学生模型，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，基于所述预测内容标签与所述预测内容标签的置信度，对所述学生模型进行迭代训练，包括：循环执行以下，直到损失值达到预设的损失阈值：

6.根据权利要求1所述的方法，其特征在于，对所述待识别的图像进行预处理，包括：

7.一种基于图像的内容识别装置，其特征在于，包括：

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至6中任意一项所述的方法。

9.一种计算机设备，其特征在于，包括：存储器和处理器，

<...

【技术特征摘要】

1.一种基于图像的内容识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述图像识别模型是通过以下训练得到的，包括：

3.根据权利要求2所述的方法，其特征在于，使用教师模型对训练数据进行预测，生成所述训练数据的软标签，包括：

4.根据权利要求2所述的方法，其特征在于，使用所述教师模型生成的所述软标签来训练学生模型，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，基于所述预测内容标签与所述预测内容标签的置信度，对所述学生模型进行迭代训练，包括：循环执行以下，直到损失值达到预设的...

【专利技术属性】
技术研发人员：纪智辉，
申请(专利权)人：世优绿洲上海数字技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人