数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:38731484 阅读:11 留言:0更新日期:2023-09-08 23:20
本申请实施例公开了一种数据处理方法、装置、设备及存储介质,应用于人工智能技术,该方法包括:向目标业务图像中添加K个时间步长对应的随机噪声数据,得到K个加噪图像;将N个候选业务标签和K个加噪图像,输出至业务扩散模型中,通过业务扩散模型根据候选业务标签i,对目标业务图像的K个加噪图像进行去噪处理,得到候选业务标签i在K个时间步长下分别对应的去噪图像;对候选业务标签i在K个时间步长下分别对应的去噪图像进行融合,得到候选业务标签i对应的融合去噪图像;根据N个候选业务标签分别对应的融合去噪图像,从N个候选业务标签中确定目标业务图像的目标业务标签。通过本申请能够提高业务扩散模型的标签识别的效率。能够提高业务扩散模型的标签识别的效率。能够提高业务扩散模型的标签识别的效率。

【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能技术等领域,尤其涉及一种数据处理方法、装置、设备及存储介质。

技术介绍

[0002]人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处 理技术以及机器学习/深度学习等几大方向。其中,计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,图像识别是基于已训练的图像识别模型识别出图像所具有的标签,图像所具有的标签反映图像中的对象的类别。实践中发现,目前的图像识别模型识别标签的耗时比较长,导致标签识别的效率比较低。

技术实现思路

[0003]本申请实施例提供一种数据处理方法、装置、设备及存储介质,降低业务扩散模型识别标签的耗时,提高业务扩散模型的标签识别的效率。
[0004]本申请实施例一方面提供一种数据处理方法,包括:获取与目标业务关联的目标业务图像和N个候选业务标签;N为大于1的正整数;向上述目标业务图像中添加K个时间步长对应的随机噪声数据,得到上述目标业务图像的K个加噪图像;K为大于1的正整数;将上述N个候选业务标签和上述目标业务图像的K个加噪图像,输出至业务扩散模型中,通过上述业务扩散模型根据候选业务标签i,对上述目标业务图像的K个加噪图像进行去噪处理,得到上述候选业务标签i在上述K个时间步长下分别对应的去噪图像;i为小于或等于N的正整数,N为大于1的正整数;对上述候选业务标签i在上述K个时间步长下分别对应的去噪图像进行融合,得到上述候选业务标签i对应的融合去噪图像;根据上述N个候选业务标签分别对应的融合去噪图像,从上述N个候选业务标签中确定上述目标业务图像的目标业务标签。
[0005]本申请实施例一方面提供一种数据处理装置,包括:获取模块,用于获取与目标业务关联的目标业务图像和N个候选业务标签;N为大于1的正整数;添加模块,用于向上述目标业务图像中添加K个时间步长对应的随机噪声数据,得到上述目标业务图像的K个加噪图像;K为大于1的正整数;处理模块,用于将上述N个候选业务标签和上述目标业务图像的K个加噪图像,输出至业务扩散模型中,通过上述业务扩散模型根据候选业务标签i,对上述目标业务图像的K个加噪图像进行去噪处理,得到上述候选业务标签i在上述K个时间步长下分别对应的去噪图像;i为小于或等于N的正整数,N为大于1的正整数;
融合模块,用于对上述候选业务标签i在上述K个时间步长下分别对应的去噪图像进行融合,得到上述候选业务标签i对应的融合去噪图像;确定模块,用于根据上述N个候选业务标签分别对应的融合去噪图像,从上述N个候选业务标签中确定上述目标业务图像的目标业务标签。
[0006]本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,上述存储器存储有计算机程序,上述处理器执行上述计算机程序时实现上述的方法的步骤。
[0007]本申请实施例一方面提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述的方法的步骤。
[0008]本申请实施例一方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
[0009]本申请中,由于目标业务图像的目标业务标签与目标业务图像的空间(即图像区域)具有较强的一一对应关系,即一个目标业务标签与目标业务图像中的一个图像区域相对应。因此,计算机设备可以同时将多个候选业务标签(即N个候选业务标签)输入至业务扩散模型中,业务扩散模型根据各个候选业务标签在不同时间步长(即K个时间步长)下对应的去噪图像,确定对应候选业务标签对应的融合去噪图像,根据N个候选业务标签分别对应的融合去噪图像,从N个候选业务标签中确定目标业务图像的目标业务标签。可见,不需要一一输入多个候选业务标签,有利于快速地识别到目标业务图像的一个或多个目标业务标签,降低业务扩散模型识别标签的耗时,提高业务扩散模型的标签识别效率。
附图说明
[0010]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是本申请提供的一种数据处理系统示意图;图2是本申请提供的一种通用扩散模型的模型结构示意图;图3是本申请提供的一种数据处理方法的交互场景示意图;图4是本申请提供的又一种数据处理方法的交互场景示意图;图5是本申请提供的一种数据处理方法的流程示意图;图6是本申请提供的一种基于候选业务标签获取去噪图像的场景示意图;图7是本申请提供的又一种数据处理方法的流程示意图;图8是本申请提供的一种通用扩散模型的上采样网络和初始扩散模型的上采样网络的交互示意图;图9是本申请提供的一种通用扩散模型的上采样块和初始扩散模型的上采样块的交互示意图;图10是本申请实施例提供的一种数据处理装置的结构示意图;图11是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0012]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0013]本申请实施例可涉及人工智能技术以及自动驾驶、智慧交通等领域,所谓人工智能(Artificial Intelligence,AI),是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0014]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0015]所谓机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取与目标业务关联的目标业务图像和N个候选业务标签;N为大于1的正整数;向所述目标业务图像中添加K个时间步长对应的随机噪声数据,得到所述目标业务图像的K个加噪图像;K为大于1的正整数;将所述N个候选业务标签和所述目标业务图像的K个加噪图像,输出至业务扩散模型中,通过所述业务扩散模型根据候选业务标签i,对所述目标业务图像的K个加噪图像进行去噪处理,得到所述候选业务标签i在所述K个时间步长下分别对应的去噪图像;i为小于或等于N的正整数,N为大于1的正整数;对所述候选业务标签i在所述K个时间步长下分别对应的去噪图像进行融合,得到所述候选业务标签i对应的融合去噪图像;根据所述N个候选业务标签分别对应的融合去噪图像,从所述N个候选业务标签中确定所述目标业务图像的目标业务标签。2.如权利要求1所述的方法,其特征在于,所述对所述候选业务标签i在所述K个时间步长下分别对应的去噪图像进行融合,得到所述候选业务标签i对应的融合去噪图像,包括:对所述候选业务标签i在所述K个时间步长下分别对应的去噪图像进行平均化处理,得到所述候选业务标签i对应的平均去噪图像;将所述候选业务标签i对应的平均去噪图像,确定为所述候选业务标签i对应的融合去噪图像。3.如权利要求1所述的方法,其特征在于,所述根据所述N个候选业务标签分别对应的融合去噪图像,从所述N个候选业务标签中确定所述目标业务图像的目标业务标签,包括:根据所述N个候选业务标签分别对应的融合去噪图像,确定所述N个候选业务标签分别对应的初始业务特征值;对所述N个候选业务标签分别对应的业务特征值进行平均化处理,得到平均业务特征值;将所述N个候选业务标签中初始业务特征值大于所述平均业务特征值的候选业务标签,确定为所述目标业务图像的目标业务标签。4.如权利要求1所述的方法,其特征在于,所述方法还包括:向与所述目标业务关联的样本业务图像中添加随机步长t对应的随机噪声数据,得到所述样本业务图像的加噪图像,向通用图像中添加所述随机步长t对应的随机噪声数据,得到所述通用图像的加噪图像;t为正整数;通过通用扩散模型,根据所述通用图像的加噪图像,识别所述通用图像与所述通用图像的通用图像标签之间的第一类相关性特征;通过初始扩散模型,根据所述第一类相关性特征和所述样本业务图像的标注业务标签,识别所述样本业务图像的加噪图像中的预测噪声数据;所述初始扩散模型的结构与所述通用扩散模型的结构相同;根据所述预测噪声数据和所述随机步长t对应的随机噪声数据,对所述初始扩散模型进行训练,得到所述业务扩散模型。5.如权利要求4所述的方法,其特征在于,所述通用扩散模型的上采样网络包括L个上采样块,所述通用扩散模型的下采样网络包括L个下采样块,L为大于1的正整数;
所述通过通用扩散模型,根据所述通用图像的加噪图像,识别所述通用图像与所述通用图像的通用图像标签之间的第一类相关性特征,包括:针对第j+1上采样迭代,获取所述通用扩散模型的上采样块j所输出的所述通用图像的上采样图像X
j
;所述通用图像的上采样图像X
j
是根据所述通用图像的加噪图像得到的;j为小于L的正整数;获取所述通用扩散模型的下采样块L

j所输出的所述通用图像在第L

j次下采样迭代的下采样图像;通过所述通用扩散模型的上采样块j+1,根据所述通用图像标签、所述上采样图像X
j
以及所述通用图像在所述第L

j次下采样迭代的下采样图像,识别所述通用图像在所述第j+1次上采样迭代下与所述通用图像标签之间的相关性特征;将所述通用图像在L次上采样迭代下分别与所述通用图像标签之间的相关性特征,确定为所述通用图像与所述通用图像标签之间的第一类相关性特征。6.如权利要求5所述的方法,其特征在于,所述通过所述通用扩散模型的上采样块j+1,根据所述通用图像标签、所述上采样图像X
j
以及所述通用图像在所述第L

j次下采样迭代的下采样图像,识别所述通用图像在所述第j+1次上采样迭代下与所述通用图像标签之间的相关性特征,包括:通过所述通用扩散模型的上采样块j+1,对所述上采样图像X
j
与所述通用图像在所述第L

j次下采样迭代的下采样图像进行融合,得到通用融合图像;获取所述通用扩散模型的上采样块j+1对应的文本权重和图像权重;采用所述文本权重对所述通用图像标签对应的文本特征进行加权处理,得到加权文本向量;采用所述图像权重对所述通用融合图像的图像特征进行加权处理,得到加权图像向量;根据所述加权文本向量和所述加权图像向量,确定所述通用图像在所述第j+1次上采样迭代下与所述通用图像标签之间的相关性特征。7.如权利要求6所述的方法,其特征在于,所述根据所述加权文本向量和所述加权图像向量,确定所述通用图像在所述第j+1次上采样迭代下与所述通用图像标签之间的相关性特征,包括:对所述加权文本向量和加权图像向量进行乘积处理,得到所述通用图像在所述第j+1次上采样迭代下与所述通用图像标签之间的初始相关性特征;对所述通用图像在所述第j+1次上采样迭代下与所述通...

【专利技术属性】
技术研发人员:朱城
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1