System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 对象检测方法和装置制造方法及图纸_技高网

对象检测方法和装置制造方法及图纸

技术编号:42669718 阅读:5 留言:0更新日期:2024-09-10 12:24
本申请提供一种对象检测方法和装置。该方法包括:获得第一对象,其中,第一对象包括第一元素;对第一对象进行特征提取处理,得到第一特征;对第一特征进行注意力处理,得到第二特征;对第二特征进行多尺度特征提取处理,得到第三特征;对第三特征进行预测处理,得到第四特征;根据第四特征确定第一元素所属的类别。通过本申请,能够提高对象检测的准确率。

【技术实现步骤摘要】

本申请涉及文档处理,尤其涉及一种对象检测方法和装置


技术介绍

1、在文档中通常包含有多个元素。这些元素可以分为文本类型的元素以及非文本类型的元素。在一些场景中,需要对文档中的元素进行识别。然而,与文本类型的元素相比,对于更加多样的非文本类型元素的检测通常会更加复杂。

2、那么,如何保证非文本类型的元素的检测的准确性是一个亟待解决的问题。


技术实现思路

1、本申请提供了一种对象检测方法和装置、电子设备、存储介质及程序产品,以提高非文本类型的元素的检测的准确率。

2、在第一方面,本申请提供了一种对象检测方法。该方法包括:获得第一对象,其中,第一对象包括第一元素;对第一对象进行特征提取处理,得到第一特征;对第一特征进行注意力处理,得到第二特征;对第二特征进行多尺度特征提取处理,得到第三特征;对第三特征进行预测处理,得到第四特征;根据第四特征确定第一元素所属的类别。

3、在一些可能的实施方式中,对第一特征进行注意力处理,得到第二特征的操作可以包括:采用空间注意力机制和通道注意力机制,对第一特征进行加权处理,得到第二特征;其中,空间注意力机制和通道注意力机制通过以下方式之一实现:并行、串行。

4、在一些可能的实施方式中,对第二特征进行多尺度特征提取处理,得到第三特征的操作可以包括:对第二特征进行连续多次特征提取,得到第五特征,其中,连续多次特征提取对应于不同的尺度、且每次特征提取包括上采样处理和/或特征增强处理;对第五特征进行连续多次下采样,得到第三特征。

5、在一些可能的实施方式中,对第三特征进行预测处理,得到第四特征的操作可以包括:对第三特征进行卷积运算,得到第四特征;其中,第四特征包括以下至少一者:第一元素与多个类别对应的分数值、至少一个预测框、与至少一个预测框对应的置信度。

6、在一些可能的实施方式中,根据第四特征确定第一元素所属的类别的操作可以包括:根据第四特征,将与第一预测框对应的多个分数值中最高分数值的类别确定为第一元素所属的类别,其中,第一预测框为至少一个预测框中置信度最高的预测框。

7、在一些可能的实施方式中,对象检测方法可以基于经过训练的第一模型实现。第一模型包括:骨干网络、颈部网络、以及头部网络。骨干网络用于实现对第一对象的特征提取处理。颈部网络用于实现对第二特征的注意力处理和对第三特征的多尺度特征提取处理。头部网络用于实现对第三特征的预测处理。

8、在一些可能的实施方式中,颈部网络可以包括注意力模块。注意力模块包括空间注意力模块和通道注意力模块。空间注意力模块用于实现基于空间注意力机制的加权处理。通道注意力模块用于实现基于通道注意力机制的加权处理。

9、在一些可能的实施方式中,第一模型的训练过程可以包括:获得第一样本对象,其中,第一样本对象包括第一样本元素;对第一样本对象进行特征提取处理,得到第一样本特征;对第一样本特征进行注意力处理,得到第二样本特征;对第二样本特征进行多尺度特征提取处理,得到第三样本特征;对第三样本特征进行预测处理,得到第四样本特征;根据第四样本特征,通过损失函数确定损失值;在损失值满足第一条件的情况下,对第一模型的模型参数进行调整。

10、在一些可能的实施方式中,第一样本对象可以包括样本对象集合中的一个或多个样本对象。样本对象集合中的全部样本对象可以包括至少一种类别的第二元素。在根据第四样本特征,通过损失函数确定损失值之后,第一模型的训练过程还可以包括:根据第一比例和第一数量,确定权重,其中,第一比例为样本对象集合中各类别的第二元素分别占全部第二元素的比例,第一数量为第一样本对象中各类别的第二元素的数量;基于权重,对损失值进行加权处理,得到加权后的损失值。

11、在一些可能的实施方式中,在获得第一样本对象之后,第一模型的训练过程还可以包括:对样本对象集合中满足第二条件的锚框进行聚类处理,以得到第一锚框;根据第一锚框,对第一模型的头部网络进行调整。

12、在第二方面,本申请提供了一种对象检测装置。该装置包括:获得单元、第一提取单元、注意力处理单元、第二提取单元、预测单元、分类单元。获得单元被配置为:获得第一对象,其中,第一对象包括第一元素。第一提取单元被配置为:对第一对象进行特征提取处理,得到第一特征。注意力处理单元被配置为:对第一特征进行注意力处理,得到第二特征。第二提取单元被配置为:对第二特征进行多尺度特征提取处理,得到第三特征。预测单元被配置为:对第三特征进行预测处理,得到第四特征。预测单元被配置为;根据第四特征确定第一元素所属的类别。

13、在一些可能的实施方式中,注意力处理单元可以被配置为:采用空间注意力机制和通道注意力机制,对第一特征进行加权处理,得到第二特征;其中,空间注意力机制和通道注意力机制通过以下方式之一实现:并行、串行。

14、在一些可能的实施方式中,第二提取单元可以被配置为:对第二特征进行连续多次特征提取,得到第五特征,其中,连续多次特征提取对应于不同的尺度、且每次特征提取包括上采样处理和/或特征增强处理;对第五特征进行连续多次下采样,得到第三特征。

15、在一些可能的实施方式中,预测单元可以被配置为:对第三特征进行卷积运算,得到第四特征;其中,第四特征包括以下至少一者:第一元素与多个类别对应的分数值、至少一个预测框、与至少一个预测框对应的置信度。

16、在一些可能的实施方式中,分类单元可以被配置为:根据第四特征,将与第一预测框对应的多个分数值中最高分数值的类别确定为第一元素所属的类别,其中,第一预测框为至少一个预测框中置信度最高的预测框。

17、在一些可能的实施方式中,对象检测装置的对象检测可以基于经过训练的第一模型实现。第一模型包括:骨干网络、颈部网络、以及头部网络。骨干网络用于实现对第一对象的特征提取处理。颈部网络用于实现对第二特征的注意力处理和对第三特征的多尺度特征提取处理。头部网络用于实现对第三特征的预测处理。

18、在一些可能的实施方式中,颈部网络可以包括注意力模块。注意力模块包括空间注意力模块和通道注意力模块。空间注意力模块用于实现基于空间注意力机制的加权处理。通道注意力模块用于实现基于通道注意力机制的加权处理。

19、在一些可能的实施方式中,第一模型的训练过程可以由对象检测装置实现。对象检测装置还可以包括:损失确定单元、调整单元。获得单元可以被配置为:获得第一样本对象,其中,第一样本对象包括第一样本元素。第一提取单元可以被配置为:对第一样本对象进行特征提取处理,得到第一样本特征。注意力处理单元可以被配置为:对第一样本特征进行注意力处理,得到第二样本特征。第二提取单元可以被配置为:对第二样本特征进行多尺度特征提取处理,得到第三样本特征。预测单元可以被配置为:对第三样本特征进行预测处理,得到第四样本特征。损失确定单元可以被配置为:根据第四样本特征,通过损失函数确定损失值。调整单元可以被配置为:在损失值满足第一条件的本文档来自技高网...

【技术保护点】

1.一种对象检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其中,所述对所述第一特征进行注意力处理,得到第二特征,包括:

3.根据权利要求1所述的方法,其中,所述对所述第二特征进行多尺度特征提取处理,得到第三特征,包括:

4.根据权利要求1所述的方法,其中,所述对所述第三特征进行预测处理,得到第四特征,包括:

5.根据权利要求4所述的方法,其中,所述根据所述第四特征确定所述第一元素所属的类别,包括:

6.根据权利要求1至5中任一项所述的方法,其中,所述对象检测方法基于经过训练的第一模型实现,所述第一模型包括:骨干网络、颈部网络、以及头部网络;

7.根据权利要求6所述的方法,其中,所述颈部网络包括注意力模块,所述注意力模块包括空间注意力模块和通道注意力模块;

8.根据权利要求6所述的方法,其中,所述第一模型的训练过程包括:

9.根据权利要求8所述的方法,其中,所述第一样本对象包括样本对象集合中的一个或多个样本对象,所述样本对象集合中的全部样本对象包括至少一种类别的第二元素;

10.根据权利要求9所述的方法,其中,在所述获得第一样本对象之后,所述第一模型的训练过程还包括:

11.一种对象检测装置,其特征在于,所述装置包括:

...

【技术特征摘要】

1.一种对象检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其中,所述对所述第一特征进行注意力处理,得到第二特征,包括:

3.根据权利要求1所述的方法,其中,所述对所述第二特征进行多尺度特征提取处理,得到第三特征,包括:

4.根据权利要求1所述的方法,其中,所述对所述第三特征进行预测处理,得到第四特征,包括:

5.根据权利要求4所述的方法,其中,所述根据所述第四特征确定所述第一元素所属的类别,包括:

6.根据权利要求1至5中任一项所述的方法,其中,所述对象检测方法基于经过训练的第一模型实现,所述第一模型...

【专利技术属性】
技术研发人员:赵家琪林士松段纪伟
申请(专利权)人:珠海金山办公软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1