System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图像处理,尤其涉及一种基于小样本的工程图纸识别模型的训练方法及装置。
技术介绍
1、cad制图是工程辅助设计的重要组成,设计人员可以依据cad工程图纸附有的图纸批注进行快速修改,更新,从而加快设计效率。因此,在工程图纸缺少相应的批注(包括没有批注、批注不完整/不清晰及批注格式不准确等)时,通常需要为其添加相应的批注,如:通过工程图纸识别模型识别图纸的批注。
2、然而,在实际应用中,工程图纸识别模型通常需要采用大量的工程图纸作为训练样本进行训练得到,而各个相关设计单位存有的工程图纸数量有限,即工程图纸的样本较少,容易导致模型的训练结果准确性较低,从而导致训练得到的模型的识别准确率较低。可见,提出一种提高小样本工程图纸的识别模型的训练准确性的技术方案显得尤为重要。
技术实现思路
1、本专利技术提供了一种基于小样本的工程图纸识别模型的训练方法及装置,能够提高工程图纸识别模型的训练准确性,有利于提高工程图纸识别模型的识别准确性及识别效率。
2、为了解决上述技术问题,本专利技术第一方面公开了一种基于小样本的工程图纸识别模型的训练方法,所述方法包括:
3、获取待训练的工程图纸集合,所述工程图纸集合包括多张工程图纸;
4、基于预设的图纸类别算法,对所述工程图纸集合进行分类,得到分类结果,所述分类结果包括多个图纸样本组合,且同一所述图纸样本组合内的所有工程图纸均对应相同的图纸类别;
5、分析每一所述图纸样本组合中包含的所有工
6、根据所有所述图纸样本组合的图纸分析结果,从所有所述图纸样本组合中筛选出满足预设的小样本类别条件的第一图纸样本组合;
7、基于确定出的分类标签算法,将所述第一图纸样本组合输入至训练好的自编码结构模型中进行重构,得到第二图纸样本组合,并将所述第一图纸样本组合以及所述第一图纸样本组合作为新的第一图纸样本组合代替原有的第一图纸样本组合,对所述工程图纸集合进行更新,得到目标工程图纸集合;
8、将所述目标工程图纸集合作为训练样本集合输入至预先确定出的机器学习模型中进行训练,得到所述机器学习模型对应的工程图纸识别模型,所述工程图纸识别模型用于对不具备图纸批注的待识别工程图纸进行针对所述图纸批注的识别,以在所述待识别工程图纸中添加所述图纸批注。
9、作为一种可选的实施方式,在本专利技术第一方面中,每一所述图纸样本组合的图纸分析结果至少包括每一所述图纸样本组合的图纸数量;
10、以及,所述自编码结构模型是通过以下方式训练得到的:
11、根据所有所述图纸样本组合的图纸数量,从所有所述图纸样本组合中筛选出所述图纸数量最多的图纸样本组合,作为基类图纸样本组合,所述基类图纸样本组合包括一个或多个基类工程图纸;
12、对于每一所述基类工程图纸,将该基类工程图纸以及预设的分类标签输入至预先构建好的初始自编码结构模型包含的编码器中进行编码,得到编码训练结果,所述编码训练结果包括该基类工程图纸在所述编码器对应的目标维度空间中的第一维度特征向量以及该基类工程图纸对应的基类分类标签;
13、将该基类工程图纸的第一维度特征向量以及所述基类分类标签输入至所述初始自编码结构模型包含的解码器中进行数据重构,得到该基类工程图纸相对于所述目标维度空间的重构工程图纸;
14、提取所述重构工程图纸的第一图纸特征以及该基类工程图纸的第二图纸特征,并根据所述重构工程图纸的第一图纸特征以及该基类工程图纸的第二图纸特征,计算所述重构工程图纸与该基类工程图纸的图纸相似度,以及判断所述图纸相似度是否大于或等于预设相似度;
15、若判断出所述图纸相似度小于所述预设相似度,则重新执行所述对于每一所述基类工程图纸,将该基类工程图纸以及预设的分类标签输入至预先构建好的初始自编码结构模型包含的编码器中进行编码,得到编码训练结果的操作;
16、若判断出所述图纸相似度大于或等于所述预设相似度,则确定所述初始自编码结构模型训练完毕,并确定训练完毕的初始自编码结构模型,作为所述自编码结构模型。
17、作为一种可选的实施方式,在本专利技术第一方面中,所述分类标签算法为基于所述自编码结构模型的训练过程中得到的基类分类标签的算法;
18、以及,所述基于确定出的分类标签算法,将所述第一图纸样本组合输入至训练好的自编码结构模型中进行重构,得到第二图纸样本组合,包括:
19、对于所述第一图纸样本组合内的每个第一工程图纸,基于确定出的分类标签算法,将该第一工程图纸以及所述基类分类标签输入至训练好的自编码结构模型包含的编码器中进行编码,得到该第一工程图纸在所述目标维度空间中的第二维度特征向量以及该第一工程图纸对应的目标类别分类标签;
20、将该第一工程图纸的第二维度特征向量以及所述目标类别分类标签输入至所述自编码结构模型包含的解码器中进行数据重构,得到该第一工程图纸相对于所述目标维度空间的第二工程图纸;
21、确定所有所述第一工程图纸对应的第二工程图纸,作为第二图纸样本组合。
22、作为一种可选的实施方式,在本专利技术第一方面中,每一所述图纸样本组合的图纸分析结果还包括每一所述图纸样本组合中每一所述工程图纸的图纸批注;
23、以及,所述根据所有所述图纸样本组合的图纸分析结果,从所有所述图纸样本组合中筛选出满足预设的小样本类别条件的第一图纸样本组合,包括:
24、根据所有所述图纸样本组合的图纸数量,判断所有所述图纸样本组合中是否存在所述图纸数量小于或等于预设图纸数量的图纸样本组合;
25、当判断出存在所述图纸数量小于或等于所述预设图纸数量的图纸样本组合时,确定所述图纸数量小于或等于所述预设图纸数量的图纸样本组合,作为满足预设的小样本类别条件的第一图纸样本组合;
26、当判断出不存在所述图纸数量小于或等于所述预设图纸数量的图纸样本组合时,根据所有所述图纸样本组合中的所有所述工程图纸的图纸批注,确定每一所述图纸样本组合对应的增强需求度,并从所有所述图纸样本组合中筛选出所述对应的增强需求度最大的图纸样本组合,作为满足所述小样本类别条件的第一图纸样本组合,所述增强需求度用于表示对相应图纸样本组合执行图像增强操作的需求程度。
27、作为一种可选的实施方式,在本专利技术第一方面中,所述根据所有所述图纸样本组合中的所有所述工程图纸的图纸批注,确定每一所述图纸样本组合对应的增强需求度,包括:
28、根据所有所述图纸样本组合中的所有所述工程图纸的图纸批注,以及预设的标准图纸批注,计算每一所述工程图纸的图纸批注与所述标准图纸批注之间的贴合度,得到每一所述工程图纸对应的批注贴合度;
29、对于每一所述图纸样本组合,根据该图纸样本组合中所有工程图纸对应的批注贴合度以及该图纸样本组合的图纸数量,计算该图纸样本组合中所述批注贴合度大于或等于预设贴合度的本文档来自技高网...
【技术保护点】
1.一种基于小样本的工程图纸识别模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,每一所述图纸样本组合的图纸分析结果至少包括每一所述图纸样本组合的图纸数量;
3.根据权利要求2所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,所述分类标签算法为基于所述自编码结构模型的训练过程中得到的基类分类标签的算法;
4.根据权利要求3所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,每一所述图纸样本组合的图纸分析结果还包括每一所述图纸样本组合中每一所述工程图纸的图纸批注;
5.根据权利要求4所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,所述根据所有所述图纸样本组合中的所有所述工程图纸的图纸批注,确定每一所述图纸样本组合对应的增强需求度,包括:
6.根据权利要求1-5任一项所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,所述基于预设的图纸类别算法,对所述工程图纸集合进行分类,得到分类结果,包括:
7.根据权利要求6所
8.一种基于小样本的工程图纸识别模型的训练装置,其特征在于,所述装置包括:
9.一种基于小样本的工程图纸识别模型的训练装置,其特征在于,所述装置包括:
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的基于小样本的工程图纸识别模型的训练方法。
...【技术特征摘要】
1.一种基于小样本的工程图纸识别模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,每一所述图纸样本组合的图纸分析结果至少包括每一所述图纸样本组合的图纸数量;
3.根据权利要求2所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,所述分类标签算法为基于所述自编码结构模型的训练过程中得到的基类分类标签的算法;
4.根据权利要求3所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,每一所述图纸样本组合的图纸分析结果还包括每一所述图纸样本组合中每一所述工程图纸的图纸批注;
5.根据权利要求4所述的基于小样本的工程图纸识别模型的训练方法,其特征在于,所述根据所有所述图纸样本组合中的所有所述...
【专利技术属性】
技术研发人员:张欢,杨定,陈志峰,曾晶,骆丹,
申请(专利权)人:广东南方电信规划咨询设计院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。