一种工程文件内容的识别方法及系统技术方案

技术编号:28707853 阅读:26 留言:0更新日期:2021-06-05 23:15
本发明专利技术提供了一种工程文件内容的识别方法及系统,工程文件内容的识别方法包括:获取工程文件的工程信息;根据工程信息匹配适应的目标模型,其中,目标模型为预先训练的对应不同类型工程文件的预测模型;利用目标模型对工程文件内容进行识别。本发明专利技术通过工程文件的工程信息匹配其适应的目标模型,然后利用目标模型对工程文件内容进行识别,为用户选择模型提供参考,进而加快工程识别的速度并增加识别准确率,使得用户需要识别的工程可以通过匹配的目标模型获得满意的识别效果。目标模型获得满意的识别效果。目标模型获得满意的识别效果。

【技术实现步骤摘要】
一种工程文件内容的识别方法及系统


[0001]本专利技术涉及人工智能
,具体涉及一种工程文件内容的识别方法及系统。

技术介绍

[0002]人工智能技术已经开始引入到建筑行业中,以工程预算为例,可以通过事先建立好的预算识别模型进行新项目工程的预算识别,在建模过程中,通过人工智能分析原始数据,能够准确快速的识别出所需信息,避免人工成本的浪费,但是如何更准确的识别出用户需要的信息数据,是需要解决的一个重要问题。传统的机器学习方法是使用大量的工程数据,进行识别模型的训练,进而使用模型为用户的工程进行识别,但是这种方式需要大量的原始工程,工作量巨大,耗时很长,而且不同工程的图形信息复杂多变,相互间的相关性低,使得用户需要识别的工程难以通过训练得到的模型获得满意的识别效果,进而影响识别模型的实用性。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种工程文件内容的识别方法及系统,解决现有技术中进行识别模型的训练需要大量的工程数据,进而导致工作量巨大,耗时长,而且识别模型的实用性低的问题。
[0004]根据第一方面,本专利技术实施例提供了一种工程文件内容的识别方法,包括:获取工程文件的工程信息;根据所述工程信息匹配适应的目标模型,其中,所述目标模型为预先训练的对应不同类型工程文件的预测模型;利用所述目标模型对工程文件内容进行识别。
[0005]可选地,所述根据所述工程信息匹配适应的目标模型,包括:利用所述工程信息的第一属性,在预设模型中查找与所述工程信息的第一属性一致的模型;当在预设模型中查找到与所述工程信息的第一属性一致的模型时,将查找到所述模型确定为目标模型。
[0006]可选地,所述根据所述工程信息匹配适应的目标模型,包括:当在预设模型中未查找到与所述工程信息的第一属性一致的模型时,利用所述工程信息的第二属性,在预设模型中查找满足第一预设查找条件的模型;当在预设模型中查找到满足第一预设查找条件的模型时,利用所述工程信息的第三属性,在查找到的模型中查找满足第二预设查找条件的模型,确定识别模型;根据预设相似度算法,确定所述工程信息与各预设历史工程信息之间的工程相似度;根据工程相似度结果在所述识别模型中确定目标模型。
[0007]可选地,所述根据工程相似度结果在所述识别模型中确定目标模型,包括:根据工程相似度从大到小的排序结果,从各识别模型中确定各候选模型;响应于所述候选模型选择操作,将所述候选模型确定为目标模型。
[0008]可选地,本专利技术实施例提供的工程文件内容的识别方法,还包括:在预设时间内未获取到所述候选模型选择操作时,将所述排序结果中第一序位的候选模型确定为目标模型。
[0009]可选地,所述根据所述工程信息匹配适应的目标模型,包括:对不同类型工程文件
的预测模型进行训练,确定工程训练模型;根据所述工程信息在所述工程训练模型中匹配适应的目标模型。
[0010]可选地,所述对不同类型工程文件的预测模型进行训练,确定工程训练模型,包括:获取当前工程文件以及各历史工程文件;根据预设识别算法,确定所述历史工程文件中图纸文件的工程识别率;根据各历史工程文件对应的工程识别率以及当前工程文件和各历史工程文件对应的项目属性,确定训练数据集;根据所述训练数据集进行模型训练,确定所述当前工程文件对应的工程训练模型。
[0011]可选地,所述根据预设识别算法,确定所述历史工程文件中图纸文件的工程识别率,还包括:基于所述历史工程文件中的图元参照信息确定所述历史工程文件中图纸文件的工程识别率。
[0012]可选地,所述基于所述历史工程文件中的图元参照信息确定所述历史工程文件中图纸文件的工程识别率,包括:根据预设图元识别算法,确定所述历史工程文件中的图纸文件所包含的图元;根据预设业务规则,确定各所述图元的图元识别信息;根据各所述图元的图元识别信息及所述历史工程文件中各所述图元对应的图元参照信息,确定各图元对应的识别率;根据各图元对应的识别率,确定所述工程识别率。
[0013]可选地,所述根据各历史工程文件对应的工程识别率以及当前工程文件和各历史工程文件对应的项目属性,确定训练数据集,包括:根据项目属性,确定当前工程文件及各历史工程文件的项目分类结果;根据所述项目分类结果及预设识别率阈值要求,将与所述当前工程文件分类结果相同且工程识别率满足预设识别率要求的历史工程文件确定为所述训练数据集。
[0014]可选地,所述利用所述目标模型对工程文件内容进行识别,包括:获取工程文件;将所述工程文件中的图纸文件输入所述目标模型,确定工程识别结果。
[0015]根据第二方面,本专利技术实施例提供了一种工程文件内容的识别系统,包括:获取模块,用于获取工程文件的工程信息;第一处理模块,用于根据所述工程信息匹配适应的目标模型,其中,所述目标模型为预先训练的对应不同类型工程文件的预测模型;第二处理模块,用于利用所述目标模型对工程文件内容进行识别。
[0016]本专利技术实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被处理器执行时实现本专利技术第一方面及其任意一种可选方式所述的工程文件内容的识别方法。
[0017]本专利技术实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行本专利技术第一方面及其任意一种可选方式所述的工程文件内容的识别方法。
[0018]本专利技术技术方案,具有如下优点:
[0019]1.本专利技术实施例提供了一种工程文件内容的识别方法,通过工程文件的工程信息匹配其适应的目标模型,然后利用目标模型对工程文件内容进行识别,为用户选择模型提供参考,进而加快工程识别的速度并增加识别准确率,使得用户需要识别的工程可以通过匹配的目标模型获得满意的识别效果。
[0020]2.本专利技术实施例提供了一种工程文件内容的识别方法,通过确定历史工程的工程
识别率以及各项目属性,为用户提供训练数据的选择依据;自定义选择训练数据集,缩小并聚焦训练集合,达到快速的训练模型与准确的识别效果;根据训练数据集进行模型训练,确定当前工程文件对应的工程训练模型,可以为后续所有类似工程进行识别提供识别模型,简单高效,并且加快了模型训练的速度与识别率,使得模型的训练更有针对性,进而提高工程训练模型的实用性。
附图说明
[0021]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本专利技术实施例中工程文件内容的识别方法的流程图;
[0023]图2为本专利技术实施例中工程相似度的排序结果的示意图;
[0024]图3为本专利技术实施例中工程文件内容的识别方法的另一详细流程图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工程文件内容的识别方法,其特征在于,包括:获取工程文件的工程信息;根据所述工程信息匹配适应的目标模型,其中,所述目标模型为预先训练的对应不同类型工程文件的预测模型;利用所述目标模型对工程文件内容进行识别。2.根据权利要求1所述的工程文件内容的识别方法,其特征在于,所述根据所述工程信息匹配适应的目标模型,包括:利用所述工程信息的第一属性,在预设模型中查找与所述工程信息的第一属性一致的模型;当在预设模型中查找到与所述工程信息的第一属性一致的模型时,将查找到所述模型确定为目标模型。3.根据权利要求2所述的工程文件内容的识别方法,其特征在于,所述根据所述工程信息匹配适应的目标模型,包括:当在预设模型中未查找到与所述工程信息的第一属性一致的模型时,利用所述工程信息的第二属性,在预设模型中查找满足第一预设查找条件的模型;当在预设模型中查找到满足第一预设查找条件的模型时,利用所述工程信息的第三属性,在查找到的模型中查找满足第二预设查找条件的模型,确定识别模型;根据预设相似度算法,确定所述工程信息与各预设历史工程信息之间的工程相似度;根据工程相似度结果在所述识别模型中确定目标模型。4.根据权利要求3所述的工程文件内容的识别方法,其特征在于,所述根据工程相似度结果在所述识别模型中确定目标模型,包括:根据工程相似度从大到小的排序结果,从各识别模型中确定各候选模型;响应于所述候选模型选择操作,将所述候选模型确定为目标模型。5.根据权利要求4所述的工程文件内容的识别方法,其特征在于,还包括:在预设时间内未获取到所述候选模型选择操作时,将所述排序结果中第一序位的候选模型确定为目标模型。6.根据权利要求1所述的工程文件内容的识别方法,其特征在于,所述根据所述工程信息匹配适应的目标模型,包括:对不同类型工程文件的预测模型进行训练,确定工程训练模型;根据所述工程信息在所述工程训练模型中匹配适应的目标模型。7.根据权利要求6所述的工程文件内容的识别方法,其特征在于,所述对不同类型工程文件的预测模型进行训练,确定工程训练模型,包括:获取当前工程文件以及各历史工程文件;根据预设识别算法,确定所述历史工程文件中图纸文件的工程识别率;根据各历史工程文件对应的工程识别率以及当前工程文件和各历史工程文件对应的项目属性,确定训练数据集;根据所述训练数据集进行模型训练,确定所...

【专利技术属性】
技术研发人员:师玉鹏
申请(专利权)人:广联达科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1