施工质量隐患数据挖掘模型训练方法及挖掘系统技术方案

技术编号:36960492 阅读:41 留言:0更新日期:2023-03-22 19:21
本发明专利技术公开了一种施工质量隐患数据挖掘模型训练方法及挖掘系统,训练方法包括:训练第一至第三深度学习网络模型,三个基模型分别基于局部特征、词语语义与语义之间PMI值以及词语语义与文档之间的tf

【技术实现步骤摘要】
施工质量隐患数据挖掘模型训练方法及挖掘系统


[0001]本专利技术属于施工质量诊控
,更具体地,涉及一种施工质量隐患数据挖掘模型训练方法及挖掘系统。

技术介绍

[0002]近年来房屋建筑质量安全事故频发,不仅造成人员伤亡,也造成巨大的经济损失。在建筑产品施工建造过程中,工程质量问题难免会发生,工程质量不仅关系到工程的适应性和建设项目投资效果,而且关系到人民群众的生命财产安全。现场巡视做作为监理对工程质量控制的重要一环,针对工程施工过程中发现的问题,监理通常以质量隐患整改单的书面形式联系施工单位按时对发现的质量问题进行整改,质量隐患整改单在确保施工质量达规达标,排除施工质量隐患,保证建筑主体工程质量起到了很大的作用,在当前施工建造还未实现智能建造和数字建造之前是建筑精益建造的必然选择。
[0003]质量隐患整改单为监理单位下发给施工单位对建筑工程项目中出现的质量问题进行整改的过程性表单,质量隐患整改单含有丰富的质量问题信息,对这些质量问题信息的知识获取和利用有助于工程人员提高对建筑工程质量控制水平。由于质量问题信息为非结构化文本信息且分散在不同质量隐患整改单中,工程人员对质量问题信息的获取和分析是一个耗时费力的过程,造成工程人员无法有效利用已有知识为建筑工程质量管理起到充分的借鉴作用,进而影响即时准确的对建筑工程项目进行质量控制与决策,因此对质量隐患描述这一非结构化工程文本进行知识建模和信息抽取对提高工程文本管理效率、增强隐性知识的利用和增强工程效益具有重要意义。

技术实现思路

[0004]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种施工质量隐患数据挖掘模型训练方法及挖掘系统,其目的在于快速对工程施工质量隐患整改报告中的工程问题进行分类,提高工程文本管理效率。
[0005]为实现上述目的,按照本专利技术的一个方面,提供了一种施工质量隐患数据挖掘模型训练方法,其包括:
[0006]步骤S1:用本地数据分别训练能够对工程施工质量隐患整改报告中的质量隐患描述对应的工程问题进行分类的第一深度学习网络模型、第二深度学习网络模型和第三深度学习网络模型,其中,所述第一深度学习网络模型基于分析质量隐患描述的局部特征确定词语语义权重,所述第二深度学习网络模型基于分析质量隐患描述的词语语义与语义之间PMI值以及词语语义与文档之间的tf

idf值确定词语语义权重,所述第三深度学习网络模型基于提取质量隐患描述的关键词确定词语语义权重;
[0007]步骤S2:将每个本地所训练好的第一深度学习网络模型、第二深度学习网络模型和第三深度学习网络模型进行集成,得到对应本地的施工质量隐患数据挖掘模型;
[0008]步骤S3:将每个本地的施工质量隐患数据挖掘模型参数通过本地差分隐私技术进
行加密后再通过区块链将加密后的模型参数上传至星际文件系统,并将加密后的模型参数的哈希值存储于区块链中;
[0009]步骤S4:通过联邦平均算法将存储在星际文件系统中的多个加密模型参数进行加权平均,形成更新后的模型参数并存储于星际文件系统中,更新后的模型参数的哈希值保存在区块链上;
[0010]步骤S5:每个本地用户通过区块链下载星际文件系统中更新后的模型参数;
[0011]步骤S6:判断更新参数后的所有本地施工质量隐患数据挖掘模型是否收敛,若否,则对未收敛的施工质量隐患数据挖掘模型继续进行本地训练直至收敛后跳转至步骤S3;若是,则结束当前训练。
[0012]在其中一个实施例中,在步骤S6中,若更新参数后的所有本地施工质量隐患数据挖掘模型收敛,则结束当前训练并跳转至S7:
[0013]步骤S7:对训练好的模型进行模型评估,若符合标准,则输出最终模型,若不符合标准,则增加本地训练样本并跳转至步骤S3继续训练。
[0014]在其中一个实施例中,模型评估包括准确率、召回率和F1值的评估。
[0015]在其中一个实施例中,在进行模型训练前,先执行:
[0016]采集本地一定数量的工程施工质量隐患整改报告,并对质量隐患描述标注已经定义好的隐患标签;
[0017]对质量隐患描述进行分词后将再转换为词向量矩阵,得到训练数据;
[0018]在进行模型训练时,使预测的工程问题的分类结果趋近于对应的隐患标签。
[0019]在其中一个实施例中,对质量隐患描述进行分词后将再转换为词向量矩阵,包括:
[0020]借助jieba分词技术对质量隐患描述进行分词;
[0021]借助Word2vec词向量将分词后的质量隐患描述转化为词向量矩阵。
[0022]在其中一个实施例中,所述第一深度学习网络模型包含卷积层、rule激活函数和最大池化层,通过分析局部特征确定词语语义权重;
[0023]所述第二深度学习网络模型包含计算综合词与文档之间的tf

idf值以及计算词与词之间的PMI值的计算结构,其中,通过计算词与文档之间的tf

idf值以计算词语语义与词语之间的PMI值确定词语语义权重;
[0024]所述第三深度学习网络模型包括双向LSTM、tanh非线性激活函数和注意力机制模块,通过提取关键词确定词语语义权重。
[0025]在其中一个实施例中,在步骤S2中,通过顺序二次规划算法优化第一深度学习网络模型、第二深度学习网络模型和第三深度学习网络模型的权重后,利用stacking策略集成第一深度学习网络模型、第二深度学习网络模型和第三深度学习网络模型的权重,得到施工质量隐患数据挖掘模型。
[0026]在其中一个实施例中,在将每个本地的施工质量隐患数据挖掘模型参数的哈希值存储于区块链中的同时,还将当前训练所用的本地数据存储于区块链中。
[0027]按照本专利技术的另一方面,提供了一种施工质量隐患数据挖掘系统,其包括数据采集模块和施工质量隐患数据挖掘模型,其中,
[0028]所述数据采集模块用于收集工程施工质量隐患整改报告中的质量隐患描述并进行数据预处理后输入所述施工质量隐患数据挖掘模型;
[0029]所述施工质量隐患数据挖掘模型为基于上述施工质量隐患数据挖掘模型训练方法所训练得到的施工质量隐患数据挖掘模型,用于对工程施工质量隐患整改报告中的质量隐患描述对应的工程问题进行分类。
[0030]在其中一个实施例中,还包括数据管理模块,用于在输出多份对不同的工程施工质量隐患整改报告所分类结果后分析质量隐患的时空分布特征。
[0031]总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
[0032](1)考虑施工质量隐患记录表达长短语言各异、非结构化等特征,本专利技术分别构建第一深度学习网络模型、第二深度学习网络模型和第三深度学习网络模型,用本地数据对每个模型进行训练以实现工程施工质量隐患整改报告中工程问题进行分类。三个深度学习网络模型进行分类学习所侧重的特征不同。其中,第一深度学习网络模型主要是分析质量隐患描述的局部特征确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种施工质量隐患数据挖掘模型训练方法,其特征在于,包括:步骤S1:用本地数据分别训练能够对工程施工质量隐患整改报告中的质量隐患描述对应的工程问题进行分类的第一深度学习网络模型、第二深度学习网络模型和第三深度学习网络模型,其中,所述第一深度学习网络模型基于分析质量隐患描述的局部特征确定词语语义权重,所述第二深度学习网络模型基于分析质量隐患描述的词语语义与语义之间PMI值以及词语语义与文档之间的tf

idf值确定词语语义权重,所述第三深度学习网络模型基于提取质量隐患描述的关键词确定词语语义权重;步骤S2:将每个本地所训练好的第一深度学习网络模型、第二深度学习网络模型和第三深度学习网络模型进行集成,得到对应本地的施工质量隐患数据挖掘模型;步骤S3:将每个本地的施工质量隐患数据挖掘模型参数通过本地差分隐私技术进行加密后再通过区块链将加密后的模型参数上传至星际文件系统,并将加密后的模型参数的哈希值存储于区块链中;步骤S4:通过联邦平均算法将存储在星际文件系统中的多个加密模型参数进行加权平均,形成更新后的模型参数并存储于星际文件系统中,更新后的模型参数的哈希值保存在区块链上;步骤S5:每个本地用户通过区块链下载星际文件系统中更新后的模型参数;步骤S6:判断更新参数后的所有本地施工质量隐患数据挖掘模型是否收敛,若否,则对未收敛的施工质量隐患数据挖掘模型继续进行本地训练直至收敛后跳转至步骤S3;若是,则结束当前训练。2.如权利要求1所述的施工质量隐患数据挖掘模型训练方法,其特征在于,在步骤S6中,若更新参数后的所有本地施工质量隐患数据挖掘模型收敛,则结束当前训练并跳转至S7:步骤S7:对训练好的模型进行模型评估,若符合标准,则输出最终模型,若不符合标准,则增加本地训练样本并跳转至步骤S3继续训练。3.如权利要求2所述的施工质量隐患数据挖掘模型训练方法,其特征在于,模型评估包括准确率、召回率和F1值的评估。4.如权利要求1所述的施工质量隐患数据挖掘模型训练方法,其特征在于,在进行模型训练前,先执行:采集本地一定数量的工程施工质量隐患整改报告,并对质量隐患描述标注已经定义好的隐患标签;对质量隐患描述进行分词后将再转换为词向量矩阵,得到训练数据;在进行模型训练时,使预测的...

【专利技术属性】
技术研发人员:钟波涛潘杏骆汉宾胡啸威沈罗昕
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1