应答模型的训练方法、应答方法、装置、设备及存储介质制造方法及图纸

技术编号：28840164 阅读：28 留言：0更新日期：2021-06-11 23:38

本发明专利技术实施例涉及人工智能技术领域，公开了一种应答模型的训练方法、应答方法、装置、设备及存储介质，应答模型的训练方法包括：基于知识图谱提取出的实体信息构建意图训练样本；基于预训练模型构建问答训练样本；根据所述意图训练样本和所述问答训练样本构建应答模型训练样本；使用所述应答模型训练样本对预先构建的应答模型进行训练，得到训练好的应答模型。本发明专利技术实施例提供的方法通过根据知识图谱抽取结果自动生成训练语料，完成端到端的应答模型的会话设计与会话构建，将规则和深度学习结合应用提高了生成的应答模型训练样本与真实问答数据的相似性，一定程度上提高了生成文本的泛化能力，进而提高了应答模型的通用性。

全部详细技术资料下载

【技术实现步骤摘要】
应答模型的训练方法、应答方法、装置、设备及存储介质
本专利技术实施例涉及人工智能领域，尤其涉及一种应答模型的训练方法、应答方法、装置、设备及存储介质。
技术介绍
智能运维(ArtificialIntelligenceforITOperations，AIOps)，是将人工智能的能力与运维相结合，通过机器学习的方法来提升运维效率。AIops主张由机器学习算法自动地从海量运维数据(包括事件本身以及运维人员的人工处理日志)中不断地学习，不断提炼并总结规则。AIOps在自动化运维的基础上，增加了一个基于机器学习的大脑，指挥监测系统采集大脑决策所需的数据，做出分析、决策，并指挥自动化脚本去执行大脑的决策，从而达到运维系统的整体目标。综上看，自动化运维水平是AIOps的重要基石，而AIOps将基于自动化运维，将AI和运维很好地结合起来，但目前的AIOps仍存在不同场景下运维知识迁移的缺陷，对于新场景，新数据，往往需要重新从零构建AIops，需要额外重复的劳动力，费时费力。
技术实现思路
本专利技术实施例提供了一种应答模型的训练方法、应答方法、装置、设备及存储介质，以实现提高智能运维的通用性。第一方面，本专利技术实施例提供了一种应答模型的训练方法，其特征在于，包括：基于知识图谱提取出的实体信息构建意图训练样本；基于预训练模型构建问答训练样本；根据意图训练样本和问答训练样本构建应答模型训练样本；使用应答模型训练样本对预先构建的应答模型进行训练，得到训练好的应答模型。第...

【技术保护点】
1.一种应答模型的训练方法，其特征在于，包括：/n基于知识图谱提取出的实体信息构建意图训练样本；/n基于预训练模型构建问答训练样本；/n根据所述意图训练样本和所述问答训练样本构建应答模型训练样本；/n使用所述应答模型训练样本对预先构建的应答模型进行训练，得到训练好的应答模型。/n

【技术特征摘要】
1.一种应答模型的训练方法，其特征在于，包括：
基于知识图谱提取出的实体信息构建意图训练样本；
基于预训练模型构建问答训练样本；
根据所述意图训练样本和所述问答训练样本构建应答模型训练样本；
使用所述应答模型训练样本对预先构建的应答模型进行训练，得到训练好的应答模型。

2.根据权利要求1所述的方法，其特征在于，所述基于知识图谱提取出的实体与实体属性构建意图训练样本，包括：
提取出知识图谱中的实体信息，其中所述实体信息包括实体、实体属性以及实体间的关系；
根据预先设置的意图问题模板和所述实体信息构建所述意图训练样本。

3.根据权利要求2所述的方法，其特征在于，所述根据预先设置的意图问题模板和所述实体信息构建所述意图训练样本，包括：
根据questioni＝∏entityi(∑attributei+∑relationi)构建所述意图训练样本，其中，questioni为意图训练样本，entityi为实体，attributei为实体属性，relationi为实体间的关系。

4.根据权利要求1所述的方法，其特征在于，所述应答模型包括特征提取模块、意图识别模块和实体提取模块，所述使用所述应答模型训练样本对预先构建的应答模型进行训练，得到训练好的应答模型，包括：
将所述应答模型训练样本输入至所述特征提取模块中，获得所述特征提取模块输出的样本初始特征；
将所述样本初始特征输入至所述意图识别模块中，得到所述意图识别模块输出的样本意图特征；
将所述应答模型训练样本和所述样本意图特征输入至所述实体提取模块中，得到所述实体提取模块输出的样本实体特征；
根据所述样本意图特征和意图标签确定意图损失值，根据所述样本实体特征和实体标签确定实体损失值，根据所述意图损失值和所述实体损失值确定目标损失值；
以所述目标损失值达到收敛条件为目标，对所述应答模型进行训练。

5.根据权利要求4所述的方法，其特征在于，所述根据所述意图损失值和所述实体损失值确定目标损失值，包括：
将所述意图损失值和所述实体损失值加权求和，得到所述目标损失值。

6.根据权利要求4所述的方法，其特征在于，所述应答模型还包括注意力模块，所述意图识别模块、所述注意力模块和所述实体提取模块顺次连接，在将所述意图训练样本和所述样本意图特征输入至所述实体提取模块中，得到所述实体提取模块输出的样本实体特征之前，还包括：
将所述样本意图特征输入至所述注意力模型中，得到所述注意力模型输出的注意力结果；
相应的，将所述应答模型训练样本和所述样本意图特征输入至所述实体提取模块中，得到所述实体提取模块输出的预测实体之前，包括：
将所述应答模型训练样本和所述注意力结果输入至所述实体提取模块中，得到所述实体提取模块输出的样本实体特征。

7.根据权利要求1所述的方法，其特征在于，还包括：
根据所述意图训练样本中的实体标签数量设置所述意图训练样本...

【专利技术属性】
技术研发人员：张美伟，李昱，王全礼，张晨，杨占栋，
申请(专利权)人：中国建设银行股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人