文本机器人自动监控方法及装置制造方法及图纸

技术编号:26597046 阅读:23 留言:0更新日期:2020-12-04 21:19
本申请实施例提供一种文本机器人自动监控方法及装置,方法包括:在用于进行问题应答数据处理的文本机器人的上线运行期间,自动获取该文本机器人的业务指标数据;判断文本机器人的业务指标数据是否满足对应的业务标准,若否,则基于原始语料数据以及新增语料数据,对文本机器人进行模型训练,得到更新后的文本机器人;应用更新后的文本机器人替换业务指标数据不满足业务标准的文本机器人,以基于更新后的文本机器人进行问题应答数据处理。本申请能够自动实现对文本机器人的服务状态监测及系统升级,进而能够有效提高文本机器人的更新效率及自动化程度,同时能够有效保证文本机器人对用户进行应答服务的准确性及可靠性。

【技术实现步骤摘要】
文本机器人自动监控方法及装置
本申请涉及数据处理
,具体涉及文本机器人自动监控方法及装置。
技术介绍
企业或机构等为了向用户提供更为便捷及优质的问答服务,通常采用能够根据用户提出的问题文本数据自动生成答案文本数据的机器学习模型,这类机器学习模型从提供服务功能的角度来说,可以被称之为文本机器人。用于专业领域的文本机器人往往对应答效果有较高要求,以往由大量业务人员主动监测系统状况,人工考察文本机器人应答情况。随着系统上线,领域内新增业务场景日益复杂,专业知识逐渐增多,需要机器人应答的客户问题也不断增加,这对文本机器人对客应答效果是个较大考验。目前,为保持文本机器人的对用户的服务能力,需要业务人员人工检测系统运行状况,收集用户体验,下达任务需求并提供最新用户语料数据,开发人员手工导入数据完成模型训练及调优后,测试人员设计测试方案并编写测试案例覆盖业务场景,评估模型改造效果。若改造后的应答效果满足业务需求,则维护人员对开发提供的版本和参数进行部署。然而,该种系统升级改造方式的周期过长,不能快速响应市场需求,不利于提升用户粘性,也就是说,现有的文本机器人监控方式无法同时保证文本机器人的应用准确性及更新效率。
技术实现思路
针对现有技术中的问题,本申请提供一种文本机器人自动监控方法及装置,能够自动实现对文本机器人的服务状态监测及系统升级,进而能够有效提高文本机器人的更新效率及自动化程度,同时能够有效保证文本机器人对用户进行应答服务的准确性及可靠性。为解决上述技术问题,本申请提供以下技术方案:第一方面,本申请提供一种文本机器人自动监控方法,包括:在用于进行问题应答数据处理的文本机器人的上线运行期间,自动获取该文本机器人的业务指标数据;判断处于上线运行状态的文本机器人的业务指标数据是否满足对应的业务标准,若否,则基于预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据,对该文本机器人进行模型训练,得到更新后的文本机器人;应用更新后的文本机器人替换业务指标数据不满足业务标准的文本机器人,以基于更新后的文本机器人进行问题应答数据处理。进一步地,还包括:在用于进行问题应答数据处理的文本机器人的上线运行期间,实时获取该文本机器人在运行期间产生的问题应答数据;对所述问题应答数据中的对应已有业务场景的数据进行数据去重处理,以更新所述已有业务场景对应的所述原始语料数据;对所述问题应答数据中的未对应所述已有业务场景的数据进行新增业务场景识别;应用自然语言处理技术,基于所述已有业务场景更新和拓展所述新增业务场景对应的语料数据,并将新增业务场景的场景特征与预设的知识图谱进行关联,以生成所述新增业务场景对应的所述新增语料数据。进一步地,所述基于预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据,对该文本机器人进行模型训练,得到更新后的文本机器人,包括:输出针对业务指标数据不满足业务标准的文本机器人的预警信息;若接收到根据所述预警信息生成的文本机器人升级指令,则获取预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据;根据所述原始语料数据以及新增语料数据对该业务指标数据不满足业务标准的文本机器人进行模型训练,得到更新后的文本机器人。进一步地,所述根据所述原始语料数据以及新增语料数据对该业务指标数据不满足业务标准的文本机器人进行模型训练,得到更新后的文本机器人,包括:基于所述原始语料数据以及所述新增语料数据生成训练集和测试集;应用所述训练集对业务指标数据不满足业务标准的文本机器人进行模型训练,并应用所述测试集对训练得到的文本机器人进行模型测试;将通过模型测试的文本机器人确定为更新后的文本机器人。进一步地,在所述应用更新后的文本机器人替换业务指标数据不满足业务标准的文本机器人,以基于更新后的文本机器人进行问题应答数据处理之后,还包括:在更新后的文本机器人的上线运行期间,获取该更新后的文本机器人在预设时段内的业务指标数据,判断更新后的文本机器人在预设时段内的业务指标数据是否满足对应的质量后评价标准,若否,则对更新后的文本机器人进行版本回退处理。进一步地,所述对所述问题应答数据中的对应已有业务场景的数据进行数据去重处理,以更新所述已有业务场景对应的所述原始语料数据,包括:根据已有业务场景的类型,对所述问题应答数据中的对应已有业务场景的数据进行数据分类;对各个所述已有业务场景各自对应的多个语料数据中的应答数据进行数据去重处理。进一步地,所述对所述问题应答数据中的未对应所述已有业务场景的数据进行新增业务场景识别,包括:对所述问题应答数据中的未对应所述已有业务场景的数据进行聚类处理,得到各组聚类数据;分别提取各组所述聚类数据中的数据要素,以基于各个所述数据要素分别形成对应的新增业务场景。进一步地,所述应用自然语言处理技术,基于所述已有业务场景更新和拓展所述新增业务场景对应的语料数据,并将新增业务场景的场景特征与预设的知识图谱进行关联,以生成所述新增业务场景对应的所述新增语料数据,包括:应用预设的自然语言处理方式,对所述已有业务场景对应的语料数据进行分词处理,并根据对应的分词结果确定所述已有业务场景的语言规则;根据所述已有业务场景的语言规则,更新和拓展与该已有业务场景关联的新增业务场景的语料数据;将新增业务场景的场景特征与预设的知识图谱进行关联,以生成所述新增业务场景对应的所述新增语料数据。第二方面,本申请提供一种文本机器人自动监控装置,包括:自动监测模块,用于在用于进行问题应答数据处理的文本机器人的上线运行期间,自动获取该文本机器人的业务指标数据;风险评估及模型更新模块,用于判断处于上线运行状态的文本机器人的业务指标数据是否满足对应的业务标准,若否,则基于预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据,对该文本机器人进行模型训练,得到更新后的文本机器人;模型部署模块,用于应用更新后的文本机器人替换业务指标数据不满足业务标准的文本机器人,以基于更新后的文本机器人进行问题应答数据处理。进一步地,还包括:数据获取模块,用于在用于进行问题应答数据处理的文本机器人的上线运行期间,实时获取该文本机器人在运行期间产生的问题应答数据;原始语料更新模块,用于对所述问题应答数据中的对应已有业务场景的数据进行数据去重处理,以更新所述已有业务场景对应的所述原始语料数据;新增场景识别模块,用于对所述问题应答数据中的未对应所述已有业务场景的数据进行新增业务场景识别;新增语料生成模块,用于应用自然语言处理技术,基于所述已有业务场景更新和拓展所述新增业务场景对应的语料数据,并将新增业务场景的场景特征与预设的知识图谱进行关联,以生成所述新增业务场景对应的所述新增语料数据。进一步地,所述风险评估及模型更新模块包括:预警本文档来自技高网...

【技术保护点】
1.一种文本机器人自动监控方法,其特征在于,包括:/n在用于进行问题应答数据处理的文本机器人的上线运行期间,自动获取该文本机器人的业务指标数据;/n判断处于上线运行状态的文本机器人的业务指标数据是否满足对应的业务标准,若否,则基于预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据,对该文本机器人进行模型训练,得到更新后的文本机器人;/n应用更新后的文本机器人替换业务指标数据不满足业务标准的文本机器人,以基于更新后的文本机器人进行问题应答数据处理。/n

【技术特征摘要】
1.一种文本机器人自动监控方法,其特征在于,包括:
在用于进行问题应答数据处理的文本机器人的上线运行期间,自动获取该文本机器人的业务指标数据;
判断处于上线运行状态的文本机器人的业务指标数据是否满足对应的业务标准,若否,则基于预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据,对该文本机器人进行模型训练,得到更新后的文本机器人;
应用更新后的文本机器人替换业务指标数据不满足业务标准的文本机器人,以基于更新后的文本机器人进行问题应答数据处理。


2.根据权利要求1所述的文本机器人自动监控方法,其特征在于,还包括:
在用于进行问题应答数据处理的文本机器人的上线运行期间,实时获取该文本机器人在运行期间产生的问题应答数据;
对所述问题应答数据中的对应已有业务场景的数据进行数据去重处理,以更新所述已有业务场景对应的所述原始语料数据;
对所述问题应答数据中的未对应所述已有业务场景的数据进行新增业务场景识别;
应用自然语言处理技术,基于所述已有业务场景更新和拓展所述新增业务场景对应的语料数据,并将新增业务场景的场景特征与预设的知识图谱进行关联,以生成所述新增业务场景对应的所述新增语料数据。


3.根据权利要求1所述的文本机器人自动监控方法,其特征在于,所述基于预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据,对该文本机器人进行模型训练,得到更新后的文本机器人,包括:
输出针对业务指标数据不满足业务标准的文本机器人的预警信息;
若接收到根据所述预警信息生成的文本机器人升级指令,则获取预存储的原始语料数据以及所述文本机器人在运行期间产生的新增语料数据;
根据所述原始语料数据以及新增语料数据对该业务指标数据不满足业务标准的文本机器人进行模型训练,得到更新后的文本机器人。


4.根据权利要求3所述的文本机器人自动监控方法,其特征在于,所述根据所述原始语料数据以及新增语料数据对该业务指标数据不满足业务标准的文本机器人进行模型训练,得到更新后的文本机器人,包括:
基于所述原始语料数据以及所述新增语料数据生成训练集和测试集;
应用所述训练集对业务指标数据不满足业务标准的文本机器人进行模型训练,并应用所述测试集对训练得到的文本机器人进行模型测试;
将通过模型测试的文本机器人确定为更新后的文本机器人。


5.根据权利要求1所述的文本机器人自动监控方法,其特征在于,在所述应用更新后的文本机器人替换业务指标数据不满足业务标准的文本机器人,以基于更新后的文本机器人进行问题应答数据处理之后,还包括:
在更新后的文本机器人的上线运行期间,获取该更新后的文本机器人在预设时段内的业务指标数据,判断更新后的文本机器人在预设时段内的业务指标数据是否满足对应的质量后评价标准,若否,则对更新后的文本机器人进行版本回退处理。


6.根据权利要求2所述的文本机器人自动监控方法,其特征在于,所述对所述问题应答数据中的对应已有业务场景的数据进行数据去重处理,以更新所述已有业务场景对应的所述原始语料数据,包括:
根据已有业务场景的类型,对所述问题应答数据中的对应已有业务场景的数据进行数据分类;
对各个所述已有业务场景各自对应的多个语料数据中的应答数据进行数据去重处理。


7.根据权利要求2所述的文本机器人自动监控方法,其特征在于,所述对所述问题应答数据中的未对应所述已有业务场景的数据进行新增业务场景识别,包括:
对所述问题应答数据中的未对应所述已有业务场景的数据进行聚类处理,得到各组聚类数据;
分别提取各组所述聚类数据中的数据要素,以基于各个所述数据要素分别形成对应的新增业务场景。


8.根据权利要求2所述的文本机器人自动监控方法,其特征在于,所述应用自然语言处理技术,基于所述已有业务场景更新和拓展所述新增业务场景对应的语料数据,并将新增业务场景的场景特征与预设的知识图谱进行关联,以生成所述新增业务场景对应的所述新增语料数据,包括:
应用预设的自然语言处理方式,对所述已有业务场景对应的语料数据进行分词处理,并根据对应的分词结果确定所述已有业务场景的语言规则;
根据所述已有业务场景的语言规则,更新和拓展与该已有业务场景关联的新增业务场景的语料数据;
将新增业务场景的场景特征与预设的知识图谱进行关联,以生成所述新增业务场景对应的所述新增语料数据。


...

【专利技术属性】
技术研发人员:梁雨霏李永亮李凤亭杨玉刘晓刚
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1