一种基于通话数据检索的总线消息处理系统技术方案

技术编号:35247188 阅读:16 留言:0更新日期:2022-10-19 09:54
本发明专利技术涉及信息处理领域,尤其涉及一种基于通话数据检索的总线消息处理系统,本发明专利技术通过设置数据获取模块,数据存储模块,数据处理模块以及数据输出模块,通过将预设时段内通话信息转化为文本信息并对关键词进行提取,根据关键词的关联关系建立关联数据集合,计算关联数据集合对应的关键词匹配系数以表征关键词与信息源的关联关系以及关键词在文本信息中出现的频率和频次,并对关联数据集合进行筛选,选取与对应通话信息主要内容最匹配的数据源并输出,并且,在整个通话过程中,后续时段对于关联数据集合的筛选根据第一次筛选的结果确定筛选方式,以减少干扰关键词的影响,减少误判和误提取,以提高输出数据源与通话信息的匹配度和精准度。匹配度和精准度。匹配度和精准度。

【技术实现步骤摘要】
一种基于通话数据检索的总线消息处理系统


[0001]本专利技术涉及领域信息处理领域,尤其涉及一种基于通话数据检索的总线消息处理系统。

技术介绍

[0002]“企业服务总线”作为应用系统的连接中枢,是构筑企业信息系统的必要元素,其核心功能为消息交换,包括业务咨询、客户咨询,需求端将需求信息接入总线,总线再将对应需求信息发送至企业服务端,对应的,客服咨询作为企业服务总线的一个必要功能,被人们所重视,需求端通过向客服咨询,客服再通过具体需求提供对应的答复,中国专利技术公开号:CN107862423A,公开了一种系统评估方法、智能评估系统及计算机可读存储介质,该系统评估方法包括:获取智能客服系统与客户沟通所产生的对话记录;统计分析对话记录中每个客户所咨询问题的语义等同概率、每个客户的对话轮数和客户转接人工客服的概率,以获得统计数据;根据统计数据综合评估智能客服系统的服务水平,以获取评估结果,该专利技术改变了人工评估智能客服系统的评估方式,采用自动化系统评估机制,从智能客服系统的整体出发,实现对智能客服系统客观全面的系统化评估,避免人工评估的主观性和曲线局限性,以获得智能客服系统服务水平真实有效的评估结果,从而提高到评估效果的准确率,反馈出智能客服系统真实的服务水平,从而提高评估效率;但是,现有技术中还存在以下问题,1、现有技术中的智能客服技术对于人工客服的辅助需要人工手动操作,人工输入检索关键词检索对应的资料,缺少根据通话信息的关键词自行推荐提取对应资料的技术手段;2、现有技术中,对于通话信息中关键词的获取不够精确,缺少对干绕信息的筛选确定。

技术实现思路

[0003]为解决上述问题,本专利技术提供一种基于通话数据检索的总线消息处理系统,其包括:数据获取模块,其用以获取通话过程中产生的通话信息;数据存储模块,其用以存储数据源以及通话过程中产生的通话信息以及文本信息;数据处理模块,其与所述数据存储模块以及数据获取模块相连接并完成数据交换,所述数据处理模块将通话过程中产生的通话信息转化为文本信息,并在预设T1时间段后根据所述文本信息中关键词的关联关系建立关联数据集合,并对所述关联数据集合进行筛选,并根据筛选结果调用数据源,以及,所述数据处理模块在预设T1时间后每隔T2时段,识别对应文本信息中的关键词并建立关联数据集合,根据所述关联数据集合是否为重复关联数据集合确定筛选方
式,对所述关联数据集合进行筛选,并根据筛选结果调用数据源;数据输出模块,其与所述数据处理模块相连接,以将所述数据处理模块调用的数据源输出至需求端。
[0004]进一步地,所述数据存储模块内存储有若干数据源,任一所述数据源与若干不同关键词建立关联关系,并将所述若干不同关键词储存至同一数据集合,记为预存关联数据集合,对于任一数据源,所述数据存储模块将与所述数据源关联的若干关键词之间建立关联关系。
[0005]进一步地,所述数据处理模块将通话信息实时转码为文本信息,在通话进行预设时间T1时,所述数据处理模块提取所述文本信息中的多个关键词,对关键词进行区分,将存在关联关系的关键词储存至同一数据集合内,记为关联数据集合,并分别计算所述关联数据集合对应的关键词匹配系数F,其中,N表示所述关联数据集合内关键词数量占所述文本信息字数数量的比例,N0表示关键词数量占所述文本信息字数数量的预设比例,Q表示所述关联数据集合的关键词在所述文本信息中对应位置的平均信息间隔长度,Q0表示预设信息间隔长度,P表示所述关联数据集合内子集个数与对应预存关联数据集合内子集个数的比值,P≤1,P0表示预设比值。
[0006]进一步地,所述数据处理模块内预设第一预设关键词匹配系数对比参量F01以及第二预设关键词匹配系数对比参量F02,F02>F01,所述数据处理模块依次将关键词匹配系数F与所述第一预设关键词匹配系数对比参量F01以及第二预设关键词匹配系数对比参量F02进行对比,对所述关联数据集合进行筛选,调用数据源,其中,当存在关键词匹配系数F大于等于所述第二预设关键词匹配系数对比参量F02时,所述数据处理模块仅调用与该关键词匹配系数F对应的关联数据集合相关联的数据源;当存在关键词匹配系数F大于等于所述第一预设关键词匹配系数对比参量F01且小于所述第二预设关键词匹配系数对比参量F02时,所述数据处理模块将所述关键词匹配系数F记录至一数据集合内,记为二次判定用关键词匹配系数集合,并进行二次判定确定需调用数据源;当全部关键词匹配系数F均小于所述第一预设关键词匹配系数对比参量F0时,所述数据处理模块判定无需调用数据源。
[0007]进一步地,所述数据处理模块内预设关键词匹配系数差值f0,当所述数据处理模块进行二次判定时,所述数据处理模块将所述二次判定用关键词匹配系数集合内的关键词匹配系数F按照由大至小的顺序进行排序形成关键词匹配系数数列,并按照由大至小的顺序依次计算所述关键词匹配系数数列中相邻两关键词匹配系数F的差值,并与预设关键词匹配系数差值f0进行对比,当ΔF>f0时,则所述数据处理模块停止计算,确定已计算差值的关键词匹配系数F,并调用与所述已计算差值的关键词匹配系数对应的关联数据集合相关联的数据源。
[0008]进一步地,所述数据处理模块将已调用数据源相关联的所述关联数据集合中的关键词进行标记,并记录标记总数量B。
[0009]进一步地,所述数据处理模块在所述通话进行预设时间T1后,每隔T2时间段确定需要调用的数据源,所述数据处理模块根据T2时间段内通话信息对应的文本信息提取关键词,并形成若干关联数据集合,并分别计算所述关联数据集合对应的关键词匹配系数F,所述数据处理模块判定所述关联数据集合中是否存在被标记关键词,若存在,则判定所述关联数据集合为重复关联数据集合,并计算所述重复关联数据集合对应的第一预设关键词匹配系数对比参量修正值F01

以及第二预设关键词匹配系数对比参量修正值F02

,设定F01

=F01+f1
×
k,F02

=F02

f2
×
k,其中,f1表示第一预设修正量,f2表示第二预设修正量,k表示为所述重复关联数据集合中被标记关键词的数量与所述标记总数量B的比值。
[0010]进一步地,所述数据处理模块在T2时间段内调用数据源时,对所述关联数据集合进行筛选,依次将关键词匹配系数F与不同的参量进行对比,所述数据处理模块确定筛选方式时,根据所述关键词匹配系数F对应关联数据集合是否为重复关联数据集合确定所需对比参量,其中,当所述关键词匹配系数F对应数据集合不为重复关联数据集合时,所述数据处理模块将该关键词匹配系数F与所述第一预设关键词匹配系数对比参量修正F01

以及第二预设关键词匹配系数对比参量修正值F02

进行对比;当所述关键词匹配系数F对应数据集合为重复关联数据集合时,所述第一预设关键词匹配系数对比参量F01以及第二预设关键词匹配系数对比参量F02进行对比。
[0011]进一步地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于通话数据检索的总线消息处理系统,其特征在于,包括:数据获取模块,其用以获取通话过程中产生的通话信息;数据存储模块,其用以存储数据源以及通话过程中产生的通话信息以及文本信息;数据处理模块,其与所述数据存储模块以及数据获取模块相连接并完成数据交换,所述数据处理模块将通话过程中产生的通话信息转化为文本信息,并在预设T1时间段后根据所述文本信息中关键词的关联关系建立关联数据集合,并对所述关联数据集合进行筛选,并根据筛选结果调用数据源,以及,所述数据处理模块在预设T1时间后每隔T2时段,识别对应文本信息中的关键词并建立关联数据集合,根据所述关联数据集合是否为重复关联数据集合确定筛选方式,对所述关联数据集合进行筛选,并根据筛选结果调用数据源;数据输出模块,其与所述数据处理模块相连接,以将所述数据处理模块调用的数据源输出至需求端。2.根据权利要求1所述的基于通话数据检索的总线消息处理系统,其特征在于,所述数据存储模块内存储有若干数据源,任一所述数据源与若干不同关键词建立关联关系,并将所述若干不同关键词储存至同一数据集合,记为预存关联数据集合,对于任一数据源,所述数据存储模块将与所述数据源关联的若干关键词之间建立关联关系。3.根据权利要求1所述的基于通话数据检索的总线消息处理系统,其特征在于,所述数据处理模块将通话信息实时转码为文本信息,在通话进行预设时间T1时,所述数据处理模块提取所述文本信息中的多个关键词,对关键词进行区分,将存在关联关系的关键词储存至同一数据集合内,记为关联数据集合,并分别计算所述关联数据集合对应的关键词匹配系数F,其中,N表示所述关联数据集合内关键词数量占所述文本信息字数数量的比例,N0表示关键词数量占所述文本信息字数数量的预设比例,Q表示所述关联数据集合的关键词在所述文本信息中对应位置的平均信息间隔长度,Q0表示预设信息间隔长度,P表示所述关联数据集合内子集个数与对应预存关联数据集合内子集个数的比值,P≤1,P0表示预设比值。4.根据权利要求3所述的基于通话数据检索的总线消息处理系统,其特征在于,所述数据处理模块内预设第一预设关键词匹配系数对比参量F01以及第二预设关键词匹配系数对比参量F02,F02>F01,所述数据处理模块依次将关键词匹配系数F与所述第一预设关键词匹配系数对比参量F01以及第二预设关键词匹配系数对比参量F02进行对比,对所述关联数据集合进行筛选,调用数据源,其中,当存在关键词匹配系数F大于等于所述第二预设关键词匹配系数对比参量F02时,所述数据处理模块仅调用与该关键词匹配系数F对应的关联数据集合相关联的数据源;当存在关键词匹配系数F大于等于所述第一预设关键词匹配系数对比参量F01且小于所述第二预设关键词匹配系数对比参量F02时,所述数据处理模块将所述关键词匹配系数F记录至一数据集合内,记为二次判定用关键词匹配系数集合,并进行二次判定确定需调用数据源;当全部关键词匹配系数F均小于所述第一预设关键词匹配系数对比参量F0时,所述数
据处理模块判定无需调用数据源。5.根据权利要求4所述的基于通话数据检索的总线消息处理系统,其特征在于,所述数据处理模块内预设关键词匹配系数差值f0,当所述数据处理模块进行二次判定时,所述数据处理模块将所述二次判定用关键词匹配系数集合内的关键词匹配系数F按照由大至小的顺序进行排序形成关键词匹配系数数列,并按照由大至小的顺序依次计算所述关键词匹配系数数列中相邻两关键词匹配系数F的差值,并与预设关键词匹配系数差值f0进行对比,当ΔF>f0时,则所述数据处理模块停止计算,确定已计算差值的关键词匹配系数F,并调用与所述已计算差值的关键词匹配系数对应的关联数据集合相关联的数据源。6.根据权利要求5所述的基于通话数据检索的总线消息处理系统,其特征在于,所述数据处理模块将已调用数据源相关联的所述关联数据集合中的关键词进行标记,并记录标记总数量B。7.根据权利要求6所述的基于通话数据检索的总线消息处理系统,其特征在于,所述数据处理模块在所述通话进行预设时间T1后,每隔T2时间段确定需要调用的数据源,所述数据处理模块根据T2时间段内通话信息对应的文本信息提取关键词,并形成若干关联数据集合,并分别计算所述关联数据集合对应的关键词...

【专利技术属性】
技术研发人员:邵珠峰许芬吴迪张瑶连英群
申请(专利权)人:永鼎行远南京信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1