一种智能语音交互系统及方法技术方案

技术编号:25602405 阅读:59 留言:0更新日期:2020-09-11 23:59
本发明专利技术公开了一种智能语音交互系统与方法,系统包含预处理模块、策略流程模块、中控模块、自动外呼模块、语音合成模块、语音识别模块、语言处理模块,中控模块内置有,调度策略流程模块、自动外呼模块、语言处理模块的中控调度模块;方法包含步骤1‑步骤12;本发明专利技术能够实现多种算法整合调度,根据设定规则调度多种算法模型计算并综合计算结果得出最优解,以解决单一算法模型的盲点计算的局限性,达到互补的效果;对于多问题多意图等复杂回答的处理,中控调度模块将在文本在送至问题计算模型前,进行初步预处理,通过多意图拆分计算模型,将具有多种意图的问题分解为多份,然后再送至问题计算模型,得到多个答案后将答案结果整合后反馈给客户。

【技术实现步骤摘要】
一种智能语音交互系统及方法
本专利技术涉及人工智能
,具体涉及一种智能语音交互系统及方法。
技术介绍
随着人工智能技术的发展,使用机器模拟人与客户交互的应用越来越广泛,现有的语音交互机器人主要采用在知识库中预设问题及相应的答案,系统获取到客户的语音信息后,通过相应的算法转写为文本,将文本信息送入后台系统,到知识库中寻找对应的答案返回给客户,提高服务效率,降低运营成本;在实际使用中,由于采用关键词、正则表达式、深度学习模型等单一算法,计算出来的结果,答案不够精准,导致回复错误,效果不佳;由于预设定的答案一般为单一结果,对于客户多问题多意图等信息的解答效果不佳;由于预设的问题及对应的答案单一,设计的流程没有轮询及上下文及历史数据关联机制,导致与客户交流过程中机械痕迹明显,交互不流畅,体验不佳;不同业务类型或者同一业务不同阶段,采取同一种语音合成交互技术,无法做到个性化应对,导致实际使用效果打折;语音合成模块(TTS)为TextToSpeech,从文本到语音;语音识别模块(ASR)为AutomaticSpeechRecognition,自动语音识别;语言处理模块(NLP)为NaturalLanguageProcessing,自然语言处理;中控调度模块(CCD)为Centralcontroldispatchingdevice;多意图判断处理模块(MIM)为Multiintentionjudgmentprocessingmodule;多模型算法解析模块(MAM)为Multi-modelalgorithmanalysismodule;数据策略引擎模块(DSM)为Datastrategyenginemodule;分词策略引擎(SSE)为Segmentationstrategyengine;整合处理模块(DI)为Dataintergration;专利号为CN201810079431的专利技术专利提供了语音识别交互方法,其主要方向是智能语音交互中客户情绪识别及应用;专利号为CN201210110244的专利技术专利提供了智能客服营销分析,与本专利技术名称相似,其主要方向为适用于营销及客服业务交互的多渠道智能平台,不涉及智能语音交互。
技术实现思路
本专利技术要解决的技术问题是现有相关技术中因算法模型局限等原因导致交互理解准确率降低,并且应交互流程设计中策略算法单一导致交互体验不佳,应语音合成技术机械导致实际应用效果降低,本专利技术提供一种智能语音交互系统,采用预处理模块、策略流程模块、中控模块、自动外呼模块、语音合成模块、语音识别模块、语言处理模块、中控调度模块组合的系统,首先能够实现多种算法整合调度,根据设定规则调度多种算法模型计算并综合计算结果得出最优解,以解决单一算法模型的盲点计算的局限性,达到互补的效果;对于多问题多意图等复杂回答的处理,中控调度模块将在文本在送至问题计算模型前,进行初步预处理,通过多意图拆分计算模型,将具有多种意图的问题分解为多份,然后再送至问题计算模型,得到多个答案,再将答案结果进行整合,把整合后的答案反馈给客户;对于与客户交互,中控调度装置会在交互开始前初始化加载客户历史交互信息数据所得出规则信息,从而动态选择交互开场场景及策略,并且在与客户交互的过程中,根据当前交互流程,通过多种维度的数据记录及规则判断动态跳转所适配的交互场景,充分融合上下文与历史数据关联关系,做到千人千面;根据不同业务场景及同一业务场景不同阶段,在语音合成方面做个性化应对,交互自然,快速有效的达到业务目的;本专利技术在原有智能语音交互领域技术服务水平的基础上,做了进一步架构设计优化以及内容精细化的延伸,提升了交互的准确率,并使得特定场景可定制化处理,更好的解决了多意图的复杂场景,并结合历史、当前数据,通过多样化的方式回答客户的问题,有效的实现了千人千面的服务,综合提升了智能服务的水平。不同场景灵活应对,满足业务需求,用以解决现有技术导致的缺陷。本专利技术还提供一种智能语音交互方法。为解决上述技术问题本专利技术提供以下的技术方案:第一方面,一种智能语音交互系统,其中,包含预处理模块、策略流程模块、中控模块、自动外呼模块、语音合成模块、语音识别模块、语言处理模块,所述中控模块内置有中控调度模块,所述中控调度模块用于调度所述策略流程模块、所述自动外呼模块、所述语言处理模块;所述预处理模块用于存储导入的信息数据,并对所述信息数据进行预处理后导出至所述策略流程模块;所述策略流程模块用于接收预处理后的所述信息数据并进行逻辑策略的匹配,将匹配好的所述信息数据与所述逻辑策略共同传输至所述中控模块,所述策略流程模块还用于接收并反馈所述中控模块传输的拨打请求;所述中控模块用于接收、存储所述信息数据与所述逻辑策略,并将所述信息数据与所述逻辑策略整合成外呼数据,还用于依据所述自动外呼模块的数据请求向所述策略流程模块传输拨打请求,还用于依据所述策略流程模的反馈将所述外呼数据传输至所述自动外呼模块;所述自动外呼模块定时轮询向所述中控模块传输数据请求并获取所述外呼数据,还用于根据所述外呼数据拨打电话给客户,还用于获取所述语音合成模块的语音播放给客户,还用于接收客户的语音并将所述语音传输至所述语音识别模块,还用于接收所述语音识别模块反馈的文本文件并传输至所述中控模块;所述中控模块还用于接收所述文本并进行解析生成传输至所述语言处理模块,所述语言处理模块对所述文本进行解析生成传输至所述中控模块解析结果数据并传输至所述策略流程模块,所述策略流程模块根据解析结果数据确定新逻辑策略并传输至所述中控模块,所述中控模块将所述新逻辑策略传输至所述自动外呼模块,所述自动外呼模块获取所述语音合成模块的语音播放给客户;所述语音识别模块具有多个场景模型;所述语言处理模块具有知识模型、相似度辅助模型、深度学习模型;所述中控调度模块内置有多意图判断处理模块、多模型算法解析模块、数据策略引擎模块、整合处理模块;所述多意图判断处理模块、所述多模型算法解析模块、所述数据策略引擎模块、所述整合处理模块分别与所述语言处理模块连接进行数据传输;所述多意图判断处理模块用于分析客户的对话文本是否有多意图,所述多意图判断处理模块连接有分词策略引擎模块,所述多意图判断处理模块用于接收所述文本并通过所述分词策略引擎模块进行初过滤,进行客户的多意图判断并反馈至所述中控调度模块;所述中控调度模块获取所述多意图判断处理模块反馈的数据后根据所述文本中问题的数据进行选择调用所述多模型算法解析模块的方式,获取所述多模型算法解析模块生成的分数;所述中控调度模块获取所述分数后调用所述整合处理模块根据所述分数进行权重筛选得出计算结果数据并传输至所述数据策略引擎模块;所述数据策略引擎模块处理所述计算结果生成所述解析;所述多模型算法解析模块内置有知识模型算法解析模块、深度学习模型算法解析模块、相似度辅助模型算法解析模块本文档来自技高网
...

【技术保护点】
1.一种智能语音交互系统,其特征在于,包含预处理模块、策略流程模块、中控模块、自动外呼模块、语音合成模块、语音识别模块、语言处理模块,所述中控模块内置有中控调度模块,所述中控调度模块用于调度所述策略流程模块、所述自动外呼模块、所述语言处理模块;/n所述预处理模块用于存储导入的信息数据,并对所述信息数据进行预处理后导出至所述策略流程模块;/n所述策略流程模块用于接收预处理后的所述信息数据并进行逻辑策略的匹配,将匹配好的所述信息数据与所述逻辑策略共同传输至所述中控模块,所述策略流程模块还用于接收并反馈所述中控模块传输的拨打请求;/n所述中控模块用于接收、存储所述信息数据与所述逻辑策略,并将所述信息数据与所述逻辑策略整合成外呼数据,还用于依据所述自动外呼模块的数据请求向所述策略流程模块传输拨打请求,还用于依据所述策略流程模的反馈将所述外呼数据传输至所述自动外呼模块;/n所述自动外呼模块定时轮询向所述中控模块传输数据请求并获取所述外呼数据,还用于根据所述外呼数据拨打电话给客户,还用于获取所述语音合成模块的语音播放给客户,还用于接收客户的语音并将所述语音传输至所述语音识别模块,还用于接收所述语音识别模块反馈的文本文件并传输至所述中控模块;/n所述中控模块还用于接收所述文本并进行解析生成传输至所述语言处理模块,所述语言处理模块对所述文本进行解析生成传输至所述中控模块解析结果数据并传输至所述策略流程模块,所述策略流程模块根据解析结果数据确定新逻辑策略并传输至所述中控模块,所述中控模块将所述新逻辑策略传输至所述自动外呼模块,所述自动外呼模块获取所述语音合成模块的语音播放给客户;/n所述语音识别模块具有多个场景模型;/n所述语言处理模块具有知识模型、相似度辅助模型、深度学习模型;/n所述中控调度模块内置有多意图判断处理模块、多模型算法解析模块、数据策略引擎模块、整合处理模块;/n所述多意图判断处理模块、所述多模型算法解析模块、所述数据策略引擎模块、所述整合处理模块分别与所述语言处理模块连接进行数据传输;/n所述多意图判断处理模块用于分析客户的对话文本是否有多意图,所述多意图判断处理模块连接有分词策略引擎模块,所述多意图判断处理模块用于接收所述文本并通过所述分词策略引擎模块进行初过滤,进行客户的多意图判断并反馈至所述中控调度模块;/n所述中控调度模块获取所述多意图判断处理模块反馈的数据后根据所述文本中问题的数据进行选择调用所述多模型算法解析模块的方式,获取所述多模型算法解析模块生成的分数;/n所述中控调度模块获取所述分数后调用所述整合处理模块根据所述分数进行权重筛选得出计算结果数据并传输至所述数据策略引擎模块;/n所述数据策略引擎模块处理所述计算结果生成所述解析;/n所述多模型算法解析模块内置有知识模型算法解析模块、深度学习模型算法解析模块、相似度辅助模型算法解析模块。/n...

【技术特征摘要】
1.一种智能语音交互系统,其特征在于,包含预处理模块、策略流程模块、中控模块、自动外呼模块、语音合成模块、语音识别模块、语言处理模块,所述中控模块内置有中控调度模块,所述中控调度模块用于调度所述策略流程模块、所述自动外呼模块、所述语言处理模块;
所述预处理模块用于存储导入的信息数据,并对所述信息数据进行预处理后导出至所述策略流程模块;
所述策略流程模块用于接收预处理后的所述信息数据并进行逻辑策略的匹配,将匹配好的所述信息数据与所述逻辑策略共同传输至所述中控模块,所述策略流程模块还用于接收并反馈所述中控模块传输的拨打请求;
所述中控模块用于接收、存储所述信息数据与所述逻辑策略,并将所述信息数据与所述逻辑策略整合成外呼数据,还用于依据所述自动外呼模块的数据请求向所述策略流程模块传输拨打请求,还用于依据所述策略流程模的反馈将所述外呼数据传输至所述自动外呼模块;
所述自动外呼模块定时轮询向所述中控模块传输数据请求并获取所述外呼数据,还用于根据所述外呼数据拨打电话给客户,还用于获取所述语音合成模块的语音播放给客户,还用于接收客户的语音并将所述语音传输至所述语音识别模块,还用于接收所述语音识别模块反馈的文本文件并传输至所述中控模块;
所述中控模块还用于接收所述文本并进行解析生成传输至所述语言处理模块,所述语言处理模块对所述文本进行解析生成传输至所述中控模块解析结果数据并传输至所述策略流程模块,所述策略流程模块根据解析结果数据确定新逻辑策略并传输至所述中控模块,所述中控模块将所述新逻辑策略传输至所述自动外呼模块,所述自动外呼模块获取所述语音合成模块的语音播放给客户;
所述语音识别模块具有多个场景模型;
所述语言处理模块具有知识模型、相似度辅助模型、深度学习模型;
所述中控调度模块内置有多意图判断处理模块、多模型算法解析模块、数据策略引擎模块、整合处理模块;
所述多意图判断处理模块、所述多模型算法解析模块、所述数据策略引擎模块、所述整合处理模块分别与所述语言处理模块连接进行数据传输;
所述多意图判断处理模块用于分析客户的对话文本是否有多意图,所述多意图判断处理模块连接有分词策略引擎模块,所述多意图判断处理模块用于接收所述文本并通过所述分词策略引擎模块进行初过滤,进行客户的多意图判断并反馈至所述中控调度模块;
所述中控调度模块获取所述多意图判断处理模块反馈的数据后根据所述文本中问题的数据进行选择调用所述多模型算法解析模块的方式,获取所述多模型算法解析模块生成的分数;
所述中控调度模块获取所述分数后调用所述整合处理模块根据所述分数进行权重筛选得出计算结果数据并传输至所述数据策略引擎模块;
所述数据策略引擎模块处理所述计算结果生成所述解析;
所述多模型算法解析模块内置有知识模型算法解析模块、深度学习模型算法解析模块、相似度辅助模型算法解析模块。


2.如权利要求1所述的一种智能语音交互系统,其特征在于,所述预处理模块对所述信息数据进行不同业务类型、不同客户类型的分类与策略定制;
所述策略流程模块依据客户类型与策略定制匹配相应的所述逻辑策略以及相应的对话场景、语音音色、语气、话术后传输至所述中控模块;
所述策略流程模块生成新逻辑策略以及相应的话术传输至所述中控模块;
所述中控模块反馈传输所述外呼数据的同时传输交互流程数据给所述自动外呼模块。


3.如权利要求2所述的一种智能语音交互系统,其特征在于,所述分词策略引擎模块内置有对分词处理的序列标注模型与深度学习算法;
所述知识模型算法解析模块基于字符串匹配进行打分;
所述深度学习模型算法解析模块基于深度学习算法K-means、LDA算法、迭代决策树、TextCNN、TextRNN注意力模型进行打分;
所述相似度辅助模型算法解析模块基于词距离计算、协方差运算、词向量运算、稳定计算进行打分;
所述分数包含所述知识模型、所述深度学习模型、所述相似度辅助模型中任一个或多个模型的打分分数。


4.如权利要求3所述的一种智能语音交互系统,其特征在于,所述策略流程模块内置有业务方案存储模块、打断回复决策模块、被动打断判断模块、超时主动打断控制器、场景语意定义模块、置信度策略模块、回复策略模块、通话内存储记录库、文本库;
所述业务方案存储模块用于存储和输出各业务整体沟通方案,方案根据业务类型、业务场景,特定业务需要等预先进行制定,预先制定方案包括业务类型、话术模板、沟通方案;调用依据为用户画像和联络结果两项,其中用户画像根据业务类型、历史业务办理记录、特定业务指标等生成;联络结果则为历史沟通记录;
所述打断回复决策模块用于在沟通过程中对打断意图的判断及逻辑处理,打断形式分为由被外呼用户发起的被动打断及系统自主发起...

【专利技术属性】
技术研发人员:于业兴赵渭文刘建民李璇廉英顺薛旻昊马乔乔
申请(专利权)人:上海荣数信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1