一种智能问答系统技术方案

技术编号:14861857 阅读:86 留言:0更新日期:2017-03-19 14:59
本发明专利技术提供一种智能问答系统,其包括:一个以上问题输入模块,问题输入模块用来输入需要回答的问题,并对问题设定来源标识,所述来源标识中包含的大用户信息至少为两种以上,大用户下面还包括小用户,大用户之间是彼此独立的,不同的大用户之间的小用户是独立的;一个问题库;一个问题匹配模块;一个通用答案库;一个以上专业答案库;一个问题应答模块,根据问题匹配模块的匹配结果和问题的来源标识在专业答案库或通用答案库中找到相应问题的答案并根据来源标识将相应答案反馈给答案需要方。通过对用户的细分和对回答问题的细分,本发明专利技术能对不同的问题提问方给予有针对性的准确回答。

【技术实现步骤摘要】

本专利技术涉及机器人智能问答,自然语言处理(NLP)领域,原理是定向的采集加工有限语料,去覆盖一个确定的、小范围的会话场景,提升语言识别度,具体的,是按照行业分类,采集加工某一个行业的数据,构建行业知识库,实现一个行业的智能问答,特别适合智能客服系统。
技术介绍
随着社会发展,计算机技术的进步,人类对人工智能的向往和需求日益增强,一些技术前沿的企业纷纷推出了自己的聊天机器人,如微软小冰、百度小度、苹果SIRI等。纵观形形色色的聊天机器人,发现这些机器人都是依赖大数据技术,对海量数据加工形成知识库,在知识库中找到匹配问题的答案。逐一体验这些聊天机器人发现,这些聊天机器人娱乐聊天功能强大,在网上社交圈有爆棚的人气,与之相反,对更需要这些智能问答来减少人工压力的各行业客服来说,其应用价值极低。比如对机器人提问“红色的多少钱?”,往往会回答“你说多少钱就是多少钱”这种诙谐的答案,能博得大众一笑,却不能让客服用来回答用户的实际问题。不难发现,问题在于对机器人的提问没有指明问题的对象,各行各业都有红色的产品,海量知识库中,这个问题会对应一大堆的答案,卖花的会回答5元,卖衣服的会回答500元,卖电脑的也许会回答5000元,程序往往会选择出错几率最小的答案,对客服、用户来说,这样的答案都不是想要的。又如,对机器人提问“蒸发器是什么材质”,测试发现现有的机器人都不能正确回答,因为该问题比较专业,只有对冰箱很熟悉的人才知道答案。这说明,即使构建了包含海量问答的知识库,也很难较全面的覆盖各行各业。综上所述,聊天机器人目前普遍存在用户提问太广,提问对象不明确,很难用人工标注足够的语料构建覆盖度高的知识库的问题,导致匹配率低,回答不够精确,难以商业应用。
技术实现思路
本专利技术改进聊天机器人,采用一套新的问题答案匹配方法,更具有针对性,设定智能服务背景,解决目前在某些特定领域的问答应用,如网上特定商家客服等聊天机器人回答问题准确度低的问题。为解决现有技术中存在的一些技术问题,本专利技术为一种智能问答系统,包括:一个问题输入模块,问题输入模块用来输入需要回答的问题,并对问题设定其来源标识,所述来源标识中包含的大用户信息至少为两种以上,大用户下面还包括小用户,大用户之间是彼此独立的,同一个大用户的小用户之间是独立的;一个以上专业问题库,专业问题库中一般是把特定行业或用户的专业问题按照一定规则将语义相同的问题归类为同一个问题,一个专业问题库至少对应一个大用户的来源标识;一个问题匹配模块,根据问题输入模块输入的问题在问题库中查找到与其相匹配的问题;一个以上专业答案库,存储的答案一般是特定行业或用户的专业答案,相同的问题可能在不同的专业答案库中有不同的答案,一个专业答案库至少对应一个大用户的来源标识;一个问题应答模块,根据问题匹配模块的匹配结果和问题的来源标识在其对应的答案库中找到相应问题的答案并根据来源标识将相应答案反馈给答案需要方。做为上述智能问答系统的进一步改进,还包括一个通用问题库和一个通用答案库,通用问题库中的问题与通用答案库中的答案是相对应的;通用问题库存储一些通用问题,一般是至少五个以上大用户都会用到的,也是按照一定规则将语义相同的问题归类为同一个问题;所述的问题匹配模块在查找匹配问题时专业问题库比通用问题库优先匹配。做为上述智能问答系统的进一步改进,还包括一个语料标注加工模块,其提取原始语料中的问题进行标注加工,将标注后语义相同的问题和对应的答案建立索引对应关系,最后形成所述问题库一部分。做为上述智能问答系统的进一步改进,所述的语料标注加工模块对原始问题语料进行分词处理,提取重要词语生成关键字词组,使用关键字词组代替原始问题;为了完整覆盖相关问题,同时又避免匹配到不相关问题,根据问题的实际情况,在构建问题库的过程中,人工将问题的匹配方式标注为完全保留、关键字保留、有序关键字保留;其中完全保留是指直接使用原始语料作为问题,不做改动;关键字保留是指用不要求排列顺序的一组关键字代替原始语料;有序关键字保留是指用顺序排列的一组关键字代替原始语料。相应的,在问题匹配过程中,匹配模块对不同的匹配方式标注进行不同处理:完全保留,需问题库问题和用户的提问完全相同才能匹配成功;关键字保留,只需用户的提问包含问题库问题的所有关键字即可匹配成功;有序关键字保留,需用户的提问包含问题库问题的所有关键字,并且是按顺序排列的关键字,才能匹配成功。做为上述智能问答系统的进一步改进,所述的来源标识至少包含网页、电脑客户端、移动客户端、服务器端中的一种以及输入该问题的大用户和小用户编号。做为上述智能问答系统的进一步改进,所述的专业问题库和与其对应的专业答案库至少有一部分是通过访问特定网址并读取该网址上相关资料信息后再根据系统中设定的一定规则自动形成的;所述的自动形成的专业问题库和专业答案库具有其自身大用户的特定标识,其具体内容可以由大用户通过人工方式进行修改。做为上述智能问答系统的进一步改进,所述的特定网址是由大用户设定的,其可以根据需要进行增加或删减。做为上述智能问答系统的进一步改进,所述的访问特定网址是根据大用户在其管理系统中设定的时间点由系统自动实现的,结束后会反馈成功或失败提示信息。做为上述智能问答系统的进一步改进,所述的专业答案库下面还可以具体细分成一层以上更小的专业答案库,其访问与来源标识相关联,这样同样的专业问题其可能因为来源不同而对应答案在不同的更小专业答案库中。做为上述智能问答系统的进一步改进,所述的答案反馈给答案需要方后,答案需要方可以对相应答案的准确性进行标注;所述的通用答案库和/或专业答案库中的答案可以由大用户根据需要进行修改,其中大用户将通用答案库的内容修改后,该部分内容就变成该大用户的专业答案库一部分,与该答案对应的问题也会变成该大用户的专业问题库的一部分。本专利技术更具有针对性,建立专业问题库和专业答案库,这样更能有针对性的回答具体问题,专业问题库还可以细分成更小的专业问题库,针对专业问题可以不断细分下去,这样问题回答的准确性就会不断提高,整个系统的智能水平会不断提高。附图说明图1是本专利技术一种结构示意图;图2是本专利技术一种结构示意图;图3是本专利技术一种回答问题的简易流程图。具体实施方式下面结合附图对本专利技术进行详细说明。如图1所示,本专利技术为一种智能问答系统一种实施例,包括:问题输入模块,具体的输入终端可以为很多个,此问题输入模块用来输入需要回答的问题,并对问题设定其来源标识,所述来源标识中包含的大用户信息至少为两种以上,大用户下面还包括小用户,大用户之间是彼此独立的,同一个大用户的小用户之间是独立的,小用户下面还可以进一步细分成更小的用户,如微用户;有两个专业问题库,专业问题库中一般是把特定行业或用户的专业问题按照一定规则将语义相同的问题归类为同一个问题,一个专业问题库至少对应一个大用户的来源标识;有一个问题匹配模块,根据问题输入模块输入的问题在问题库中查找到与其相匹配的问题;有两个专业答案库,存储的答案一般是特定行业本文档来自技高网
...

【技术保护点】
一种智能问答系统,其特征在于包括:一个以上问题输入模块,问题输入模块用来输入需要回答的问题,并对问题设定其来源标识,所述来源标识中包含的大用户信息至少为两种以上,大用户下面还包括小用户,大用户之间是彼此独立的,同一个大用户的小用户之间是独立的;一个以上专业问题库,专业问题库中一般是把特定行业或用户的专业问题按照一定规则将语义相同的问题归类为同一个问题,一个专业问题库至少对应一个大用户的来源标识;一个问题匹配模块,根据问题输入模块输入的问题在问题库中查找到与其相匹配的问题;一个以上专业答案库,存储的答案一般是特定行业或用户的专业答案,相同的问题可能在不同的专业答案库中有不同的答案,一个专业答案库至少对应一个大用户的来源标识;一个问题应答模块,根据问题匹配模块的匹配结果和问题的来源标识在其对应的答案库中找到相应问题的答案并根据来源标识将相应答案反馈给答案需要方。

【技术特征摘要】
1.一种智能问答系统,其特征在于包括:
一个以上问题输入模块,问题输入模块用来输入需要回答的问题,并对问题设定其来源标识,所述来源标识中包含的大用户信息至少为两种以上,大用户下面还包括小用户,大用户之间是彼此独立的,同一个大用户的小用户之间是独立的;
一个以上专业问题库,专业问题库中一般是把特定行业或用户的专业问题按照一定规则将语义相同的问题归类为同一个问题,一个专业问题库至少对应一个大用户的来源标识;
一个问题匹配模块,根据问题输入模块输入的问题在问题库中查找到与其相匹配的问题;
一个以上专业答案库,存储的答案一般是特定行业或用户的专业答案,相同的问题可能在不同的专业答案库中有不同的答案,一个专业答案库至少对应一个大用户的来源标识;
一个问题应答模块,根据问题匹配模块的匹配结果和问题的来源标识在其对应的答案库中找到相应问题的答案并根据来源标识将相应答案反馈给答案需要方。
2.根据权利1所述的智能问答系统,其特征在于:
还包括一个通用问题库和一个通用答案库,通用问题库中的问题与通用答案库中的答案是相对应的;通用问题库存储一些通用问题,一般是至少五个以上大用户都会用到的,也是按照一定规则将语义相同的问题归类为同一个问题;所述的问题匹配模块在查找匹配问题时专业问题库比通用问题库优先匹配。
3.根据权利1或2所述的智能问答系统,其特征在于:
还包括一个语料标注加工模块,其提取原始语料中的问题进行标注加工,将标注后语义相同的问题和对应的答案建立索引对应关系,最后形成所述问题库一部分。
4.根据权利3所述的智能问答系统,其特征在于:所述的语料标注加工模块对原始问题语料进行分词处理,提取重要词语生成关键字词组,使用关键字词组代替原始问题;为了完整覆盖相关问题,同时又避免匹配到不相关问题,根据问题的实际情况,在构建问题库的过程中,人工将问题的匹配方式标注为完全保留、关键字保留、有序关键字保留;其中完全保留是指直接使用原始语料作为问题,不做改动;关键字保留是指用不要求...

【专利技术属性】
技术研发人员:周长华
申请(专利权)人:深圳市智客网络科技有限公司
类型:发明
国别省市:广东;44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1