一种自动生成FAQ相似问句的方法和装置制造方法及图纸

技术编号:19857690 阅读:35 留言:0更新日期:2018-12-22 11:44
本发明专利技术涉及一种自动生成FAQ相似问句的方法和装置,所述方法包括:根据选定的FAQ生成一个文本;判断生成的文本与所述选定的FAQ是否相似;如果生成的文本与所述选定的FAQ相似,则该文本为所述选定的FAQ的相似问句。本发明专利技术通过自动生成FAQ相似问句,减少了人工标注的投入成本,并且对于新增的FAQ,可以快速地构建出对应的相似问,减少了对机器人知识库增加新的FAQ所需要的前期准备时间;此外,采用自然语言处理方法与句子生成规则相结合的方式来进行文本生成,可以更加有效地提高相似问句生成的质量。

【技术实现步骤摘要】
一种自动生成FAQ相似问句的方法和装置
本专利技术涉及机器人客服
,具体涉及一种自动生成FAQ相似问句的方法和装置。
技术介绍
常见问题FAQ(FrequentlyAskedQuestions)是目前机器人客服提供在线帮助的主要手段。现有的机器人客服采用计算机对客服场景中的用户提问进行判断,并根据用户的问题提供相应的回答从而减少客服场景中的人工坐席参与,减少了客服投入的人工成本。现有机器人客服的实现方式主要分为两种,分别是搜索技术和机器学习技术,其中,搜索技术又分为基于句法模板的搜索和基于相似问句的搜索。机器学习技术主要也是基于相似问句的机器学习。因此相似问句是多数客服机器人的学习依据。一些典型的相似问句,例如:用户A:忘记密码了。用户B:我的密码不记得了。用户C:不计得密码,怎办办?对于上述三个不同的用户对同一个问题会有不同的说法,甚至包括一些错别字在内。本质上,上面的问题都是同一个问题,即可以对应到FAQ“忘记密码”,这些不同的问法便构成了相似问句。当前收集获取相似问句的方式主要有两种:1.收集客服场景中的数据,例如用户访问客服的历史会话。将这些会话中的用户问句,通过人工标注的方式,对应到知识库FAQ上,一个问句只能对应一个FAQ。2.给知识库中的每一个FAQ,去找相应的相似问句,或者编写可能的用户问法作为相似问句。收集获取相似问句后,采用搜索技术将相似问句建入索引,当用户输入问句时,若当前用户问句与相似问句搜索相关性较高,则将这个相似问句所对应的FAQ,作为针对当前用户问句的回复。采用机器学习技术的机器人,用机器学习的方法判断当前用户问句和FAQ以及相似问句的匹配度,匹配度较高的相似问句对应的FAQ,作为当前用户问句的回复。可见,相似问句在整个智能客服机器人当中发挥重要作用。相似问句的获取成本、准确度,决定了搭建客服机器人的成本和准确度。现有技术中,收集整理相似问句是客服机器人数据处理过程非常重要的一个环节,也是机器人客服成本的主要部分。对于现有的客服机器人技术,不论是搜索方案还是机器学习方案,机器人都是通过学习相似问句以及对应的FAQ这一方式来提高自身的准确性。而采用人工的方式收集整理相似问句的方式,作为机器人学习的基础,还有一些不足可以进一步改进和解决,具体如下:1.人工标注的成本:目前人工标注是收集整理相似问句的一个主要方式。其具体流程是首先收集用户会话,然后由专业人员对用户会话的每一句做判断,来分辨出其中的相似问句,并判断这些相似问句属于哪个FAQ,然后再为这些相似问句打上相应FAQ的标签。一般说来,用户的历史会话量是非常大的,因此识别会话中的相似问句的工作量同样也是巨大的。此外,识别相似问句以及为这些问句标记相应FAQ的工作是需要由对相关领域的业务内容非常熟悉的人员来进行,所以人工标注同时也是需要具有专业人员参与才能完成的工作。因此,从工作量以及对专业知识的要求来说,人工标注的成本是非常高的。2.人工的耗时:客服场景中经常会出现增减FAQ的情况,这时候如果由人工来构建相似问句不仅繁琐,而且会错最佳时机。例如某电商客服场景下,假设在中秋节期间上线优惠活动,那么对应的可能会增加FAQ(例如:中秋打折的优惠券怎么领取?)。采用人工标注的方式对这些新增的FAQ构建足够的相似问句需要耗费较长的时间,并且一旦构建不及时很可能会影响到生产经营。
技术实现思路
有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种自动生成FAQ相似问句的方法和装置,该方法能够快速自动生成相似问句,能够解决现有技术中构建相似问句人工成本高且耗时长的问题。为实现以上目的,本专利技术采用如下技术方案:一种自动生成FAQ相似问句的方法,包括:根据选定的FAQ生成一个文本;判断生成的文本与所述选定的FAQ是否相似;如果生成的文本与所述选定的FAQ相似,则该文本为所述选定的FAQ的相似问句。可选的,所述根据选定的FAQ生成一个文本,包括:对选定的FAQ进行词性解析和句法解析;对解析后的词组进行近义词替换处理;按照预设的句子生成规则对处理后的词组进行重组。可选的,所述对选定的FAQ进行词性解析和句法解析是通过采用自然语言处理方法完成的。可选的,该方法还包括:如果生成的文本与所述选定的FAQ相似,则将该文本作为所述选定的FAQ的相似问句添加到所述选定的FAQ列表中;如果生成的文本与所述选定的FAQ不相似,则将该文本丢弃,并将判别结果作为反馈信息以调整所述句子生成规则。可选的,所述判断生成的文本与所述选定的FAQ是否相似,包括:获取所述文本与所述选定的FAQ的相似度;当所述相似度大于预设阈值时,所述文本与所述选定的FAQ相似;否则,所述文本与所述选定的FAQ不相似。可选的,所述获取所述文本与所述选定的FAQ的相似度,是通过计算所述文本与所述选定的FAQ的词向量余弦距离或Jaccard距离或编辑距离来实现的。本专利技术还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行一种自动生成FAQ相似问句的方法,所述方法包括:根据选定的FAQ生成一个文本;判断生成的文本与所述选定的FAQ是否相似;如果生成的文本与所述选定的FAQ相似,则该文本为所述选定的FAQ的相似问句。本专利技术还提供了一种自动生成FAQ相似问句的装置,包括:文本生成器,用于根据选定的FAQ生成一个文本;文本判别器,用于判断生成的文本与所述选定的FAQ是否相似。可选的,所述文本生成器包括:解析模块,用于对选定的FAQ进行词性解析和句法解析;替换模块,用于对解析后的词组进行近义词替换处理;重组模块,用于按照预设的句子生成规则对处理后的词组进行重组。本专利技术还提供了一种机器人客服系统,包括:如前面任一项所述的装置。本专利技术采用以上技术方案,所述自动生成FAQ相似问句的方法,包括:根据选定的FAQ生成一个文本;判断生成的文本与所述选定的FAQ是否相似;如果生成的文本与所述选定的FAQ相似,则该文本为所述选定的FAQ的相似问句。该方法通过自动生成FAQ相似问句,减少了人工标注的投入成本,并且对于新增的FAQ,可以快速地构建出对应的相似问,减少了对机器人知识库增加新的FAQ所需要的前期准备时间;此外,采用自然语言处理方法与句子生成规则相结合的方式来进行文本生成,可以更加有效地提高相似问句生成的质量。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术自动生成FAQ相似问句的方法实施例一提供的流程示意图;图2是本专利技术自动生成FAQ相似问句的方法实施例二提供的流程示意图;图3是本专利技术自动生成FAQ相似问句的装置实施例一提供的结构示意图;图4是本专利技术自动生成FAQ相似问句的装置实施例一提供的工作原理示意图;图5是本专利技术列举的一个例子的处理过程示意图;图6是本专利技术自动生成FAQ相似问句的装置实施例二提供的结构示意图。图中:1、文本生成器;2、文本判别器;11、解析模块;12、替换模块;13、重组模块。具体实施方式为使本专利技术的目的、技术方本文档来自技高网
...

【技术保护点】
1.一种自动生成FAQ相似问句的方法,其特征在于,包括:根据选定的FAQ生成一个文本;判断生成的文本与所述选定的FAQ是否相似;如果生成的文本与所述选定的FAQ相似,则该文本为所述选定的FAQ的相似问句。

【技术特征摘要】
1.一种自动生成FAQ相似问句的方法,其特征在于,包括:根据选定的FAQ生成一个文本;判断生成的文本与所述选定的FAQ是否相似;如果生成的文本与所述选定的FAQ相似,则该文本为所述选定的FAQ的相似问句。2.根据权利要求1所述的方法,其特征在于,所述根据选定的FAQ生成一个文本,包括:对选定的FAQ进行词性解析和句法解析;对解析后的词组进行近义词替换处理;按照预设的句子生成规则对处理后的词组进行重组。3.根据权利要求2所述的方法,其特征在于,所述对选定的FAQ进行词性解析和句法解析是通过采用自然语言处理方法完成的。4.根据权利要求2所述的方法,其特征在于,还包括:如果生成的文本与所述选定的FAQ相似,则将该文本作为所述选定的FAQ的相似问句添加到所述选定的FAQ列表中;如果生成的文本与所述选定的FAQ不相似,则将该文本丢弃,并将判别结果作为反馈信息以调整所述句子生成规则。5.根据权利要求1至4任一项所述的方法,其特征在于,所述判断生成的文本与所述选定的FAQ是否相似,包括:获取所述文本与所述选定的FAQ的相似度;当所述相似度大于预设阈值时,所述文本与所述选定的FA...

【专利技术属性】
技术研发人员:潘晟锋杨振宇刘云峰吴悦陈正钦胡晓汶林丁
申请(专利权)人:深圳追一科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1