面向开放域人机对话的技能推荐系统,它属于计算机人工智能技术领域。本发明专利技术解决了现有开放域人机对话中存在的当用户输入中有错误或者歧义信息时机器人可能做出与对话上下文不连贯的回复,以及没有特定的技能引导语句的问题。本发明专利技术利用基于弱监督学习的技能识别模块识别用户输入文本中的技能需求。闲聊回复模块根据用户输入分别采用生成式和检索式模型生成候选回复,在排序阶段通过基于Bert的文本相关性打分器对候选回复进行排序打分,选择得分最高的回复作为最优的闲聊回复,技能推荐模块根据最优的闲聊回复主动推荐合适的技能,生成包含推荐技能的流畅回复。本发明专利技术方法可以应用于开放域人机对话中的技能推荐。用于开放域人机对话中的技能推荐。用于开放域人机对话中的技能推荐。
【技术实现步骤摘要】
面向开放域人机对话的技能推荐系统
[0001]本专利技术属于计算机人工智能
,具体涉及一种面向开放域人机对话的技能推荐系统。
技术介绍
[0002]人机对话属于人工智能中自然语言处理的研究范畴,是近年来人工智能研究和产品落地的热点(王浩畅,李斌.聊天机器人系统研究进展[J].计算机应用与软件,2018,35(12):1
‑
6.)。比较典型的应用是聊天机器人,根据场景的不同,可以分为限定域的智能对话助手和开放域的闲聊对话机器人。
[0003]限定域智能对话助手例如微软小娜、谷歌助手、苹果Siri和亚马逊Alexa,它们通常帮助用户完成一些特定的任务,例如查询行程,播放音乐和设置提醒等。开放域的闲聊对话机器人例如微软小冰(Li Zhou,Jianfeng Gao,Di Li,and Heung
‑
Yeung Shum.2020.The Design and Implementation of XiaoIce,an Empathetic Social Chatbot.Computational Linguistics,46(1):53
–
93.),哈工大笨笨(Wei
‑
Nan Zhang,Ting Liu,Bing Qin,Yu Zhang,Wanxiang Che,Yanyan Zhao,and Xiao Ding.2017.Benben:AChinese Intelligent Conversational Robot.In Proceedings of ACL 2017,System Demonstrations,pages 13
–
18,Vancouver,Canada.Association for Computational Linguistics.),百度PLATO
‑
XL(Siqi Bao,Huang He,Fan Wang,Hua Wu,Haifeng Wang,Wenquan Wu,Zhihua Wu,Zhen Guo,Hua Lu,Xinxian Huang,Xin Tian,Xinchao Xu,Yingzhan Lin and Zheng
‑
Yu Niu.2022.PLATO
‑
XL:Exploring the Large
‑
scale Pre
‑
training of Dialogue Generation.Findings of AACL
‑
IJCNLP 2022,online.)。这类对话机器人能够为用户提供情感陪护。随着对话系统的发展,开放域的人机对话已经成为研究的热点,并且也逐渐应用在各个领域。虽然百度PLATO
‑
XL目前在开放域对话的各项指标上性能最好,但是其并不具备多个技能(Siqi Bao,Huang He,Fan Wang,Hua Wu,Haifeng Wang,Wenquan Wu,Zhihua Wu,Zhen Guo,Hua Lu,Xinxian Huang,Xin Tian,Xinchao Xu,Yingzhan Lin and Zheng
‑
Yu Niu.2022.PLATO
‑
XL:Exploring the Large
‑
scale Pre
‑
training of Dialogue Generation.Findings of AACL
‑
IJCNLP 2022,online.)。对于具备多个技能的微软小冰(工业界)和哈工大笨笨(学术界),其闲聊回复生成技术主要涉及以下两个方面:
[0004]技能切换机制。关键问题是如何切换到不同的技能。在这方面,微软小冰根据对话策略对输入信息进行分析,判断触发闲聊还是特定领域的聊天。然后再调用对应的技能模块,以及切换不同的技能模块(Li Zhou,Jianfeng Gao,Di Li,and Heung
‑
Yeung Shum.2020.The Design and Implementation of XiaoIce,an Empathetic Social Chatbot.Computational Linguistics,46(1):53
–
93.)。哈工大笨笨则利用一系列预先定义的规则来触发多个模块,最后评估多个模块的回复质量来决定最终的回复(李欢,徐慧.基于协同过滤的聊天机器人话题推荐[J].人工智能与机器人研究,2020,9(2):154
‑
162.)。
两者均是根据用户输入“智能”切换到不同的技能,如果用户输入中有错误信息或者歧义信息,机器人可能回复对话上下文不连贯的回复,影响用户体验。
[0005]技能引导语句。关键问题是如何将对话内容流畅地引导到对应的技能。在这方面,确定了需要触发的技能之后,微软小冰和哈工大笨笨均是调用对应的技能模块,获取候选回复,经过排序等处理,生成最终的回复。两者均没有特定的技能引导语句,而是直接跳转到了对应模块的起始回复。闲聊对话的一个特点是,用户倾诉机器人陪护。切换不同技能能提升对话的丰富性,但是缺少引导语句会导致话题从闲聊跳转到特定技能的信息变化较大。这可能让用户感觉很突兀,降低用户想与对话机器人倾诉的欲望。
[0006]综上所述,现有的开放域人机对话中主要存在以下问题:
[0007]一、如果用户输入中有错误信息或者歧义信息,机器人可能做出与对话上下文不连贯的回复;
[0008]二、没有特定的技能引导语句,而是直接跳转到了对应模块的起始回复,可能让用户感觉很突兀。
技术实现思路
[0009]本专利技术的目的是为解决现有开放域人机对话中存在的当用户输入中有错误或者歧义信息时机器人可能做出与对话上下文不连贯的回复,以及没有特定的技能引导语句的问题,而提出的一种面向开放域人机对话的技能推荐系统。
[0010]本专利技术为解决上述技术问题所采取的技术方案是:
[0011]一种面向开放域人机对话的技能推荐系统,所述技能推荐系统包括技能识别模块、闲聊回复模块和技能推荐模块,其中:
[0012]所述技能识别模块用于提取用户输入文本的语义表示,再根据提取出的语义表示得到对用户输入文本的技能需求识别结果;
[0013]所述闲聊回复模块根据用户输入文本生成候选闲聊回复,再从候选闲聊回复中选择出最优的闲聊回复;
[0014]所述技能推荐模块根据技能需求识别结果和最优的闲聊回复生成技能推荐回复;
[0015]所述技能推荐模块的工作原理为:
[0016]若技能识别模块的识别结果为当前用户输入文本中包含技能需求,则采用提示学习的方法生成包含最优闲聊回复的技能推荐回复;
[0017]若技能识别模块的识别结果为当前用户输入文本中无技能需求,则直接将最优闲聊回复作为当前本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.面向开放域人机对话的技能推荐系统,其特征在于,所述技能推荐系统包括技能识别模块、闲聊回复模块和技能推荐模块,其中:所述技能识别模块用于提取用户输入文本的语义表示,再根据提取出的语义表示得到对用户输入文本的技能需求识别结果;所述闲聊回复模块根据用户输入文本生成候选闲聊回复,再从候选闲聊回复中选择出最优的闲聊回复;所述技能推荐模块根据技能需求识别结果和最优的闲聊回复生成技能推荐回复;所述技能推荐模块的工作原理为:若技能识别模块的识别结果为当前用户输入文本中包含技能需求,则采用提示学习的方法生成包含最优闲聊回复的技能推荐回复;若技能识别模块的识别结果为当前用户输入文本中无技能需求,则直接将最优闲聊回复作为当前用户输入文本的回复。2.根据权利要求1所述的面向开放域人机对话的技能推荐系统,其特征在于,所述技能识别模块的工作过程为:利用预训练的Electra模型作为编码器,将用户输入文本作为编码器的输入,编码器的输出则为用户输入文本的语义表示;利用全连接层将语义表示映射为技能需求的概率分布,在概率分布结果中,将概率最高的类别作为用户输入文本的技能需求识别结果。3.根据权利要求2所述的面向开放域人机对话的技能推荐系统,其特征在于,所述Electra模型是基于弱监督学习进行预训练的,训练数据的构建方式为:步骤1、获取无标签的文本语料;步骤2、对于每个技能,分别生成技能的关键词字典;再利用生成的关键词字典从步骤1获取的文本语料中抽取文本,分别得到各个技能所对应的语料候选集;使用RoBERTa模型生成各个技能所对应的语料候选集中文本的语义表示,再对所有的语义表示进行聚类,以删除异常文本;步骤3、删除保留下来的文本中的关键词,再分别为每条文本赋予技能需求作为标签,利用删除关键词后的文本和对应的标签作为一部分训练数据;步骤4、从步骤1获取的文本语料中抽取与技能无关的语料,且抽取的技能无关语料与步骤2中抽取的语料规模相同,并对抽取的技能无关语料赋予无技能需求的标签,将技能无关语料以及对应的标签一起作为另一部分训练数据;步骤5、利用步骤3和步骤4中获得的训练数据对Electra模型进行预训练。4.根据权利要求3所述的面向开放域人机对话的技能推荐系统,其特征在于,所述对所有的语义表示进行聚类,采用的是K
‑
means算法。5.根据权利要求4所述的面向开放域人机对话的技能推荐系统,其特征在于,所述用户输入文本的技能需求识别结果为:用户输入文本具体所属的技能...
【专利技术属性】
技术研发人员:张伟男,刘元兴,王航,刘挺,杨浩波,郑桂东,文俊杰,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。