对话生成方法及装置制造方法及图纸

技术编号:22000156 阅读:17 留言:0更新日期:2019-08-31 05:23
本发明专利技术公开了一种对话生成方法及装置,所述方法包括:接收用户当前输入信息;生成基于所述输入信息的原始回复语句;根据所述输入信息确定用户的情感状态;根据所述输入信息、所述用户的情感状态及预先离线挖掘的所述用户的身份性格画像信息,确定回复类型;根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句;输出所述带有身份情感的回复语句。利用本发明专利技术,可以提高与用户对话的灵活性及生动性,提升用户体验。

Dialogue Generation Method and Device

【技术实现步骤摘要】
对话生成方法及装置
本专利技术涉及信息处理领域,具体涉及一种对话生成方法及装置。
技术介绍
随着互联网技术的发展,对话系统在电商、智能设备等方面有着广泛的应用,越来越引起人们的关注。目前常见的对话系统有Siri、Echo、Bixby、微软小冰、阿里小蜜、智能音响等。现有的对话系统大致被分成两类:一类是任务导向型的对话系统,旨在帮助用户去完成特定任务,例如,阿里小蜜,可以帮助用户找商品、订住宿、订餐厅等,其生成的对话仅仅是为了满足用户的某种具体需求,在语气和表达方式等方面不带有任何的身份特征和情感色彩;另一类是非任务导向型对话系统(也称为聊天机器人),是与用户在开放领域的闲聊,例如,微软小冰,该对话系统在对话闲聊时虽然能够提供带有情感的对话,但它回复的语气和情感比较单一、普适,不具有多样性,换言之,该对话系统与用户的聊天仅仅是一个“普遍适用性格”的聊天者,它面对所有用户聊天,使用的都是同一个性格,缺乏人格身份的多样性。现有的对话系统在生成对话时,只考虑到聊天用户输出的对话内容,因此对于不同用户输出的同一内容的对话,生成的都是相同且单调的回复,不能因人而异,缺乏灵活性及生动性,使得用户体验不佳。
技术实现思路
本专利技术实施例提供一种对话生成方法及装置,以提高与用户对话的灵活性及生动性,提升用户体验。为此,本专利技术提供如下技术方案:一种对话生成方法,所述方法包括:接收用户当前输入信息;生成基于所述输入信息的原始回复语句;根据所述输入信息确定用户的情感状态;根据所述输入信息、所述用户的情感状态及预先离线挖掘的所述用户的身份性格画像信息,确定回复类型;根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句;输出所述带有身份情感的回复语句。可选地,所述生成基于所述输入信息的原始回复语句包括:利用预先建立的实体库识别出所述输入信息中的实体词和所述实体词的属性信息;确定用户当前对话状态;根据所述用户当前对话状态更新系统对话状态;获取与更新后的系统对话状态对应的回复语句模板;将所述实体词和所述实体词的属性信息填充到所述回复语句模板中,得到基于所述输入信息的原始回复语句。可选地,所述根据所述输入信息确定用户的情感状态包括:将所述输入信息输入预先训练的情感分类器,根据所述情感分类器的输出确定用户的情感状态。可选地,所述方法还包括按以下方式训练所述情感分类器:设定情感类型;从用户的历史对话语料中收集不同情感类型的数据作为训练数据;利用所述训练数据训练得到所述情感分类器。可选地,所述情感类型包括:中立,以及以下任意一种或多种:高兴、伤心、生气、低落。可选地,所述身份性格画像信息包括用于描述用户特征的标签集合,所述标签包括:人物属性类标签、和/或兴趣类标签。可选地,所述方法还包括按照以下方式离线挖掘所述用户的身份性格画像信息:分别获取所述用户的历史对话语料及历史行为数据;根据所述历史对话语料及历史行为数据,利用预先训练的属性分类器确定所述用户的人物属性类标签;从所述历史行为数据中提取历史行为信息;根据所述历史行为信息匹配预先建立的实体库,将匹配得到的实体词作为所述用户的兴趣类标签。可选地,所述方法还包括按照以下方式训练属性分类器:设定针对特定人物属性的类别;收集不同用户的对话语料及行为数据;分别从所述对话语料及所述行为数据中提取对应不同类别的数据作为训练数据;利用所述训练数据训练得到对应所述特定人物属性的属性分类器。可选地,所述用户的历史行为数据包括:所述用户的查询日志。可选地,所述根据所述输入信息、所述用户的情感状态及预先离线挖掘的所述用户的身份性格画像信息,确定回复类型包括:将所述输入信息、所述用户的情感状态及预先离线挖掘的所述用户的身份性格画像信息输入预先训练的回复类型分类器,根据所述回复类型分类器的输出确定回复类型。可选地,所述方法还包括按以下方式训练所述回复类型分类器:设定回复类型;从用户的历史对话语料中收集不同回复类型的数据作为训练数据;利用所述训练数据训练得到所述回复类型分类器。可选地,所述回复类型包括:中立型及以下任意一种或多种类型:可爱型、成熟型、积极乐观型。可选地,所述根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句包括:对所述原始回复语句进行槽位分解,得到各槽位及所述槽位对应的内容;针对分解后的非实体词所属槽位对应的内容,查询预设的风格语料库,得到与所述回复类型相符的、与所述槽位对应的语料内容,并将所述槽位对应的内容修改为所述语料内容;根据修改后各槽位对应的内容生成带有身份情感的回复语句。可选地,所述根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句还包括:获取与所述回复类型对应的修饰信息,并将所述修饰信息添加到所述带有身份情感的回复语句中。可选地,所述修饰信息包括以下任意一种或多种:语气词、表情符号修饰信息。可选地,根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句包括:利用所述原始回复语句及预先训练的与所述回复类型对应的风格语句模型,得到带有身份情感的回复语句。一种对话生成装置,所述装置包括:接收模块,用于接收用户当前输入信息;语句生成模块,用于生成基于所述输入信息的原始回复语句;情感状态确定模块,用于根据所述输入信息确定用户的情感状态;回复类型确定模块,用于根据所述输入信息、所述用户的情感状态及预先离线挖掘的所述用户的身份性格画像信息,确定回复类型;语句修改模块,用于根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句;输出模块,用于输出所述带有身份情感的回复语句。可选地,所述语句生成模块包括:信息识别单元,用于利用预先建立的实体库识别出所述输入信息中的实体词和所述实体词的属性信息;对话状态确定单元,用于确定用户当前对话状态;状态更新单元,用于根据所述用户当前对话状态更新系统对话状态;模板获取单元,用于获取与更新后的系统对话状态对应的回复语句模板;填充单元,用于将所述实体词和所述实体词的属性信息填充到所述回复语句模板中,得到基于所述输入信息的原始回复语句。可选地,所述情感状态确定模块,具体用于将所述输入信息输入预先训练的情感分类器,根据所述情感分类器的输出确定用户的情感状态。可选地,所述装置还包括:情感分类器训练模块,用于训练所述情感分类器;所述情感分类器训练模块包括:情感类型设定单元,用于设定情感类型;第一训练数据收集单元,用于从用户的历史对话语料中收集不同情感类型的数据作为训练数据;第一训练单元,用于利用所述训练数据训练得到所述情感分类器。可选地,所述情感类型包括:中立,以及以下任意一种或多种:高兴、伤心、生气、低落。可选地,所述身份性格画像信息包括用于描述用户特征的标签集合,所述标签包括:人物属性类标签、和/或兴趣类标签。可选地,所述装置还包括:信息挖掘模块,用于离线挖掘所述用户的身份性格画像信息;所述信息挖掘模块包括:信息获取单元,用于分别获取所述用户的历史对话语料及历史行为数据;人物属性类标签确定单元,用于根据所述历史对话语料及历史行为数据,利用预先训练的属性分类器确定所述用户的人物属性类标签;行为信息提取单元,用于从所述历史行为数据中提取历史行为信息;兴趣类标签确定单元,用于根据所述历史行为信息匹配预先建立的实体库,将匹配得到的实体本文档来自技高网...

【技术保护点】
1.一种对话生成方法,其特征在于,所述方法包括:接收用户当前输入信息;生成基于所述输入信息的原始回复语句;根据所述输入信息确定用户的情感状态;根据所述输入信息、所述用户的情感状态及预先离线挖掘的所述用户的身份性格画像信息,确定回复类型;根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句;输出所述带有身份情感的回复语句。

【技术特征摘要】
1.一种对话生成方法,其特征在于,所述方法包括:接收用户当前输入信息;生成基于所述输入信息的原始回复语句;根据所述输入信息确定用户的情感状态;根据所述输入信息、所述用户的情感状态及预先离线挖掘的所述用户的身份性格画像信息,确定回复类型;根据所述回复类型和所述原始回复语句,生成带有身份情感的回复语句;输出所述带有身份情感的回复语句。2.根据权利要求1所述的方法,其特征在于,所述生成基于所述输入信息的原始回复语句包括:利用预先建立的实体库识别出所述输入信息中的实体词和所述实体词的属性信息;确定用户当前对话状态;根据所述用户当前对话状态更新系统对话状态;获取与更新后的系统对话状态对应的回复语句模板;将所述实体词和所述实体词的属性信息填充到所述回复语句模板中,得到基于所述输入信息的原始回复语句。3.根据权利要求1所述的方法,其特征在于,所述身份性格画像信息包括用于描述用户特征的标签集合,所述标签包括:人物属性类标签、和/或兴趣类标签。4.根据权利要求3所述的方法,其特征在于,所述方法还包括按照以下方式离线挖掘所述用户的身份性格画像信息:分别获取所述用户的历史对话语料及历史行为数据;根据所述历史对话语料及历史行为数据,利用预先训练的属性分类器确定所述用户的人物属性类标签;从所述历史行为数据中提取历史行为信息;根据所述历史行为信息匹配预先建立的实体库,将匹配得到的实体词作为所述用户的兴趣类标签。5.根据权利要求4所述的方法,其特征在于,所述方法还包括按照以下方式训练属性分类器:设定针对特定人物属性的类别;收集不同用户的对话语料及行为数据;分别从所述对话语料及所述行为数据中提取对应不同类别的数据作为训练数据;利用所述训练数据训练...

【专利技术属性】
技术研发人员:叶祺刘志敏李婧
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1