用于自然语言处理的方法和设备技术

技术编号:28722929 阅读:18 留言:0更新日期:2021-06-06 04:37
公开了一种用于自然语言处理的方法和设备。所述方法包括:确定用户的输入句子与选择的第一数据库查询句子之间的第一相似度,基于确定第一相似度不满足第一阈值,确定比输入句子的全部少的输入句子的部分与选择的第二数据库查询句子之间的第二相似度,和响应于第二相似度满足第二阈值,输出与第二数据库查询句子相应的回复句子作为对输入句子的回复。子相应的回复句子作为对输入句子的回复。子相应的回复句子作为对输入句子的回复。

【技术实现步骤摘要】
用于自然语言处理的方法和设备
[0001]本申请要求于2019年11月19日在韩国知识产权局提交的第10-2019-0148984号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。


[0002]下面的描述涉及用于自然语言处理的方法和设备。

技术介绍

[0003]聊天机器人系统是用于生成与用户输入的句子相应的回复句子的系统。聊天机器人系统可包括基于检索模型的聊天机器人系统和基于生成(生成式)模型的聊天机器人系统。由于基于检索模型的聊天机器人系统基于存储在数据库中的数据,因此难以输出适合于数据库中尚未包括的输入句子或短语的回复句子。基于生成模型的聊天机器人系统生成各种回复。然而,因为基于生成模型的聊天机器人系统可能生成语法错误的回复或在不同时间对相同的查询输入生成不同的回复,所以基于生成模型的聊天机器人系统通常是不一致的。

技术实现思路

[0004]提供本
技术实现思路
以简化的形式介绍在以下具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在确定要求权利的主题的关键特征或必要特征,也不意在用于帮助确定要求权利的主题的范围。
[0005]在一个总体方面,一种处理器实现的方法包括:确定用户的输入句子与选择的第一数据库查询句子之间的第一相似度,和基于确定第一相似度不满足第一阈值,确定比输入句子的全部少的输入句子的部分与选择的第二数据库查询句子之间的第二相似度,和响应于第二相似度满足第二阈值,输出与第二数据库查询句子相应的回复句子作为对输入句子的回复。
[0006]所述方法还可包括:将输入句子编码为第一特征向量,其中,确定第一相似度的步骤可包括:确定第一特征向量与第一数据库查询句子之间的相似度,第一数据库查询句子是存储在数据库中的多个查询句子特征向量之中的存储在数据库中的第一查询句子特征向量。
[0007]所述方法还可包括:基于确定第一相似度不满足第一阈值,将输入句子的所述部分编码为第二特征向量,其中,确定第二相似度的步骤可包括:确定第二特征向量与第二数据库查询句子之间的相似度,第二数据库查询句子是存储在数据库中的第二查询句子特征向量。
[0008]输出与第二数据库查询句子相应的回复句子的步骤可包括:对第二查询句子特征向量进行解码以获得回复句子。
[0009]输入句子的所述部分可以是包括在输入句子中的多个成分中的一个成分。
[0010]输入句子的所述部分可以是包括在输入句子中的作为所述一个成分的动词。
[0011]输入句子的所述部分可以是基于多种任务的类型中的与输入句子相应的任务的类型而选择的句子成分。
[0012]所述多种任务的类型可包括:聊天机器人类型和检索类型。
[0013]用于确定输入句子的所述部分的输入句子的分配可基于对输入句子执行的词素分析。
[0014]所述方法还包括:基于第一相似度满足第一阈值,输出与第一查询句子相应的回复句子作为对输入句子的回复。
[0015]所述方法还包括:当第二相似度不满足第二阈值时,使用生成模型生成与输入句子相应的回复句子,并且输出生成的回复句子。
[0016]用户的输入句子可从用户说出的语音或用户输入的文本数据获取。
[0017]在一个总体方面,非暂时性计算机可读存储介质存储指令,所述指令在由一个或多个处理器执行时,使所述一个或多个处理器执行在此描述的所有处理中的一个或多个或它们的任意组合。
[0018]在一个总体方面,一种处理器实现的方法包括:从包括在用户的输入句子中的所有成分中选择成分;确定选择的成分与选择的数据库存储的查询句子之间的相似度;和基于相似度是否满足阈值,选择性地输出与数据库存储的查询句子相应的回复句子作为对输入句子的回复。
[0019]选择成分的步骤可包括:选择与正在处理输入句子的任务的类型相应的成分,以选择性输出回复句子作为对输入句子的回复。
[0020]选择与任务的类型相应的成分的步骤可包括:从至少包括聊天机器人类型和检索类型的多种任务类型之中确定任务的类型,并且基于确定任务的类型的结果,在输入句子的名词与动词之间进行选择以作为选择的成分。
[0021]选择成分的步骤可包括:对输入句子执行词素分析;和基于执行的词素分析的结果选择成分。
[0022]所述方法还可包括:当相似度不满足阈值时,使用生成模型生成与输入句子相应的回复句子,并且输出生成的回复句子作为输入句子的回复。
[0023]所述的方法还可包括:将成分编码为第一特征向量,其中,确定相似度的步骤可包括:确定第一特征向量与存储在数据库中的多个成分特征向量之中的存储在数据库中的成分特征向量之间的相似度。
[0024]所述方法还可包括:基于输入句子的编码结果与选择的存储的数据库查询编码结果之间的初始相似度确定是否满足初始阈值,确定是否执行成分的选择、相似度的确定和选择性输出。
[0025]当相似度满足阈值时,选择性输出与数据库查询句子相应的回复句子的步骤包可括:对第一特征向量进行解码并输出解码的第一特征向量作为回复句子。
[0026]在一个总体方面,一种设备包括:一个或多个处理器,被配置为:确定用户的输入句子与选择的第一数据库查询句子之间的第一相似度;和基于确定第一相似度不满足第一阈值,确定比输入句子的全部少的输入句子的部分与选择的第二数据库查询句子之间的第二相似度,和响应于第二相似度满足第二阈值,输出与第二数据库查询句子相应的回复句子作为对输入句子的回复。
[0027]输入句子的所述部分可以是包括在输入句子中的多个成分中的一个成分。
[0028]输入句子的所述部分可以是包括在输入句子中的作为所述一个成分的动词。
[0029]输入句子的所述部分可以是基于多种任务的类型中的与输入句子相应的任务的类型而选择的句子成分。
[0030]所述多种任务的类型可包括:聊天机器人类型和检索类型。
[0031]用于确定输入句子的部分的输入句子的分配可基于对输入句子执行的词素分析。
[0032]在一个总体方面,一种设备包括:一个或多个处理器,被配置为:输出与第一数据库查询句子相应的第一回复句子,第一数据库查询句子具有满足第一阈值的与用户的输入句子的相似度;和输出与第二数据库查询句子相应的第二回复句子,第二数据库查询句子具有满足第二阈值的与输入句子的选择部分的相似度。
[0033]所述一个或多个处理器还可被配置为:在输出第一回复与输出第二回复之间进行选择,并且基于在输出第一回复与输出第二回复之间的选择,仅输出第一回复和第二回复中的一个。
[0034]所述一个或多个处理器还可被配置为:通过使用生成模型针对输入句子生成第三回复句子,并且被配置为:输出生成的第三回复句子。
[0035]所述一个或多个处理器还可被配置为:在输出第一回复、输出第二回复与输出第三回复之间进行选择,并且基于在输出第一回复、输出第二回复与输出第三回复之间的选择,仅输出第一回复、第二回复和第三回复中的一个。
...

【技术保护点】

【技术特征摘要】
1.一种用于自然语言处理的方法,所述方法包括:确定用户的输入句子与选择的第一数据库查询句子之间的第一相似度;和基于确定第一相似度不满足第一阈值,确定比输入句子的全部少的输入句子的部分与选择的第二数据库查询句子之间的第二相似度,和响应于第二相似度满足第二阈值,输出与第二数据库查询句子相应的回复句子作为对输入句子的回复。2.根据权利要求1所述的方法,还包括:将输入句子编码为第一特征向量,其中,确定第一相似度的步骤包括:确定第一特征向量与第一查询句子特征向量之间的相似度,第一查询句子特征向量是存储在数据库中的多个查询句子特征向量之中的与第一数据库查询句子相应的特征向量。3.根据权利要求2所述的方法,还包括:基于确定第一相似度不满足第一阈值,将输入句子的所述部分编码为第二特征向量,其中,确定第二相似度的步骤包括:确定第二特征向量与第二查询句子特征向量之间的相似度,第二查询句子特征向量与存储在数据库中的第二数据库查询句子相应。4.根据权利要求3所述的方法,其中,输出与第二数据库查询句子相应的回复句子的步骤包括:对第二查询句子特征向量进行解码以获得回复句子。5.根据权利要求1所述的方法,其中,输入句子的所述部分是包括在输入句子中的多个成分中的一个成分。6.根据权利要求5所述的方法,其中,输入句子的所述部分是包括在输入句子中的作为所述一个成分的动词。7.根据权利要求1所述的方法,其中,输入句子的所述部分是基于多种任务的类型中的与输入句子相应的任务的类型而选择的句子成分。8.根据权利要求7所述的方法,其中,所述多种任务的类型包括:聊天机器人类型和检索类型。9.根据权利要求1所述的方法,其中,用于确定输入句子的所述部分的输入句子的划分基于对输入句子执行的词素分析。10.根据权利要求1所述的方法,还包括:基于第一相似度满足第一阈值,输出与第一数据库查询句子相应的回复句子作为对输入句子的回复。11.根据权利要求1所述的方法,还包括:当第二相似度不满足第二阈值时,使用生成模型生成与输入句子相应的回复句子,并且输出生成的回复句子。12.根据权利要求1所述的方法,其中,用户的输入句子从用户说出的语音或用户输入的文本数据获取。13.一种用于自然语言处理的方法,所述方法包括:从包括在用户的输入句子中的所有成分中选择成分;确定选择的成分与选择的数据库存储的查询句子之间的相似度;和
基于相似度是否满足阈值,选择性地输出与数据库存储的查询句子相应的回复句子作为对输入句子的回复。14.根据权利要求13所述的方法,其中,选择成分的步骤包括:选择与正在处理输...

【专利技术属性】
技术研发人员:金美淑柳尚贤朴贞训全在勋韩奎范
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1