本申请涉及一种文本生成方法、装置、计算机设备和存储介质,涉及大数据技术领域。所述方法包括:接收输入文本,并根据输入文本确定目标三元组中的目标头实体、及目标三元组中的目标连接关系;通过目标头实体及目标连接关系对问答数据库进行查询,得到至少一个第一备选三元组,并通过目标头实体及目标连接关系对问答知识图谱进行查询,得到至少一个第二备选三元组;从各第一备选三元组和各第二备选三元组中,确定目标三元组中的目标尾实体;根据目标头实体、目标连接关系及目标尾实体构建目标三元组,并根据目标三元组构建针对输入文本的目标输出文本。采用本方法能够提高目标输出文本的生成精度。的生成精度。的生成精度。
【技术实现步骤摘要】
文本生成方法、装置、计算机设备和存储介质
[0001]本申请涉及大数据
,特别是涉及一种文本生成方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着自然语言处理技术的快速发展,出现了自然语言处理技术和知识图谱技术相结合的知识图谱问答系统。当前的知识图谱问答系统通过解析客户输入的关键词,并根据关键词匹配知识图谱中最接近的答案来快速回答客户,再通过收集客户对回答结果的满意程度,由工作人员汇总问题与问题下满意度较高的答案去实现问答系统的更新。
[0003]然而,上述方法对问答系统的更新频率较低,使得问答系统中的答案可能会存在不准确或过期的情况,导致问答系统向用户返回的答案精度较低。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种文本生成方法、装置、计算机设备和存储介质。
[0005]第一方面,本申请提供了一种文本生成方法。所述方法包括:
[0006]接收输入文本,并根据所述输入文本确定目标三元组中的目标头实体、及所述目标三元组中的目标连接关系;
[0007]通过所述目标头实体及所述目标连接关系对问答数据库进行查询,得到至少一个第一备选三元组,并通过所述目标头实体及所述目标连接关系对问答知识图谱进行查询,得到至少一个第二备选三元组;
[0008]从各所述第一备选三元组和各所述第二备选三元组中,确定所述目标三元组中的目标尾实体;
[0009]根据所述目标头实体、所述目标连接关系及所述目标尾实体构建所述目标三元组,并根据所述目标三元组构建针对所述输入文本的目标输出文本。
[0010]在其中一个实施例中,所述根据所述输入文本构建目标三元组中的目标头实体,包括:
[0011]从所述输入文本中提取第一分词和第二分词,并将所述第二分词作为所述目标三元组中的目标连接关系,其中,所述第一分词为名词,所述第二分词为修饰所述第一分词的谓语;
[0012]将所述第一分词作为候选头实体,并根据所述候选头实体,从所述问答知识图谱中匹配得到和所述候选头实体对应的全部第一实体;
[0013]在所述第一实体的数量小于或者等于数量阈值的情况下,将所述候选头实体作为目标三元组中的目标头实体。
[0014]在其中一个实施例中,所述方法还包括:
[0015]在所述第一实体的数量大于所述数量阈值的情况下,根据所述候选头实体和各所
述第一实体生成中间输出文本,并向发送所述输入文本的终端设备发送所述中间输出文本;
[0016]接收所述终端设备针对所述中间输出文本反馈的中间输入文本,并从所述中间输入文本中提取第三分词,所述第三分词为名词;
[0017]将所述第三分词作为所述候选头实体,并跳转至根据所述候选头实体,从所述问答知识图谱中匹配得到和所述候选头实体对应的全部第一实体的步骤。
[0018]在其中一个实施例中,所述根据所述候选头实体,从所述问答知识图谱中匹配得到和所述候选头实体对应的全部第一实体,包括:
[0019]分别确定所述候选头实体,和所述问答知识图谱中各实体之间的实体相似度;
[0020]根据当前发送所述中间输出文本的总次数,确定相似度阈值,其中所述相似度阈值与发送所述中间输出文本的总次数正相关;
[0021]将所述实体相似度大于相似度阈值的实体,作为所述候选头实体对应的第一实体。
[0022]在其中一个实施例中,所述方法还包括:
[0023]在所述第一实体的数量大于所述数量阈值时,获取所述输入文本对应的用户信息,并从所述用户信息中获取所述候选头实体的关联信息;
[0024]根据所述关联信息和所述候选头实体,构建所述目标三元组中的目标头实体。
[0025]在其中一个实施例中,所述通过所述目标头实体及所述目标连接关系对问答数据库进行查询,得到至少一个第一备选三元组,包括:
[0026]基于所述目标头实体和所述目标连接关系,对所述问答数据库中的全部文本进行分类,并将与所述目标头实体和所述目标连接关系属于同一类别的文本作为候选文本;
[0027]针对任一所述候选文本,从所述候选文本中提取第一备选三元组中的头实体、第一备选三元组中的连接关系,及第一备选三元组中的尾实体,并根据所述第一备选三元组中的头实体、所述第一备选三元组中的连接关系,及所述第一备选三元组中的尾实体构建所述第一备选三元组。
[0028]在其中一个实施例中,所述从各所述第一备选三元组和各所述第二备选三元组中,确定所述目标三元组中的目标尾实体,包括:
[0029]分别确定所述目标头实体和各第一头实体、各第二头实体的第一相似度,其中,所述第一头实体为所述第一备选三元组中的头实体,所述第二头实体为所述第二备选三元组中的头实体;
[0030]分别确定所述目标连接关系和各第一连接关系、各第二连接关系的第二相似度,其中,所述第一连接关系为所述第一备选三元组中的连接关系,所述第二连接关系为所述第二备选三元组中的连接关系;
[0031]根据各所述第一相似度和各所述第二相似度,从各所述第一备选三元组及各所述第二备选三元组中,确定与所述目标头实体及所述目标连接关系相匹配的第三备选三元组;
[0032]将所述第三备选三元组的尾实体作为所述目标尾实体。
[0033]在其中一个实施例中,所述方法还包括:
[0034]在所述第三备选三元组属于所述第一备选三元组的情况下,将所述目标三元组
和/或所述第三备选三元组添加至所述问答知识图谱中。
[0035]第二方面,本申请还提供了一种文本生成装置。所述装置包括:
[0036]第一接收模块,用于接收输入文本,并根据所述输入文本确定目标三元组中的目标头实体、及所述目标三元组中的目标连接关系;
[0037]查询模块,用于通过所述目标头实体及所述目标连接关系对问答数据库进行查询,得到至少一个第一备选三元组,并通过所述目标头实体及所述目标连接关系对问答知识图谱进行查询,得到至少一个第二备选三元组;
[0038]确定模块,用于从各所述第一备选三元组和各所述第二备选三元组中,确定所述目标三元组中的目标尾实体;
[0039]第一构建模块,用于根据所述目标头实体、所述目标连接关系及所述目标尾实体构建所述目标三元组,并根据所述目标三元组构建针对所述输入文本的目标输出文本。
[0040]在其中一个实施例中,所述第一接收模块,还用于:
[0041]从所述输入文本中提取第一分词和第二分词,并将所述第二分词作为所述目标三元组中的目标连接关系,其中,所述第一分词为名词,所述第二分词为修饰所述第一分词的谓语;
[0042]将所述第一分词作为候选头实体,并根据所述候选头实体,从所述问答知识图谱中匹配得到和所述候选头实体对应的全部第一实体;
[0043]在所述第一实体的数量小于或者等于数量阈值的情况下,将所述候选头实体作为目标三元组中的目标头实体。
[0044]在其本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种文本生成方法,其特征在于,所述方法包括:接收输入文本,并根据所述输入文本确定目标三元组中的目标头实体、及所述目标三元组中的目标连接关系;通过所述目标头实体及所述目标连接关系对问答数据库进行查询,得到至少一个第一备选三元组,并通过所述目标头实体及所述目标连接关系对问答知识图谱进行查询,得到至少一个第二备选三元组;从各所述第一备选三元组和各所述第二备选三元组中,确定所述目标三元组中的目标尾实体;根据所述目标头实体、所述目标连接关系及所述目标尾实体构建所述目标三元组,并根据所述目标三元组构建针对所述输入文本的目标输出文本。2.根据权利要求1所述的方法,其特征在于,所述根据所述输入文本构建目标三元组中的目标头实体,包括:从所述输入文本中提取第一分词和第二分词,并将所述第二分词作为所述目标三元组中的目标连接关系,其中,所述第一分词为名词,所述第二分词为修饰所述第一分词的谓语;将所述第一分词作为候选头实体,并根据所述候选头实体,从所述问答知识图谱中匹配得到和所述候选头实体对应的全部第一实体;在所述第一实体的数量小于或者等于数量阈值的情况下,将所述候选头实体作为目标三元组中的目标头实体。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述第一实体的数量大于所述数量阈值的情况下,根据所述候选头实体和各所述第一实体生成中间输出文本,并向发送所述输入文本的终端设备发送所述中间输出文本;接收所述终端设备针对所述中间输出文本反馈的中间输入文本,并从所述中间输入文本中提取第三分词,所述第三分词为名词;将所述第三分词作为所述候选头实体,并跳转至根据所述候选头实体,从所述问答知识图谱中匹配得到和所述候选头实体对应的全部第一实体的步骤。4.根据权利要求3所述的方法,其特征在于,所述根据所述候选头实体,从所述问答知识图谱中匹配得到和所述候选头实体对应的全部第一实体,包括:分别确定所述候选头实体,和所述问答知识图谱中各实体之间的实体相似度;根据当前发送所述中间输出文本的总次数,确定相似度阈值,其中所述相似度阈值与发送所述中间输出文本的总次数正相关;将所述实体相似度大于相似度阈值的实体,作为所述候选头实体对应的第一实体。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述第一实体的数量大于所述数量阈值时,获取所述输入文本对应的用户信息,并从所述用户信息中获取所述候选头实体的关联信息;根据所述关联信息和所述候选头实体,构建所述目标三元组中的目标头实体。6.根据权利要求1所述的方法,其特征在于,所述通过所述目标头实体及所述目标连接关系对问答数据库进行查询,得到至少一个第一备选三元组,包括:基于所述目标头实体和所述目标...
【专利技术属性】
技术研发人员:邵若琦,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。