句式资源库的热更新方法、句式推荐方法及相关装置制造方法及图纸

技术编号:33202733 阅读:23 留言:0更新日期:2022-04-24 00:42
本申请公开了一种句式资源库的热更新方法、句式推荐方法及相关装置,所述热更新方法包括:获得前端应用系统线上累积的多个新句子;针对每个所述新句子,获得所述新句子和当前所述句式资源库中每个已有句子之间的第一相似度;响应于与当前所述新句子相关的至少一个所述第一相似度处于阈值范围内,则获得所述新句子所属的语义标签,并将所述新句子放入第一数据库;从所述第一数据库中抽取出至少一个所述新句子,并将所述新句子进行向量化表示后存储至所述句式资源库中对应的所述语义标签下。通过上述方式,本申请能够及时更新句式资源库,以使得句式推荐结果更好。以使得句式推荐结果更好。以使得句式推荐结果更好。

【技术实现步骤摘要】
句式资源库的热更新方法、句式推荐方法及相关装置


[0001]本申请属于自然语言处理
,具体涉及一种句式资源库的热更新方法、句式推荐方法及相关装置。

技术介绍

[0002]随着互联网和大数据等技术的发展,各行各业都在无时无刻产生着海量的数据,如何从这些海量数据中快速挖掘出相似句子在业务上显得越来越重要,其对人力成本的降低以及快速完成效果优化都有重大意义。以金融场景为例,银行客服每天生成上千上万个通话录音数据,在这些通话录音数据中埋藏着很多意思相似但表达方式不同的句子。当给定一个语义标签和对应的已有句子,在海量数据中检索出多个类似的拓展句子对于快速响应业务需求、缩短业务优化周期发挥着越来越大的作用。因此把句式推荐做到准确、实时就显得格外重要。
[0003]目前,句式资源库中的句子较为固定,无法及时更新最新累积的句子到句式资源库中,导致推荐的句子比较陈旧、客户体验差。

技术实现思路

[0004]本申请提供一种句式资源库的热更新方法、句式推荐方法及相关装置,能够及时更新句式资源库,以使得句式推荐结果更好。
[0005]为解决上述技术问题,本申请采用的一个技术方案是:提供一种句式资源库的热更新方法,包括:获得前端应用系统线上累积的多个新句子;针对每个所述新句子,获得所述新句子和当前所述句式资源库中每个已有句子之间的第一相似度;响应于与当前所述新句子相关的至少一个所述第一相似度处于阈值范围内,则获得所述新句子所属的语义标签,并将所述新句子放入第一数据库;从所述第一数据库中抽取出至少一个所述新句子,并将所述新句子进行向量化表示后存储至所述句式资源库中对应的所述语义标签下。
[0006]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种句式推荐方法,包括:获得输入句子;获得所述输入句子与句式资源库中每个已有句子之间的第三相似度;其中,所述句式资源库采用上述任一实施例中所述的热更新方法进行更新;输出第三相似度较高的多个所述已有句子。
[0007]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种句式资源库的热更新装置,包括:获得模块,用于获得前端应用系统线上累积的多个新句子;过滤模块,与所述获得模块连接,用于针对每个所述新句子,获得所述新句子和当前所述句式资源库中每个已有句子之间的第一相似度;响应于与当前所述新句子相关的至少一个所述第一相似度处于阈值范围内,则获得所述新句子所属的语义标签,并将所述新句子放入第一数据库;抽取模块,与所述过滤模块连接,用于从所述第一数据库中抽取出至少一个所述新句子,并将所述新句子进行向量化表示后存储至所述句式资源库中对应的所述语义标签下。
[0008]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,包括
相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现上述任一实施例中所述的句式资源库的热更新方法,或上述任一实施例中所述的句式推荐方法。
[0009]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种存储装置,存储有能够被处理器运行的程序指令,所述处理器用于执行所述程序指令以实现上述任一实施例中所述的句式资源库的热更新方法,或上述任一实施例中所述的句式推荐方法。
[0010]区别于现有技术情况,本申请的有益效果是:本申请所提供的句式资源库的热更新方法中对于前端应用系统线上累积的多个新句子,会先对该多个新句子进行筛选,将符合阈值范围的新句子放入到第一数据库中;后续可从第一数据库中捞取出至少一个新句子回流至句式资源库中,以实现句式资源库的热更新。该热更新方式较为简单,且可以使得句式资源库中的句子做到及时更新,以提高句式推荐效果。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
[0012]图1为本申请句式资源库的热更新方法一实施方式的流程示意图;
[0013]图2a为图1中步骤S102中获得第一相似度一实施方式的流程示意图;
[0014]图2b为图1中步骤S102中获得第一相似度对应的模型结构示意图;
[0015]图3为本申请句式推荐方法一实施方式的流程示意图;
[0016]图4为本申请句式资源库的热更新装置一实施方式的结构示意图;
[0017]图5为本申请电子设备一实施方式的结构示意图;
[0018]图6为本申请存储装置一实施方式的结构示意图。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0020]请参阅图1,图1为本申请句式资源库的热更新方法一实施方式的流程示意图,该热更新方法包括:
[0021]S101:获得前端应用系统线上累积的多个新句子。
[0022]具体地,上述句子也可称之为相似问,前端应用系统可以为金融客服系统等,前端应用系统会不断累积人工输入的新句子或机器根据语音识别自动生成的新句子。例如,该新句子可以为“稍后可以为您转接电话,自助语音进行电话银行登录,密码重置之后就可以进行开通短信提醒业务的好吗?”、或者“哎,你好,我想问一下那个我的银行卡没有,现在没有那个就是短信提醒,我想办个短信提醒,还需要去业务大厅吗?”、或者“好的,这边将您的电话转接到自助语音之后,根据系统的提示,输入您的卡号身份证号,取款密码输入完成之
后设置一个六位数的电话银行登录密码,按照提示就可以开通一个短信提醒了,可以吗?按照系统的提示可以吗?”。
[0023]当前端应用系统累积的新句子的个数超过阈值时,可以触发后续步骤S101

步骤S103。可选地,上述阈值可以为50、100等,具体可以人为设定。
[0024]S102:针对每个新句子,获得新句子和当前句式资源库中每个已有句子之间的第一相似度;响应于与当前新句子相关的至少一个第一相似度处于阈值范围内,则获得新句子所属的语义标签,并将新句子放入第一数据库。
[0025]具体地,在一个实施方式中,请参阅图2a和图2b,图2a为图1中步骤S102中获得第一相似度一实施方式的流程示意图,图2b为图1中步骤S102中获得第一相似度对应的模型结构示意图。上述步骤S102中获得新句子和当前句式资源库中每个已有句子之间的第一相似度的一实施方式的流程示意图,上述获得第一相似度的具体过程可以为:
[0026]S201:利用预训练模型10获得新句子的第一向量表示。
[0027]具体地,在本实施例中,预训练模型10可以为BERT模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种句式资源库的热更新方法,其特征在于,包括:获得前端应用系统线上累积的多个新句子;针对每个所述新句子,获得所述新句子和当前所述句式资源库中每个已有句子之间的第一相似度;响应于与当前所述新句子相关的至少一个所述第一相似度处于阈值范围内,则获得所述新句子所属的语义标签,并将所述新句子放入第一数据库;从所述第一数据库中抽取出至少一个所述新句子,并将所述新句子进行向量化表示后存储至所述句式资源库中对应的所述语义标签下。2.根据权利要求1所述的热更新方法,其特征在于,所述响应于与当前所述新句子相关的至少一个所述第一相似度处于阈值范围内,则获得所述新句子所属的语义标签,并将所述新句子放入第一数据库的步骤之前,包括:获得当前所述句式资源库中每个所述语义标签下的多个已有句子之间的第二相似度;获得所有所述语义标签下的所有所述第二相似度中的最大相似度值和最小相似度值;根据所述最大相似度值设置所述阈值范围的最大阈值、以及根据所述最小相似度值设置所述阈值范围的最小阈值。3.根据权利要求2所述的热更新方法,其特征在于,所述根据所述最大相似度值设置所述阈值范围的最大阈值、以及根据所述最小相似度值设置所述阈值范围的最小阈值的步骤,包括:将第一系数与所述最大相似度值的第一乘积作为所述最大阈值、以及将第二系数与所述最小相似度值的第二乘积作为所述最小阈值;其中,所述第一系数和所述第二系数大于0且小于或等于1。4.根据权利要求1所述的热更新方法,其特征在于,所述响应于与当前所述新句子相关的至少一个所述第一相似度处于阈值范围内,则获得所述新句子所属的语义标签的步骤,包括:针对当前所述句式资源库中每个所述语义标签,获得所述新句子与所述语义标签下的所述已有句子之间的所述第一相似度处于所述阈值范围内的第一个数,并获得所述第一个数与所述语义标签下所述已有句子的第二个数的比值;将最大比值对应的所述语义标签作为所述新句子的所述语义标签。5.根据权利要求1所述的热更新方法,其特征在于,所述第一数据库设置有最大存储数量;所述从所述第一数据库中抽取出至少一个所述新句子的步骤之前,包括:获得当前所述句式资源库中所述语义标签的总个数,并将所述最大存储数量与所述总个数的比值作为每个所述...

【专利技术属性】
技术研发人员:张星
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1