基于改进BERT模型的产品推荐方法、装置、设备及介质制造方法及图纸

技术编号:30409302 阅读:23 留言:0更新日期:2021-10-20 11:23
本发明专利技术涉及人工智能领域,提供一种基于改进BERT模型的产品推荐方法、装置、设备及介质,能够对初始数据进行预处理,以消除噪声,并使之满足模型训练对于数据的要求,基于目标损失函数,利用样本数据训练BERT模型,进而结合改进的BERT模型及分类模型实现对人生阶段的准确预测,并进一步辅助进行产品的推荐,提高了预测的覆盖面,解决了现有预测方案覆盖面窄的问题,同时,根据用户即将到来的下一人生阶段进行产品推荐,提前建立用户对产品的认知,甚至可以提前引导用户开始购买更高阶的产品,实现与产品的预宣导,以便挖掘更多潜在的客户,并维系与现有客户的关系。本发明专利技术还涉及区块链技术,训练得到的模型可以存储于区块链节点上。上。上。

【技术实现步骤摘要】
基于改进BERT模型的产品推荐方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于改进BERT模型的产品推荐方法、装置、设备及介质。

技术介绍

[0002]为了更好的服务于老客户及吸引新客户,通常需要为客户进行产品推荐。
[0003]现有技术中,大多是通过一些常用标签来进行人群分类,如年龄、性别、消费水平等,结合客户的兴趣,通过聚类或是相似推荐的方式,来为客户推荐最适合当前购买的产品。
[0004]但是,对于理财和保险等与普通商品不同的金融或保险产品,上述方式并不适用。由于商品趋向于消费习惯和爱好,而理财思维和保险需求是可以进行提前培养和引导的,因此,传统的仅基于兴趣等的产品推荐方式覆盖面不够全面。现有的推荐策略,无法提前培养对应的思维和想法,从而在客户下一个人生阶段时,无法及时对客户进行相关产品的推送,也就没有办法很好的维系客户,从而导致客户的流失。

技术实现思路

[0005]本专利技术实施例提供了一种基于改进BERT模型的产品推荐方法、装置、设备及介质,能够结合改进的BERT模型及分类模型实现对人生阶段的准确预测,并进一步辅助进行产品的推荐,提高了预测的覆盖面,解决了现有预测方案覆盖面窄的问题,同时,根据用户即将到来的下一人生阶段进行产品推荐,提前建立用户对产品的认知,甚至可以提前引导用户开始购买更高阶的产品,实现与产品的预宣导,以便挖掘更多潜在的客户,并维系与现有客户的关系。
[0006]第一方面,本专利技术实施例提供了一种基于改进BERT模型的产品推荐方法,其包括:响应于产品推荐指令,根据所述产品推荐指令获取初始数据;对所述初始数据进行预处理,得到样本数据;构建目标损失函数;基于所述目标损失函数,利用所述样本数据训练BERT模型,得到特征提取模型;将所述样本数据输入至所述特征提取模型,获取所述特征提取模型的输出构建特征集合,并根据上传的标签对所述特征集合中的每个特征进行标签化处理,得到标签特征集合;利用所述标签特征集合训练指定网络,得到人生阶段预测模型;当接收到与目标用户对应的待处理数据时,将所述待处理数据输入至所述特征提取模型,得到目标特征,并将所述目标特征输入至所述人生阶段预测模型,得到预测的所述目标用户的目标人生阶段;调用预先配置的对照表,并利用所述目标人生阶段在所述对照表中进行搜索,将搜索到的与所述目标人生阶段匹配的阶段确定为下一人生阶段,及将与所述下一人生阶段
对应的产品确定为目标产品;向所述目标用户推送与所述目标产品对应的信息。
[0007]根据本专利技术优选实施例,所述根据所述产品推荐指令获取初始数据包括:解析所述产品推荐指令,得到所述产品推荐指令所携带的信息;获取与用户身份信息对应的预设标签;根据所述预设标签构建正则表达式;利用所述正则表达式遍历所述产品推荐指令所携带的信息,并将遍历到的信息确定为用户标识;连接至指定平台,采用网络爬虫技术爬取与所述用户标识对应的数据;利用爬取到的数据构建所述初始数据。
[0008]根据本专利技术优选实施例,所述对所述初始数据进行预处理,得到样本数据包括:调用预先配置的无效表格;从所述初始数据中删除与所述无效表格中存储的数据相同的数据,得到第一样本;从所述第一样本中获取发表内容及与所述发表内容对应的评论;将每条发表内容与对应的每条评论确定为一个数据组,得到多个数据组;每隔指定行,将所述多个数据组写入文本文件中,得到第二样本;随机屏蔽所述第二样本中的词,并将屏蔽掉的词替换为指定标志,得到所述样本数据。
[0009]根据本专利技术优选实施例,所述构建目标损失函数包括:采用下述公式构建屏蔽词预测损失:其中,表示所述屏蔽词预测损失,M表示所述样本数据的样本总量,表示所述样本数据中第n个样本正确预测为对应的词的概率,n为正整数;采用下述公式构建上下关系预测损失:其中,表示所述上下关系预测损失,表示所述样本数据中第n个样本的上下关系标签;计算所述屏蔽词预测损失与所述上下关系预测损失的和,得到所述目标损失函数,所述目标损失函数的公式如下:
其中,表示所述目标损失函数。
[0010]根据本专利技术优选实施例,所述基于所述目标损失函数,利用所述样本数据训练BERT模型,得到特征提取模型包括:随机打乱所述样本数据的句子关系;对所述BERT模型进行屏蔽词预测训练,及利用打乱后得到的句子对所述BERT模型进行上下关系预测训练;当所述目标损失函数达到收敛时,停止训练,得到所述特征提取模型。
[0011]根据本专利技术优选实施例,所述获取所述特征提取模型的输出构建特征集合包括:获取每个样本数据对应的用户的基本信息,并对所述基本信息进行编码;拼接每个样本数据对应的输出及对应的编码,得到每个样本数据对应的向量;根据得到的向量建立数据集,得到所述特征集合。
[0012]根据本专利技术优选实施例,在将所述待处理数据输入至所述特征提取模型时,所述方法还包括:对于所述待处理数据的每个词,将每个词转换为嵌入向量,得到每个词的第一嵌入表示;获取每个词所属的段,并根据每个词所属的段生成每个词的第二嵌入表示;获取每个词的位置信息,并根据每个词的位置信息生成每个词的第三嵌入表示;拼接每个词的第一嵌入表示、第二嵌入表示及第三嵌入表示,得到每个词的嵌入向量;利用每个词的嵌入向量组成所述待处理数据的向量表示。
[0013]第二方面,本专利技术实施例提供了一种基于改进BERT模型的产品推荐装置,其包括:获取单元,用于响应于产品推荐指令,根据所述产品推荐指令获取初始数据;预处理单元,用于对所述初始数据进行预处理,得到样本数据;构建单元,用于构建目标损失函数;训练单元,用于基于所述目标损失函数,利用所述样本数据训练BERT模型,得到特征提取模型;所述构建单元,还用于将所述样本数据输入至所述特征提取模型,获取所述特征提取模型的输出构建特征集合,并根据上传的标签对所述特征集合中的每个特征进行标签化处理,得到标签特征集合;所述训练单元,还用于利用所述标签特征集合训练指定网络,得到人生阶段预测
模型;输入单元,用于当接收到与目标用户对应的待处理数据时,将所述待处理数据输入至所述特征提取模型,得到目标特征,并将所述目标特征输入至所述人生阶段预测模型,得到预测的所述目标用户的目标人生阶段;确定单元,用于调用预先配置的对照表,并利用所述目标人生阶段在所述对照表中进行搜索,将搜索到的与所述目标人生阶段匹配的阶段确定为下一人生阶段,及将与所述下一人生阶段对应的产品确定为目标产品;推送单元,用于向所述目标用户推送与所述目标产品对应的信息。
[0014]第三方面,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于改进BERT模型的产品推荐方法。
[0015]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于改进BERT模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进BERT模型的产品推荐方法,其特征在于,包括:响应于产品推荐指令,根据所述产品推荐指令获取初始数据;对所述初始数据进行预处理,得到样本数据;构建目标损失函数;基于所述目标损失函数,利用所述样本数据训练BERT模型,得到特征提取模型;将所述样本数据输入至所述特征提取模型,获取所述特征提取模型的输出构建特征集合,并根据上传的标签对所述特征集合中的每个特征进行标签化处理,得到标签特征集合;利用所述标签特征集合训练指定网络,得到人生阶段预测模型;当接收到与目标用户对应的待处理数据时,将所述待处理数据输入至所述特征提取模型,得到目标特征,并将所述目标特征输入至所述人生阶段预测模型,得到预测的所述目标用户的目标人生阶段;调用预先配置的对照表,并利用所述目标人生阶段在所述对照表中进行搜索,将搜索到的与所述目标人生阶段匹配的阶段确定为下一人生阶段,及将与所述下一人生阶段对应的产品确定为目标产品;向所述目标用户推送与所述目标产品对应的信息。2.根据权利要求1所述的基于改进BERT模型的产品推荐方法,其特征在于,所述根据所述产品推荐指令获取初始数据包括:解析所述产品推荐指令,得到所述产品推荐指令所携带的信息;获取与用户身份信息对应的预设标签;根据所述预设标签构建正则表达式;利用所述正则表达式遍历所述产品推荐指令所携带的信息,并将遍历到的信息确定为用户标识;连接至指定平台,采用网络爬虫技术爬取与所述用户标识对应的数据;利用爬取到的数据构建所述初始数据。3.根据权利要求1所述的基于改进BERT模型的产品推荐方法,其特征在于,所述对所述初始数据进行预处理,得到样本数据包括:调用预先配置的无效表格;从所述初始数据中删除与所述无效表格中存储的数据相同的数据,得到第一样本;从所述第一样本中获取发表内容及与所述发表内容对应的评论;将每条发表内容与对应的每条评论确定为一个数据组,得到多个数据组;每隔指定行,将所述多个数据组写入文本文件中,得到第二样本;随机屏蔽所述第二样本中的词,并将屏蔽掉的词替换为指定标志,得到所述样本数据。4.根据权利要求1所述的基于改进BERT模型的产品推荐方法,其特征在于,所述构建目标损失函数包括:采用下述公式构建屏蔽词预测损失:其中,表示所述屏蔽词预测损失,M表示所述样本数据的样本总量,表示所述
样本数据中第n个样本正确预测为对应的词的概率,n为正整数;采用下述公式构建上下关系预测损失:其中,表示所述上下关系预测损失,表示所述样本数据中第n个样本的上下关系标签;计算所述屏蔽词预测损失与所述上下关系预测损失的和,得到所述目标损失函数,所述目标损失函数的公式如下:其中,表示所述目标损失函数。5.根据权利要求1所述的基于改进BERT模型的产品推荐方法,其特征在于,所述基于所述目标损失函数,利用所述样本数据训练BERT模型,得到特征提取...

【专利技术属性】
技术研发人员:张泽鲲
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1