一种基于大数据的短视频用户点击预测方法技术

技术编号:39181917 阅读:10 留言:0更新日期:2023-10-27 08:29
本发明专利技术涉及人工智能领域,具体涉及一种基于大数据的短视频用户点击预测方法,包括获取用户的行为序列,对行为数据进行预处理,预处理包括降噪和缺失值补全;构建基于LSTM模型的特征提取模型,将预处理后的数据输入该模型提取用户行为表示;构建基于MLP网络架构的非线性交互模型,利用非线性交互模型基于用户行为表示得到用户特征表示;将用户特征表示输入逻辑回归预测模型,得到用户点击预测结果;本发明专利技术增强模型对用户点击行为的预测能力,能够更好地捕捉用户行为序列中的特征关联和非线性模式。模式。模式。

【技术实现步骤摘要】
一种基于大数据的短视频用户点击预测方法


[0001]本专利技术涉及人工智能领域,具体涉及一种基于大数据的短视频用户点击预测方法。

技术介绍

[0002]在信息化时代下,越来越多的人可以随时随地使用手机观看视频内容。这为短视频提供了广阔的用户基础和便捷的观看方式,使得用户可以在碎片化的时间里快速浏览、分享和创作短视频。短视频通常时长较短,一般在几十秒到几分钟之间,较为符合现代人碎片化的时间观念和消费习惯。而对短视频用户的点击行为进行预测,不但可以通过预测用户的点击行为,可以更准确地了解用户的偏好和兴趣,从而提供更相关和吸引人的视频推荐,提升用户体验,还能帮助平台优化内容生产策略,创作更受用户欢迎的视频,提高内容的质量和吸引力。同时,预测用户的点击行为可以帮助广告主和平台更好地了解用户的兴趣和行为习惯,以便更精准地投放广告,实现平台盈利的“短平快”。
[0003]现有的点击预测模型在处理用户行为序列时往往采用线性模型或简单的特征交互方式,无法充分捕捉用户行为的复杂关联和动态演化且对于大面积空值的处理上造成了大量的数据浪费。为此,本专利技术提出了一种基于大数据的短视频用户点击预测方法,通过引入一种基于经典非线性的模型和特征交互方法,能够更准确地预测用户的点击行为,并且使用了一种基于属性关联和公式预测的处理空值的方法。

技术实现思路

[0004]为解决以上现有技术存在的问题,本专利技术提出一种基于大数据的短视频用户点击预测方法,具体步骤包括:
[0005]获取用户的行为序列,对行为数据进行预处理,预处理包括降噪和缺失值补全;
[0006]构建基于LSTM模型的特征提取模型,将预处理后的数据输入该模型提取用户行为表示;
[0007]构建基于MLP网络架构的非线性交互模型,利用非线性交互模型基于用户行为表示得到用户特征表示;
[0008]将用户特征表示输入逻辑回归预测模型,得到用户点击预测结果。
[0009]进一步的,对用户的行为序列进行降噪的过程包括:
[0010]设置一个滑动窗口,计算在一个窗口内用户的行为序列的平均值和标准差;
[0011]根据当前行为的属性值及其在对应窗口内行为序列的平均值和标准差计算该行为对应的噪声得分;
[0012]设置噪声阈值,若当前行为的噪声得分小于设置的噪声阈值,则保留;否则将改行为视为噪声并去除该行为值。
[0013]进一步的,对用户的行为序列进行缺失值补全的过程包括:
[0014][0015]其中i≠k;
[0016]其中,F(x)为对数据x
k
的缺失值补充公式;n为用户行为序列中的元素个数;w
i
表示降噪后用户的行为序列中第i个属性的权重;log(
·
)表示自然对数函数;tanh(
·
)表示双曲正切函数;sin(
·
)表示正弦函数;cos(
·
)表示余弦函数;|
·
|表示取绝对值。
[0017]进一步的,构建基于LSTM模型的特征提取模型的过程包括:
[0018]将用户行为的样本数量、时间步数以及特征维度拼接在一起作为LSTM模型的输入;
[0019]利用当前时间步的隐藏状态作为查询值、当前时间步之前的所有时间步的隐藏向量作为键值计算每个样本在每个时间步的注意力权重;
[0020]利用注意力权重对记忆细胞状态进行加权。
[0021]进一步的,利用注意力权重对记忆细胞状态进行加权的过程包括:
[0022][0023]其中,C
t

为t时刻利用注意力权重更新后的记忆细胞状态;N为样本的中数量;a
t,i
为在时间步t时第i个样本的注意力权重;C
t,i
为在时间步t与第i个样本相关的记忆细胞状态。
[0024]进一步的,基于MLP网络架构的非线性交互模型对输入数据的处理过程包括:
[0025]将用户行为表示作为用户特征序列输入非线性交互模型;
[0026]利用自注意力机制计算对用户特征序列进行处理,得到特征表示H;
[0027]将特征表示作为非线性交互模型的输入,非线性交互模型中包括多个隐藏层对特征表示进行非线性变换,非线性交互模型的输出层输出最终的特征表示。
[0028]进一步的,非线性交互模型中第l层的隐藏状态表示为:
[0029][0030]其中,H
(l)
表示线性交互模型中第l层的隐藏状态;为非线性交互模型中第l层的隐藏层的权重矩阵;为非线性交互模型中第l层的隐藏层的偏置矩阵;N为样本的总数量。
[0031]进一步的,非线性交互模型的输出表示为:
[0032][0033]其中,Y为非线性交互模型的输出;softmax(
·
)为归一化函数;)为归一化函数;分别为输出层的权重矩阵;b
(L)
、分别为输出层的偏置向量;H
(L

1)
为线性交互模型中输出层的前一层隐藏状态。
[0034]进一步的,对逻辑回归模型进行训练时,逻辑回归模型的损失函数表示:
[0035][0036]其中,表示逻辑回归模型的损失函数;N为样本数量;y
i
表示第i个样本的真实标签值,表示第i个样本的预测标签值。
[0037]与现有技术相比,本专利技术具有以下有益效果:
[0038]1、本专利技术采用基于LSTM网络架构的改进模型架构能够实现对用户行为序列的非线性建模和表示学习。通过将用户的历史行为序列输入基于LSTM网络架构的改进模型的网络,网络可以学习并记忆序列中的模式和特征,从而对未来的点击行为进行预测。相比于传统的线性建模方法,基于LSTM网络架构的改进模型引入了注意力机制,虽然LSTM本身已经设计用于解决长期依赖问题,但在处理非常长的序列时,仍然可能存在信息传递的困难。注意力机制的引入在一定程度上使模型在处理序列数据层面的感受野更加广阔,通过对不同时间步之间的关联进行加权处理,能够更好地捕捉用户行为序列中的非线性模式和动态变化,提高预测准确性。
[0039]2、本专利技术采用基于MLP网络架构的改进模型能够实现对基于LSTM网络架构的改进模型的输出向量向量的非线性特征交互。在本专利技术中将基于LSTM网络架构的改进模型输出向量进行self

attention处理后作为输入,通过多个隐藏层和非线性激活函数的数学变换,实现了特征之间的非线性交互。这样的特征交互能够进一步提取和组合特征信息,增强模型对用户点击行为的预测能力,能够更好地捕捉用户行为序列中的特征关联和非线性模式。
[0040]3、本专利技术提出了修改的损失函数,对预测结果进行了一系列的数学变换,以增强损失函数的表达能力。通过引入更多的非线性特性和数学运算,这样的损失函数能够更好地捕捉用户点击行为的分布特征和复杂关系,提升预测性能。
附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的短视频用户点击预测方法,其特征在于,具体包括以下步骤:获取用户的行为序列,对行为数据进行预处理,预处理包括降噪和缺失值补全;构建基于LSTM模型的特征提取模型,将预处理后的数据输入该模型提取用户行为表示;构建基于MLP网络架构的非线性交互模型,利用非线性交互模型基于用户行为表示得到用户特征表示;将用户特征表示输入逻辑回归预测模型,得到用户点击预测结果。2.根据权利要求1所述的一种基于大数据的短视频用户点击预测方法,其特征在于,对用户的行为序列进行降噪的过程包括:设置一个滑动窗口,计算在一个窗口内用户的行为序列的平均值和标准差;根据当前行为的属性值及其在对应窗口内行为序列的平均值和标准差计算该行为对应的噪声得分;设置噪声阈值,若当前行为的噪声得分小于设置的噪声阈值,则保留;否则将改行为视为噪声并去除该行为值。3.根据权利要求1或2所述的一种基于大数据的短视频用户点击预测方法,其特征在于,对用户的行为序列进行缺失值补全的过程包括:其中i≠k;其中,F(x)为对数据x
k
的缺失值补充公式;n为用户行为序列中的元素个数;w
i
表示降噪后用户的行为序列中第i个属性的权重;log(
·
)表示自然对数函数;tanh(
·
)表示双曲正切函数;sin(
·
)表示正弦函数;cos(
·
)表示余弦函数;|
·
|表示取绝对值。4.根据权利要求1所述的一种基于大数据的短视频用户点击预测方法,其特征在于,构建基于LSTM模型的特征提取模型的过程包括:将用户行为的样本数量、时间步数以及特征维度拼接在一起作为LSTM模型的输入;利用当前时间步的隐藏状态作为查询值、当前时间步之前的所有时间步的隐藏向量作为键值计算每个样本在每个时间步的注意力权重;利用注意力权重对记忆细胞状态进行加权。5.根据权利要求4所述的一种基于大数据的短视频用户点击预测方法,其特征在于,利用...

【专利技术属性】
技术研发人员:毛博王进钟时
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1