一种基于大数据的短视频用户点击预测方法技术

技术编号：39181917 阅读：10 留言：0更新日期：2023-10-27 08:29

本发明专利技术涉及人工智能领域，具体涉及一种基于大数据的短视频用户点击预测方法，包括获取用户的行为序列，对行为数据进行预处理，预处理包括降噪和缺失值补全；构建基于LSTM模型的特征提取模型，将预处理后的数据输入该模型提取用户行为表示；构建基于MLP网络架构的非线性交互模型，利用非线性交互模型基于用户行为表示得到用户特征表示；将用户特征表示输入逻辑回归预测模型，得到用户点击预测结果；本发明专利技术增强模型对用户点击行为的预测能力，能够更好地捕捉用户行为序列中的特征关联和非线性模式。模式。模式。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大数据的短视频用户点击预测方法

[0001]本专利技术涉及人工智能领域，具体涉及一种基于大数据的短视频用户点击预测方法。

技术介绍

[0002]在信息化时代下，越来越多的人可以随时随地使用手机观看视频内容。这为短视频提供了广阔的用户基础和便捷的观看方式，使得用户可以在碎片化的时间里快速浏览、分享和创作短视频。短视频通常时长较短，一般在几十秒到几分钟之间，较为符合现代人碎片化的时间观念和消费习惯。而对短视频用户的点击行为进行预测，不但可以通过预测用户的点击行为，可以更准确地了解用户的偏好和兴趣，从而提供更相关和吸引人的视频推荐，提升用户体验，还能帮助平台优化内容生产策略，创作更受用户欢迎的视频，提高内容的质量和吸引力。同时，预测用户的点击行为可以帮助广告主和平台更好地了解用户的兴趣和行为习惯，以便更精准地投放广告，实现平台盈利的“短平快”。
[0003]现有的点击预测模型在处理用户行为序列时往往采用线性模型或简单的特征交互方式，无法充分捕捉用户行为的复杂关联和动态演化且对于大面积空值的处理上造成了大量的数据浪费。为此，本专利技术提出了一种基于大数据的短视频用户点击预测方法，通过引入一种基于经典非线性的模型和特征交互方法，能够更准确地预测用户的点击行为，并且使用了一种基于属性关联和公式预测的处理空值的方法。

技术实现思路

[0004]为解决以上现有技术存在的问题，本专利技术提出一种基于大数据的短视频用户点击预测方法，具体步骤包括：
[0005]获取用户的行为序列，对行为数据进行预处...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的短视频用户点击预测方法，其特征在于，具体包括以下步骤：获取用户的行为序列，对行为数据进行预处理，预处理包括降噪和缺失值补全；构建基于LSTM模型的特征提取模型，将预处理后的数据输入该模型提取用户行为表示；构建基于MLP网络架构的非线性交互模型，利用非线性交互模型基于用户行为表示得到用户特征表示；将用户特征表示输入逻辑回归预测模型，得到用户点击预测结果。2.根据权利要求1所述的一种基于大数据的短视频用户点击预测方法，其特征在于，对用户的行为序列进行降噪的过程包括：设置一个滑动窗口，计算在一个窗口内用户的行为序列的平均值和标准差；根据当前行为的属性值及其在对应窗口内行为序列的平均值和标准差计算该行为对应的噪声得分；设置噪声阈值，若当前行为的噪声得分小于设置的噪声阈值，则保留；否则将改行为视为噪声并去除该行为值。3.根据权利要求1或2所述的一种基于大数据的短视频用户点击预测方法，其特征在于，对用户的行为序列进行缺失值补全的过程包括：其中i≠k；其中，F(x)为对数据x
k
的缺失值补充公式；n为用户行为序列中的元素个数；w
i
表示降噪后用户的行为序列中第i个属性的权重；log(
·
)表示自然对数函数；tanh(
·
)表示双曲正切函数；sin(
·
)表示正弦函数；cos(
·
)表示余弦函数；|
·
|表示取绝对值。4.根据权利要求1所述的一种基于大数据的短视频用户点击预测方法，其特征在于，构建基于LSTM模型的特征提取模型的过程包括：将用户行为的样本数量、时间步数以及特征维度拼接在一起作为LSTM模型的输入；利用当前时间步的隐藏状态作为查询值、当前时间步之前的所有时间步的隐藏向量作为键值计算每个样本在每个时间步的注意力权重；利用注意力权重对记忆细胞状态进行加权。5.根据权利要求4所述的一种基于大数据的短视频用户点击预测方法，其特征在于，利用...

【专利技术属性】
技术研发人员：毛博，王进，钟时，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人