确定多媒体资源的标题的方法及装置制造方法及图纸

技术编号:14685945 阅读:67 留言:0更新日期:2017-02-22 20:41
本发明专利技术涉及确定多媒体资源的标题的方法及装置。该方法包括:采集目标用户的用户行为数据,并根据用户行为数据生成第一多媒体资源列表;对第一多媒体资源列表中各个多媒体资源的标题进行解析,得到目标用户对应的第一成分列表;对待推荐多媒体资源的原标题进行解析,得到原标题对应的第二成分列表;将第二成分列表中的各个成分与第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;根据更新后的第二成分列表确定待推荐多媒体资源的新标题。根据本发明专利技术的确定多媒体资源的标题的方法及装置能够针对目标用户确定个性化的标题,能够更好地吸引用户,从而能够提高所推荐的多媒体资源被点击的概率。

【技术实现步骤摘要】

本专利技术涉及信息
,尤其涉及一种确定多媒体资源的标题的方法及装置
技术介绍
在互联网时代,尤其是移动互联网时代,如何为用户提供及时且有价值的信息是众多互联网公司研究的热点。例如,用户在浏览视频网站时,视频标题是吸引用户观看视频的一个重要因素,因此,视频网站往往有大量的运营人员对视频标题进行编辑。视频上传者也可以对视频标题进行编辑,以达到吸引用户观看的目的。目前,视频等多媒体资源的标题的编辑依赖于网站的运营人员和上传者,耗费大量的人力资源,且网站的运营人员和上传者所编辑的多媒体资源的标题是针对大众喜好的,不能满足单个用户的个性化需求。
技术实现思路
技术问题有鉴于此,本专利技术要解决的技术问题是,现有的确定多媒体资源的标题的方式耗费大量的人力资源,且不能满足用户的个性化需求。解决方案为了解决上述技术问题,根据本专利技术的一实施例,提供了一种确定多媒体资源的标题的方法,包括:采集目标用户的用户行为数据,并根据所述用户行为数据生成第一多媒体资源列表;对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表;对待推荐多媒体资源的原标题进行解析,得到所述原标题对应的第二成分列表;将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。对于上述方法,在一种可能的实现方式中,将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,包括:计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度;在所述第二成分列表中的一成分与所述第一成分列表中的一成分的相似度大于第一预设值的情况下,将所述第二成分列表中的一成分替换为所述第一成分列表中的一成分;根据所有替换的成分得到更新后的第二成分列表。对于上述方法,在一种可能的实现方式中,计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度,包括:确定所述第二成分列表中的各个成分对应的向量;分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度。对于上述方法,在一种可能的实现方式中,分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度,包括:采用式1计算所述第二成分列表中的第l个成分对应的向量与所述第一成分列表中的第m个成分对应的向量的相似度对于上述方法,在一种可能的实现方式中,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题,包括:计算所述更新后的第二成分列表的得分;在所述更新后的第二成分列表的得分大于第二预设值的情况下,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。对于上述方法,在一种可能的实现方式中,计算所述更新后的第二成分列表的得分,包括:根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分。对于上述方法,在一种可能的实现方式中,根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分,包括:采用式2计算所述更新后的第二成分列表的得分s;其中,n表示所述更新后的第二成分列表中成分的个数,wj表示所述更新后的第二成分列表中的第j个成分,wj-i表示所述更新后的第二成分列表中的第j-i个成分,p(wjwj-i)表示所述第j个成分与所述第j-i个成分在所述指定样本集合中共同出现的概率,p(wj-i)表示所述第j-i个成分在所述指定样本集合中出现的概率。对于上述方法,在一种可能的实现方式中,在计算所述更新后的第二成分列表的得分之后,所述方法还包括:在所述更新后的第二成分列表的得分小于或等于所述第二预设值的情况下,保留所述待推荐多媒体资源的原标题。对于上述方法,在一种可能的实现方式中,对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表,包括:对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到与所述目标用户相关的成分;将与所述目标用户相关的成分中出现次数大于第三预设值的成分作为所述目标用户对应的成分;根据所述目标用户对应的成分生成所述目标用户对应的第一成分列表。对于上述方法,在一种可能的实现方式中,采集目标用户的用户行为数据,根据所述用户行为数据生成第一多媒体资源列表,包括:采集指定时间段内的所述目标用户的所有用户行为数据;从所采集的用户行为数据中筛选出有效的用户行为数据;按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序,得到所述第一多媒体资源列表。为了解决上述技术问题,根据本专利技术的另一实施例,提供了一种确定多媒体资源的标题的装置,包括:采集模块,用于采集目标用户的用户行为数据,并根据所述用户行为数据生成第一多媒体资源列表;第一解析模块,用于对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表;第二解析模块,用于对待推荐多媒体资源的原标题进行解析,得到所述原标题对应的第二成分列表;比较模块,用于将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;确定模块,用于根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。对于上述装置,在一种可能的实现方式中,所述比较模块包括:相似度计算子模块,用于计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度;替换子模块,用于在所述第二成分列表中的一成分与所述第一成分列表中的一成分的相似度大于第一预设值的情况下,将所述第二成分列表中的一成分替换为所述第一成分列表中的一成分;更新子模块,用于根据所有替换的成分得到更新后的第二成分列表。对于上述装置,在一种可能的实现方式中,所述相似度计算子模块包括:向量确定单元,用于确定所述第二成分列表中的各个成分对应的向量;相似度计算单元,用于分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度。对于上述装置,在一种可能的实现方式中,所述相似度计算单元用于:采用式1计算所述第二成分列表中的第l个成分对应的向量与所述第一成分列表中的第m个成分对应的向量的相似度对于上述装置,在一种可能的实现方式中,所述确定模块包括:得分计算子模块,用于计算所述更新后的第二成分列表的得分;确定子模块,用于在所述更新后的第二成分列表的得分大于第二预设值的情况下,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。对于上述装置,在一种可能的实现方式中,所述得分计算子模块用于:根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分。对于上述装置,在一种可能的实现方式中,所述得分计算子模块用于:采用式2计算所述更新后的第二成分列表的得分s;其中,n表示所述更新后的第二成分列表中成分的个数,wj表示所述更新后的第二成分列表中的第j个成分,wj-i表示所述更新后的第二成分列表中的第j-i个成分,p(wjwj-i)表示所述第j个成分与所述第j-i个成分在所述指定样本集合中共同出本文档来自技高网...
确定多媒体资源的标题的方法及装置

【技术保护点】
一种确定多媒体资源的标题的方法,其特征在于,包括:采集目标用户的用户行为数据,并根据所述用户行为数据生成第一多媒体资源列表;对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表;对待推荐多媒体资源的原标题进行解析,得到所述原标题对应的第二成分列表;将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。

【技术特征摘要】
1.一种确定多媒体资源的标题的方法,其特征在于,包括:采集目标用户的用户行为数据,并根据所述用户行为数据生成第一多媒体资源列表;对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表;对待推荐多媒体资源的原标题进行解析,得到所述原标题对应的第二成分列表;将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。2.根据权利要求1所述的方法,其特征在于,将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,包括:计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度;在所述第二成分列表中的一成分与所述第一成分列表中的一成分的相似度大于第一预设值的情况下,将所述第二成分列表中的一成分替换为所述第一成分列表中的一成分;根据所有替换的成分得到更新后的第二成分列表。3.根据权利要求2所述的方法,其特征在于,计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度,包括:确定所述第二成分列表中的各个成分对应的向量;分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度。4.根据权利要求3所述的方法,其特征在于,分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度,包括:采用式1计算所述第二成分列表中的第l个成分对应的向量与所述第一成分列表中的第m个成分对应的向量的相似度5.根据权利要求1所述的方法,其特征在于,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题,包括:计算所述更新后的第二成分列表的得分;在所述更新后的第二成分列表的得分大于第二预设值的情况下,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。6.根据权利要求5所述的方法,其特征在于,计算所述更新后的第二成分列表的得分,包括:根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分。7.根据权利要求6所述的方法,其特征在于,根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分,包括:采用式2计算所述更新后的第二成分列表的得分s;其中,n表示所述更新后的第二成分列表中成分的个数,wj表示所述更新后的第二成分列表中的第j个成分,wj-i表示所述更新后的第二成分列表中的第j-i个成分,p(wjwj-i)表示所述第j个成分与所述第j-i个成分在所述指定样本集合中共同出现的概率,p(wj-i)表示所述第j-i个成分在所述指定样本集合中出现的概率。8.根据权利要求5至7任意一项所述的方法,其特征在于,在计算所述更新后的第二成分列表的得分之后,所述方法还包括:在所述更新后的第二成分列表的得分小于或等于所述第二预设值的情况下,保留所述待推荐多媒体资源的原标题。9.根据权利要求1所述的方法,其特征在于,对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表,包括:对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到与所述目标用户相关的成分;将与所述目标用户相关的成分中出现次数大于第三预设值的成分作为所述目标用户对应的成分;根据所述目标用户对应的成分生成所述目标用户对应的第一成分列表。10.根据权利要求1所述的方法,其特征在于,采集目标用户的用户行为数据,根据所述用户行为数据生成第一多媒体资源列表,包括:采集指定时间段内的所述目标用户的所有用户行为数据;从所采集的用户行为数据中筛选出有效的用户行为数据;按照所述有...

【专利技术属性】
技术研发人员:刘荣赵磊单明辉王建宇顾思斌潘柏宇王冀
申请(专利权)人:合一网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1