本发明专利技术涉及标签分析技术领域,提供一种影视标签权重确定方法、装置、电子设备及存储介质,该方法结合影视资源库的关系网络,并借助于演职人员的受欢迎程度以及辅助标签权重,可以为每个影视资源的各个标签的权重进行调整,使不同影视资源的相同标签赋予不同的权重,同一影视资源的不同标签的权重也会存在差异,如此可以形成一套能够更好的描述影视资源风格特点的标签体系,为后续用户画像构建提供更准确的偏好打分,提高用户画像的准确性,进一步提升用户的个性化影视推荐效果,提升用户体验。验。验。
【技术实现步骤摘要】
影视标签权重确定方法、装置、电子设备及存储介质
[0001]本专利技术涉及标签分析
,尤其涉及一种影视标签权重确定方法、装置、电子设备及存储介质。
技术介绍
[0002]随着互联网的飞速发展,各大影视平台每天都有大量的影视内容产出,个性化影视推荐是在大数据分析和人工智能技术的基础上,通过研究用户的兴趣偏好,进行个性化计算,从而给用户提供高质量的个性化内容,解决影片信息过量的问题,更好的满足用户的观影需求。
[0003]目前,在为用户进行个性化影视推荐时,既可以通过事先分析用户对各影视资源的观看、收藏等操作,掌握用户在一段时间内感兴趣的影视资源的标签,进而构建用户画像,此后可以根据用户画像向用户推荐与之兴趣点相关的影视资源。也可以在用户搜索某一影视资源时,同步向用户推荐与该影视资源具有一个或多个相同标签的其他影视资源。但是由于影视资源库中每个影视资源对应的各标签均具有相同权重,因此在用户对影视资源执行观看、收藏等操作后,无法区分用户的真实兴趣。例如,影片A的标签包括喜剧和科幻,当用户观看或收藏该影片A时,在用户画像中喜剧和科幻的权重发生了相同的变化。而实际上,影片A的喜剧成分占比更大,如此将对用户画像的准确性造成一定损失,进而降低个性化影视推荐效果,导致用户体验较差。当用户搜索该影片A时,由于其喜剧和科幻的权重相同,因此可能会随机同步向用户推荐喜剧和/或科幻的其他影视资源,随机性较强,也会影响个性化影视推荐效果,导致用户体验较差。
[0004]为此,现急需提供一种影视标签权重确定方法。
专利
技术实现思路
[0005]本专利技术提供一种影视标签权重确定方法、装置、电子设备及存储介质,用以解决现有技术中存在的缺陷。
[0006]本专利技术提供一种影视标签权重确定方法,包括:
[0007]获取影视资源库的结构化信息,所述结构化信息包括所述影视资源库中各影视资源的标签和演职人员;
[0008]基于所述结构化信息,以影视资源、标签以及演职人员为节点构建所述影视资源库的关系网络;
[0009]确定所述关系网络中每个影视资源的当前标签权重,并基于所述当前标签权重,确定所述演职人员对应的辅助标签权重;
[0010]基于所述演职人员的受欢迎程度以及所述辅助标签权重,对所述当前标签权重进行更新,得到新的标签权重,并将所述新的标签权重作为所述当前标签权重,对所述当前标签权重进行迭代更新,得到目标标签权重。
[0011]根据本专利技术提供的一种影视标签权重确定方法,所述对所述当前标签权重进行迭
代更新,得到目标标签权重,包括:
[0012]计算所述当前标签权重与所述新的标签权重的误差值,并计算所述各影视资源对应的误差值的求和结果;
[0013]若所述求和结果收敛,则迭代更新结束,得到所述目标标签权重。
[0014]根据本专利技术提供的一种影视标签权重确定方法,每个影视资源的初始标签权重基于如下步骤确定:
[0015]对于目标影视资源,计算所述目标影视资源的标签在所述影视资源库中覆盖的第一资源个数占比;
[0016]计算所述第一资源个数占比的倒数,并基于所述倒数,确定所述初始标签权重。
[0017]根据本专利技术提供的一种影视标签权重确定方法,所述基于所述结构化信息,以影视资源、标签以及演职人员为节点构建所述影视资源库的关系网络,包括:
[0018]确定所述影视资源库对应的标签库;
[0019]计算所述标签库中每个标签在所述影视资源库中覆盖的第二资源个数占比;
[0020]基于所述第二资源个数占比,对所述标签库中的标签进行筛选,得到确权标签;
[0021]基于所述结构化信息,以影视资源、确权标签以及演职人员为节点构建所述关系网络。
[0022]根据本专利技术提供的一种影视标签权重确定方法,所述基于所述演职人员的受欢迎程度以及所述辅助标签权重,对所述当前标签权重进行更新,得到新的标签权重,包括:
[0023]计算所述辅助标签权重与所述演职人员的作品数量的比值;
[0024]基于所述演职人员的受欢迎程度以及所述比值,对所述当前标签权重进行更新,得到所述新的标签权重。
[0025]根据本专利技术提供的一种影视标签权重确定方法,所述基于所述当前标签权重,确定所述演职人员对应的辅助标签权重,包括:
[0026]确定所述关系网络中与所述演职人员关联的参考影视资源;
[0027]对所述参考影视资源的当前标签权重进行汇总,得到所述辅助标签权重。
[0028]根据本专利技术提供的一种影视标签权重确定方法,所述将所述新的标签权重作为所述当前标签权重,对所述当前标签权重进行迭代更新,得到目标标签权重,之后包括:
[0029]基于任一影视资源的目标标签权重,构建对所述任一影视资源感兴趣的目标用户的画像;或者,
[0030]接收目标用户的输入,并响应于所述输入,基于所述目标标签权重,向所述目标用户进行影视资源推荐。
[0031]本专利技术还提供一种影视标签权重确定装置,包括:
[0032]信息获取模块,用于获取影视资源库的结构化信息,所述结构化信息包括所述影视资源库中各影视资源的标签和演职人员;
[0033]网络构建模块,用于基于所述结构化信息,以影视资源、标签以及演职人员为节点构建所述影视资源库的关系网络;
[0034]第一权重确定模块,用于确定所述关系网络中每个影视资源的当前标签权重,并基于所述当前标签权重,确定所述演职人员对应的辅助标签权重;
[0035]第二权重确定模块,用于基于所述演职人员的受欢迎程度以及所述辅助标签权
重,对所述当前标签权重进行更新,得到新的标签权重,并将所述新的标签权重作为所述当前标签权重,对所述当前标签权重进行迭代更新,得到目标标签权重。
[0036]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的影视标签权重确定方法。
[0037]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的影视标签权重确定方法。
[0038]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的影视标签权重确定方法。
[0039]本专利技术提供的影视标签权重确定方法、装置、电子设备及存储介质,该方法首先获取影视资源库的结构化信息,结构化信息包括影视资源库中各影视资源的标签和演职人员;然后基于结构化信息,以影视资源、标签以及演职人员为节点构建影视资源库的关系网络;此后确定关系网络中每个影视资源的当前标签权重,并基于当前标签权重,确定演职人员对应的辅助标签权重;最后基于演职人员的受欢迎程度以及辅助标签权重,对当前标签权重进行更新,得到新的标签权重,并将新的标签权重作为当前标签权重,对当前标签权重进行迭代更新,得到目标标签权重。该方法本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种影视标签权重确定方法,其特征在于,包括:获取影视资源库的结构化信息,所述结构化信息包括所述影视资源库中各影视资源的标签和演职人员;基于所述结构化信息,以影视资源、标签以及演职人员为节点构建所述影视资源库的关系网络;确定所述关系网络中每个影视资源的当前标签权重,并基于所述当前标签权重,确定所述演职人员对应的辅助标签权重;基于所述演职人员的受欢迎程度以及所述辅助标签权重,对所述当前标签权重进行更新,得到新的标签权重,并将所述新的标签权重作为所述当前标签权重,对所述当前标签权重进行迭代更新,得到目标标签权重。2.根据权利要求1所述的影视标签权重确定方法,其特征在于,所述对所述当前标签权重进行迭代更新,得到目标标签权重,包括:计算所述当前标签权重与所述新的标签权重的误差值,并计算所述各影视资源对应的误差值的求和结果;若所述求和结果收敛,则迭代更新结束,得到所述目标标签权重。3.根据权利要求1所述的影视标签权重确定方法,其特征在于,每个影视资源的初始标签权重基于如下步骤确定:对于目标影视资源,计算所述目标影视资源的标签在所述影视资源库中覆盖的第一资源个数占比;计算所述第一资源个数占比的倒数,并基于所述倒数,确定所述初始标签权重。4.根据权利要求1所述的影视标签权重确定方法,其特征在于,所述基于所述结构化信息,以影视资源、标签以及演职人员为节点构建所述影视资源库的关系网络,包括:确定所述影视资源库对应的标签库;计算所述标签库中每个标签在所述影视资源库中覆盖的第二资源个数占比;基于所述第二资源个数占比,对所述标签库中的标签进行筛选,得到确权标签;基于所述结构化信息,以影视资源、确权标签以及演职人员为节点构建所述关系网络。5.根据权利要求1所述的影视标签权重确定方法,其特征在于,所述基于所述演职人员的受欢迎程度以及所述辅助标签权重,对所述当前标签权重进行更新,得到新的标签权重,包括:计算所述辅助标签权重与所述演职人员的作品数量的比值;基于所述演职人员的受欢迎程度以及所述比值,对所述当前标签权...
【专利技术属性】
技术研发人员:张志勇,陶柘,蒋兵兵,龙明康,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。