【技术实现步骤摘要】
标签处理方法、装置、计算机设备、存储介质和程序产品
[0001]本申请涉及人工智能
,特别是涉及一种标签处理方法、装置、计算机设备、存储介质和程序产品。
技术介绍
[0002]随着人工智能技术的发展,以及互联网应用的推广使用,在实际应用过程中,由于存在海量数据以及干扰信息等,导致各应用平台,比如新闻平台、购物平台等,无法进行信息高效管理,也无法准确确定出不同使用对象所需的信息或者数据。
[0003]以新闻平台为例,由于平台的媒体数据的日益增长,以及缺乏对媒体数据的高效管理,增加了使用对象获取有效信息的难度,因此出现了为媒体数据的文本添加不同的内容标签,使得使用对象可根据内容标签快速准确获得所需的信息的方式。
[0004]然而,专利技术人发现,传统上通过添加内容标签并进行信息推荐的方式,通常采用的是多分类的深度学习模型,且多分类的深度学习模型的分类数量通常是固定且偏小的。而对于存在新闻突发类事件或者热点事件的情况,传统的多分类模型,并不支持对大量新增的突发事件的标签标注、识别以及显示等处理操作,仍然存在无法快速准确获取有效信息的问题,其对于媒体数据的标签处理以及信息推荐的精准度,仍然有待提升。
技术实现思路
[0005]基于此,有必要针对上述技术问题,提供一种能够提升确定得到的媒体数据的标签的准确度以及信息推荐效果的标签处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种标签处理方法。所述方法包括:
[0007]从 ...
【技术保护点】
【技术特征摘要】
1.一种标签处理方法,其特征在于,所述方法包括:从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中所包含的每个候选标签各自的标签特征;基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征;按照各所述候选标签在历史媒体数据中的共现关系,对所述初次更新标签特征进行二次更新,得到二次更新标签特征;基于每个所述二次更新标签特征分别与所述文本特征的第二特征相似度,将各所述候选标签中所述第二特征相似度满足相似度条件的目标标签确定为所述媒体数据的标签。2.根据权利要求1所述的方法,其特征在于,所述文本包括至少两类文本,所述文本特征包括与所述至少两类文本一一对应的至少两个文本特征,所述方法还包括:确定所述至少两个文本特征之间的文本特征相似度;根据所述文本特征相似度对所述至少两个文本特征分别进行特征更新,得到包括更新后的至少两个文本特征的文本特征组合;分别确定每个所述二次更新标签特征和所述文本特征组合之间的第二特征相似度。3.根据权利要求2所述的方法,其特征在于,所述分别确定每个所述二次更新标签特征和所述文本特征组合之间的第二特征相似度,包括:针对所述二次更新标签特征中的每一个二次更新标签特征,确定所述标签特征和所述文本特征组合中每一个文本特征之间的子相似度;将同一所述二次更新标签特征所对应的各所述子相似度进行数据融合,将所述数据融合得到的结果,确定为所述二次更新标签特征和所述文本特征组合之间的第二特征相似度。4.根据权利要求1所述的方法,其特征在于,所述媒体数据包括标题文本和内容文本,所述文本特征包括所述标题文本的标题文本特征以及所述内容文本的内容文本特征;所述方法还包括:基于所述标题文本特征和所述内容文本特征之间的文本特征相似度,分别对所述标题文本特征以及所述内容文本特征进行特征更新,得到更新标题文本特征和更新内容文本特征;针对所述二次更新标签特征中的每一个二次更新标签特征,将所述二次更新标签特征与所述更新标题文本特征间的第一子相似度、以及所述二次更新标签特征与所述更新内容文本特征间的第二子相似度进行数据融合,得到每一个二次更新标签特征各自匹配的第二特征相似度。5.根据权利要求4所述的方法,其特征在于,所述从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中包含的每个候选标签各自的标签特征,包括:识别所述媒体数据的标题文本和内容文本;提取所述标题文本的标题文本特征以及所述内容文本的内容文本特征;对所述标题文本和所述内容文本分别进行标签识别,得到候选标签,所述候选标签包括标题文本中的标签以及所述内容文本中的标签;提取每一个所述候选标签各自的标签特征。
6.根据权利要求4所述的方法,其特征在于,所述基于所述标题文本特征和所述内容文本特征之间的文本特征相似度,分别对所述标题文本特征以及所述内容文本特征进行特征更新,得到更新标题文本特征和更新内容文本特征,包括:确定所述标题文本特征和所述内容文本特征之间的文本特征相似度;基于所述文本特征相似度,确定所述标题文本特征所匹配的第一特征权重和所述内容文本特征所匹配的第二特征权重;根据所述第一特征权重对所述标题文本特征进行特征更新,获得更新标题文本特征,以及根据所述第二特征权重,对所述内容文本特征进行特征更新,获得更新内容文本特征。7.根据权利要求1至6任意一项所述的方法,其特征在于,所述基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征,包括:针对各所述标签特征中待更新的每一个目标标签特征,将所述目标标签特征与各所述标签特征中其余每一个标签特征间的第一特征相似度进行数据融合,得到每一个所述目标标签特征各自匹配的第三特征权重;基于所述目标标签特征所匹配的第三特征权重,对所述目标标签特征进行特征更新,得到初次更新标签特征。8.根据权利要求1至6任意一...
【专利技术属性】
技术研发人员:杨皓,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。