标签处理方法、装置、计算机设备、存储介质和程序产品制造方法及图纸

技术编号:35599186 阅读:24 留言:0更新日期:2022-11-16 15:19
本申请涉及一种标签处理方法、装置、计算机设备、存储介质和程序产品。所述方法涉及人工智能,包括:从包含文本的媒体数据中,分别提取文本的文本特征、以及文本中所包含的每个候选标签各自的标签特征,基于各标签特征之间的第一特征相似度,分别对每一标签特征进行特征更新,得到初次更新标签特征。按照各候选标签在历史媒体数据中的共现关系,对初次更新标签特征进行二次更新,得到二次更新标签特征,基于每个二次更新标签特征与文本特征的第二特征相似度,将各候选标签中第二特征相似度满足相似度条件的目标标签确定为媒体数据的标签。采用本方法提升了媒体数据的标签和媒体数据间的关联度,避免出现由于关联度低导致无法获取准确信息的问题。取准确信息的问题。取准确信息的问题。

【技术实现步骤摘要】
标签处理方法、装置、计算机设备、存储介质和程序产品


[0001]本申请涉及人工智能
,特别是涉及一种标签处理方法、装置、计算机设备、存储介质和程序产品。

技术介绍

[0002]随着人工智能技术的发展,以及互联网应用的推广使用,在实际应用过程中,由于存在海量数据以及干扰信息等,导致各应用平台,比如新闻平台、购物平台等,无法进行信息高效管理,也无法准确确定出不同使用对象所需的信息或者数据。
[0003]以新闻平台为例,由于平台的媒体数据的日益增长,以及缺乏对媒体数据的高效管理,增加了使用对象获取有效信息的难度,因此出现了为媒体数据的文本添加不同的内容标签,使得使用对象可根据内容标签快速准确获得所需的信息的方式。
[0004]然而,专利技术人发现,传统上通过添加内容标签并进行信息推荐的方式,通常采用的是多分类的深度学习模型,且多分类的深度学习模型的分类数量通常是固定且偏小的。而对于存在新闻突发类事件或者热点事件的情况,传统的多分类模型,并不支持对大量新增的突发事件的标签标注、识别以及显示等处理操作,仍然存在无法快速准确获取有效信息的问题,其对于媒体数据的标签处理以及信息推荐的精准度,仍然有待提升。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提升确定得到的媒体数据的标签的准确度以及信息推荐效果的标签处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种标签处理方法。所述方法包括:
[0007]从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中所包含的每个候选标签各自的标签特征;
[0008]基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征;
[0009]按照各所述候选标签在历史媒体数据中的共现关系,对所述初次更新标签特征进行二次更新,得到二次更新标签特征;
[0010]基于每个所述二次更新标签特征分别与所述文本特征的第二特征相似度,将各所述候选标签中所述第二特征相似度满足相似度条件的目标标签确定为所述媒体数据的标签。
[0011]在其中一个实施例中,所述方法还包括:根据预设的所述相似度条件,确定对应的预设相似度阈值,并从各所述第二特征相似度中筛选得到大于所述预设相似度阈值的目标相似度;或根据相似度值大小对各所述第二特征相似度进行排序,获得相应的特征相似度序列,并根据预设的所述相似度条件,从所述特征相似度序列中筛选出前预设个目标相似度。
[0012]第二方面,本申请还提供了一种标签处理装置。所述装置包括:
[0013]提取模块,用于从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中包含的每个候选标签各自的标签特征;
[0014]初次更新模块,用于基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征;
[0015]二次更新模块,用于按照各所述候选标签在历史媒体数据中的共现关系,对所述初次更新的标签特征进行二次更新,得到二次更新标签特征;
[0016]标签筛选模块,用于基于每个所述二次更新标签特征分别与所述文本特征的第二特征相似度,将各所述候选标签中所述第二特征相似度满足相似度条件的目标标签确定为所述媒体数据的标签。
[0017]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0018]从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中所包含的每个候选标签各自的标签特征;
[0019]基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征;
[0020]按照各所述候选标签在历史媒体数据中的共现关系,对所述初次更新标签特征进行二次更新,得到二次更新标签特征;
[0021]基于每个所述二次更新标签特征分别与所述文本特征的第二特征相似度,将各所述候选标签中所述第二特征相似度满足相似度条件的目标标签确定为所述媒体数据的标签。
[0022]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0023]从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中所包含的每个候选标签各自的标签特征;
[0024]基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征;
[0025]按照各所述候选标签在历史媒体数据中的共现关系,对所述初次更新标签特征进行二次更新,得到二次更新标签特征;
[0026]基于每个所述二次更新标签特征分别与所述文本特征的第二特征相似度,将各所述候选标签中所述第二特征相似度满足相似度条件的目标标签确定为所述媒体数据的标签。
[0027]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0028]从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中所包含的每个候选标签各自的标签特征;
[0029]基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征;
[0030]按照各所述候选标签在历史媒体数据中的共现关系,对所述初次更新标签特征进
行二次更新,得到二次更新标签特征;
[0031]基于每个所述二次更新标签特征分别与所述文本特征的第二特征相似度,将各所述候选标签中所述第二特征相似度满足相似度条件的目标标签确定为所述媒体数据的标签。
[0032]上述标签处理方法、装置、计算机设备、存储介质和计算机程序产品中,通过从包含文本的媒体数据中,分别提取文本的文本特征、以及文本中包含的每个候选标签各自的标签特征,以基于各标签特征之间的第一特征相似度,分别对每一标签特征进行特征更新,得到初次更新标签特征,提升了所得到的初次更新标签特征之间的相关度。通过按照各候选标签在历史媒体数据中的共现关系,对初次更新标签特征进行二次更新,得到二次更新标签特征,以进一步提升得到的各二次更新标签特征之间的相关度。最终可基于每个二次更新标签特征分别与文本特征的第二特征相似度,将各候选标签中第二特征相似度满足相似度条件的目标标签确定为媒体数据的标签,进而提升了所确定出的媒体数据的标签和媒体数据之间的关联度,避免出现由于标签关联度低,导致使用对象无法准确获取有效信息的情况,进一步提升了基于媒体数据对各使用对象进行推荐时的个性化推荐效果。
附图说明
[0033]图1为一个实施例中标签处理方法的应用环境图;
[0034]图2为一个实施例中标签处理方法的流程示意图;
[0035]图3为一个实施例中对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签处理方法,其特征在于,所述方法包括:从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中所包含的每个候选标签各自的标签特征;基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征;按照各所述候选标签在历史媒体数据中的共现关系,对所述初次更新标签特征进行二次更新,得到二次更新标签特征;基于每个所述二次更新标签特征分别与所述文本特征的第二特征相似度,将各所述候选标签中所述第二特征相似度满足相似度条件的目标标签确定为所述媒体数据的标签。2.根据权利要求1所述的方法,其特征在于,所述文本包括至少两类文本,所述文本特征包括与所述至少两类文本一一对应的至少两个文本特征,所述方法还包括:确定所述至少两个文本特征之间的文本特征相似度;根据所述文本特征相似度对所述至少两个文本特征分别进行特征更新,得到包括更新后的至少两个文本特征的文本特征组合;分别确定每个所述二次更新标签特征和所述文本特征组合之间的第二特征相似度。3.根据权利要求2所述的方法,其特征在于,所述分别确定每个所述二次更新标签特征和所述文本特征组合之间的第二特征相似度,包括:针对所述二次更新标签特征中的每一个二次更新标签特征,确定所述标签特征和所述文本特征组合中每一个文本特征之间的子相似度;将同一所述二次更新标签特征所对应的各所述子相似度进行数据融合,将所述数据融合得到的结果,确定为所述二次更新标签特征和所述文本特征组合之间的第二特征相似度。4.根据权利要求1所述的方法,其特征在于,所述媒体数据包括标题文本和内容文本,所述文本特征包括所述标题文本的标题文本特征以及所述内容文本的内容文本特征;所述方法还包括:基于所述标题文本特征和所述内容文本特征之间的文本特征相似度,分别对所述标题文本特征以及所述内容文本特征进行特征更新,得到更新标题文本特征和更新内容文本特征;针对所述二次更新标签特征中的每一个二次更新标签特征,将所述二次更新标签特征与所述更新标题文本特征间的第一子相似度、以及所述二次更新标签特征与所述更新内容文本特征间的第二子相似度进行数据融合,得到每一个二次更新标签特征各自匹配的第二特征相似度。5.根据权利要求4所述的方法,其特征在于,所述从包含文本的媒体数据中,分别提取所述文本的文本特征、以及所述文本中包含的每个候选标签各自的标签特征,包括:识别所述媒体数据的标题文本和内容文本;提取所述标题文本的标题文本特征以及所述内容文本的内容文本特征;对所述标题文本和所述内容文本分别进行标签识别,得到候选标签,所述候选标签包括标题文本中的标签以及所述内容文本中的标签;提取每一个所述候选标签各自的标签特征。
6.根据权利要求4所述的方法,其特征在于,所述基于所述标题文本特征和所述内容文本特征之间的文本特征相似度,分别对所述标题文本特征以及所述内容文本特征进行特征更新,得到更新标题文本特征和更新内容文本特征,包括:确定所述标题文本特征和所述内容文本特征之间的文本特征相似度;基于所述文本特征相似度,确定所述标题文本特征所匹配的第一特征权重和所述内容文本特征所匹配的第二特征权重;根据所述第一特征权重对所述标题文本特征进行特征更新,获得更新标题文本特征,以及根据所述第二特征权重,对所述内容文本特征进行特征更新,获得更新内容文本特征。7.根据权利要求1至6任意一项所述的方法,其特征在于,所述基于各所述标签特征之间的第一特征相似度,分别对每一所述标签特征进行特征更新,得到初次更新标签特征,包括:针对各所述标签特征中待更新的每一个目标标签特征,将所述目标标签特征与各所述标签特征中其余每一个标签特征间的第一特征相似度进行数据融合,得到每一个所述目标标签特征各自匹配的第三特征权重;基于所述目标标签特征所匹配的第三特征权重,对所述目标标签特征进行特征更新,得到初次更新标签特征。8.根据权利要求1至6任意一...

【专利技术属性】
技术研发人员:杨皓
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1