【技术实现步骤摘要】
数据处理方法、用于输出知识内容的方法及装置
[0001]本公开涉及人工智能
,具体为内容推荐
技术介绍
[0002]目前,随着信息技术的不断发展,用户从各类渠道所获取的内容越来越多。
[0003]在实践中发现,这些内容的展示往往杂乱无序,需要用户根据自己的需求选择相应的内容查看方式,例如根据自己的需求选择对内容进行查看的顺序。可见,现在的内容展示方式存在着智能化程度较低的问题。
技术实现思路
[0004]本公开提供了一种数据处理方法、用于输出知识内容的方法及装置。
[0005]根据本公开的一方面,提供了一种数据处理方法,包括:获取样本知识内容集合以及样本知识内容集合中各个样本知识内容对应的样本标注类别;从样本知识内容集合中确定初始样本知识内容;对待训练模型执行以下模型训练步骤:基于初始样本知识内容和待训练模型,确定初始样本知识内容对应的预测类别;响应于确定预测类别和初始样本知识内容对应的样本标注类别满足预设的收敛条件,将待训练模型确定为训练完成的权重生成模型。
[0006]根据本公开的另一方面,提供了一种用于输出知识内容的方法,包括:获取知识内容集合;基于上述的数据处理方法得到的权重生成模型,确定知识内容集合中各个知识内容对应的权重;基于各个知识内容对应的权重,确定输出顺序;基于输出顺序,输出各个知识内容。
[0007]根据本公开的另一方面,提供了一种数据处理装置,包括:样本获取单元,被配置成获取样本知识内容集合以及样本知识内容集合中各个样本知识内容对应 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:获取样本知识内容集合以及所述样本知识内容集合中各个样本知识内容对应的样本标注类别;从所述样本知识内容集合中确定初始样本知识内容;对待训练模型执行以下模型训练步骤:基于所述初始样本知识内容和所述待训练模型,确定所述初始样本知识内容对应的预测类别;响应于确定所述预测类别和所述初始样本知识内容对应的样本标注类别满足预设的收敛条件,将所述待训练模型确定为训练完成的权重生成模型。2.根据权利要求1所述的方法,还包括:响应于确定所述预测类别和所述初始样本知识内容对应的样本标注类别不满足所述预设的收敛条件,从所述样本知识内容集合中重新确定所述初始样本知识内容,并重复执行所述模型训练步骤。3.根据权利要求1所述的方法,其中,所述样本标注类别包括正样本或者负样本;以及所述获取样本知识内容集合以及所述样本知识内容集合中各个样本知识内容对应的样本标注类别,包括:基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容。4.根据权利要求3所述的方法,其中,所述预设的数据挖掘维度包括以下至少一项:资讯维度、非资讯维度、输出对象维度、技能标签维度。5.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容,包括:基于所述资讯维度,确定目标资讯主题;从所述预设的知识内容库中,基于与所述目标资讯主题相匹配的资讯数据,确定正样本知识内容;从所述预设的知识内容库中,基于非资讯数据以及与所述目标资讯主题不相匹配的资讯数据,确定负样本知识内容。6.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容,包括:基于所述非资讯维度,确定目标非资讯主题;从所述预设的知识内容库中,基于与所述目标非资讯主题相匹配的非资讯数据,确定正样本知识内容;从所述预设的知识内容库中,基于资讯数据以及与所述目标非资讯主题不相匹配的非资讯数据,确定负样本知识内容。7.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容,包括:基于所述输出对象维度,确定至少一个输出对象类别;从所述预设的知识内容库中,对于每个输出对象类别,确定该输出对象类别对应的正样本知识内容以及负样本知识内容。8.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内
容库中确定正样本知识内容以及负样本知识内容,包括:基于所述技能标签维度,确定各个初始技能标签;对所述各个初始技能标签进行聚类,得到聚类后的各个目标技能标签;从所述预设的知识内容库中,确定与每个目标技能标签对应的正样本知识内容以及负样本知识内容。9.一种用于输出知识内容的方法,包括:获取知识内容集合;基于权利要求1至8任一项所述的数据处理方法得到的权重生成模型,确定所述知识内容集合中各个知识内容对应的权重;基于各个知识内容对应的权重,确定输出顺序;基于所述输出顺序,输出各个知识内容。10.一种数据处理装置,包括:样本获取单元,被配置成获取样本知识内容集合以及所述样本知识内容集合中各个样本知识内容对应的样本标注类别;初始样本确定单元,被配置成从所述样本知识内容集合中确定初始样本知识内容;模型训练单元,被配置成对待训练模型执行以下模...
【专利技术属性】
技术研发人员:徐伟,程鸣权,杨海涛,步君昭,蒋俊翔,刘欢,骆金昌,何伯磊,和为,陈坤斌,毛丽媛,周敏,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。