数据处理方法、用于输出知识内容的方法及装置制造方法及图纸

技术编号:33041773 阅读:18 留言:0更新日期:2022-04-15 09:23
本公开提供了用于数据处理方法、用于输出知识内容的方法及装置,涉及人工智能技术领域,具体为内容推荐技术领域。具体实现方案为:获取样本知识内容集合以及样本知识内容集合中各个样本知识内容对应的样本标注类别;从样本知识内容集合中确定初始样本知识内容;对待训练模型执行以下模型训练步骤:基于初始样本知识内容和待训练模型,确定初始样本知识内容对应的预测类别;响应于确定预测类别和初始样本知识内容对应的样本标注类别满足预设的收敛条件,将待训练模型确定为训练完成的权重生成模型。本实现方式可以提高知识内容展示的智能化程度。能化程度。能化程度。

【技术实现步骤摘要】
数据处理方法、用于输出知识内容的方法及装置


[0001]本公开涉及人工智能
,具体为内容推荐


技术介绍

[0002]目前,随着信息技术的不断发展,用户从各类渠道所获取的内容越来越多。
[0003]在实践中发现,这些内容的展示往往杂乱无序,需要用户根据自己的需求选择相应的内容查看方式,例如根据自己的需求选择对内容进行查看的顺序。可见,现在的内容展示方式存在着智能化程度较低的问题。

技术实现思路

[0004]本公开提供了一种数据处理方法、用于输出知识内容的方法及装置。
[0005]根据本公开的一方面,提供了一种数据处理方法,包括:获取样本知识内容集合以及样本知识内容集合中各个样本知识内容对应的样本标注类别;从样本知识内容集合中确定初始样本知识内容;对待训练模型执行以下模型训练步骤:基于初始样本知识内容和待训练模型,确定初始样本知识内容对应的预测类别;响应于确定预测类别和初始样本知识内容对应的样本标注类别满足预设的收敛条件,将待训练模型确定为训练完成的权重生成模型。
[0006]根据本公开的另一方面,提供了一种用于输出知识内容的方法,包括:获取知识内容集合;基于上述的数据处理方法得到的权重生成模型,确定知识内容集合中各个知识内容对应的权重;基于各个知识内容对应的权重,确定输出顺序;基于输出顺序,输出各个知识内容。
[0007]根据本公开的另一方面,提供了一种数据处理装置,包括:样本获取单元,被配置成获取样本知识内容集合以及样本知识内容集合中各个样本知识内容对应的样本标注类别;初始样本确定单元,被配置成从样本知识内容集合中确定初始样本知识内容;模型训练单元,被配置成对待训练模型执行以下模型训练步骤:基于初始样本知识内容和待训练模型,确定初始样本知识内容对应的预测类别;响应于确定预测类别和初始样本知识内容对应的样本标注类别满足预设的收敛条件,将待训练模型确定为训练完成的权重生成模型。
[0008]根据本公开的另一方面,提供了一种用于输出知识内容的装置,包括:内容获取单元,被配置成获取知识内容集合;权重确定单元,被配置成基于上述的数据处理方法得到的权重生成模型,确定知识内容集合中各个知识内容对应的权重;顺序确定单元,被配置成基于各个知识内容对应的权重,确定输出顺序;内容输出单元,被配置成基于输出顺序,输出各个知识内容。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上任意一项数据处理方法或者用于输出知识内容的方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,其中,计算机指令用于使计算机执行如上任意一项数据处理方法或者用于输出知识内容的方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上任意一项数据处理方法或者用于输出知识内容的方法。
[0012]根据本公开的技术,提供一种数据处理方法和用于输出知识内容的方法,能够提高内容展示的智能化程度,提升用户体验。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
[0016]图2是根据本公开的数据处理方法的一个实施例的流程图;
[0017]图3是根据本公开的数据处理方法的另一个实施例的流程图;
[0018]图4是根据本公开的用于输出知识内容的方法的一个实施例的流程图;
[0019]图5是根据本公开的用于输出知识内容的方法的一个应用场景的示意图;
[0020]图6是根据本公开的用于输出知识内容的方法的一个应用软件的软件界面示意图;
[0021]图7是根据本公开的数据处理装置的一个实施例的结构示意图;
[0022]图8是根据本公开的用于输出知识内容的装置的一个实施例的结构示意图;
[0023]图9是用来实现本公开实施例的数据处理方法或者用于输出知识内容的方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
[0026]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0027]终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。其中,终端设备101、102、103可以通过网络104获取服务器105返回的各个知识内容,以及各个知识内容对应的输出顺序,终端设备101、102、103能够按照各个知识内容对应的输出顺序,输出各个知识内容。
[0028]终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各个电子设备,包括但不限于手机、电脑、平板等等。当终端设备101、102、103
为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
[0029]服务器105可以是提供各种服务的服务器,例如,服务器105可以获取需要进行输出的知识内容集合,并基于权重生成模型,确定知识内容集合中各个知识内容对应的权重,基于各个知识内容对应的权重,确定输出顺序,并基于输出顺序,将各个知识内容以及相对应的输出顺序通过网络104发送给终端设备101、102、103,以使终端设备101、102、103按照各个知识内容对应的输出顺序,输出各个知识内容。
[0030]其中,服务器105还可以通过网络104获取终端设备101、102、103历史输出的各个知识内容,以及确定历史输出的各个知识内容对应的用户点击情况,基于用户点击情况获取样本知识内容集合以及样本知识内容集合中各个样本知识对应的样本标注类别,基于这些样本数据对待训练模型进行训练,得到上述的权重生成模型。
[0031]需要说明的是,服务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:获取样本知识内容集合以及所述样本知识内容集合中各个样本知识内容对应的样本标注类别;从所述样本知识内容集合中确定初始样本知识内容;对待训练模型执行以下模型训练步骤:基于所述初始样本知识内容和所述待训练模型,确定所述初始样本知识内容对应的预测类别;响应于确定所述预测类别和所述初始样本知识内容对应的样本标注类别满足预设的收敛条件,将所述待训练模型确定为训练完成的权重生成模型。2.根据权利要求1所述的方法,还包括:响应于确定所述预测类别和所述初始样本知识内容对应的样本标注类别不满足所述预设的收敛条件,从所述样本知识内容集合中重新确定所述初始样本知识内容,并重复执行所述模型训练步骤。3.根据权利要求1所述的方法,其中,所述样本标注类别包括正样本或者负样本;以及所述获取样本知识内容集合以及所述样本知识内容集合中各个样本知识内容对应的样本标注类别,包括:基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容。4.根据权利要求3所述的方法,其中,所述预设的数据挖掘维度包括以下至少一项:资讯维度、非资讯维度、输出对象维度、技能标签维度。5.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容,包括:基于所述资讯维度,确定目标资讯主题;从所述预设的知识内容库中,基于与所述目标资讯主题相匹配的资讯数据,确定正样本知识内容;从所述预设的知识内容库中,基于非资讯数据以及与所述目标资讯主题不相匹配的资讯数据,确定负样本知识内容。6.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容,包括:基于所述非资讯维度,确定目标非资讯主题;从所述预设的知识内容库中,基于与所述目标非资讯主题相匹配的非资讯数据,确定正样本知识内容;从所述预设的知识内容库中,基于资讯数据以及与所述目标非资讯主题不相匹配的非资讯数据,确定负样本知识内容。7.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内容库中确定正样本知识内容以及负样本知识内容,包括:基于所述输出对象维度,确定至少一个输出对象类别;从所述预设的知识内容库中,对于每个输出对象类别,确定该输出对象类别对应的正样本知识内容以及负样本知识内容。8.根据权利要求4所述的方法,其中,所述基于预设的数据挖掘维度,从预设的知识内
容库中确定正样本知识内容以及负样本知识内容,包括:基于所述技能标签维度,确定各个初始技能标签;对所述各个初始技能标签进行聚类,得到聚类后的各个目标技能标签;从所述预设的知识内容库中,确定与每个目标技能标签对应的正样本知识内容以及负样本知识内容。9.一种用于输出知识内容的方法,包括:获取知识内容集合;基于权利要求1至8任一项所述的数据处理方法得到的权重生成模型,确定所述知识内容集合中各个知识内容对应的权重;基于各个知识内容对应的权重,确定输出顺序;基于所述输出顺序,输出各个知识内容。10.一种数据处理装置,包括:样本获取单元,被配置成获取样本知识内容集合以及所述样本知识内容集合中各个样本知识内容对应的样本标注类别;初始样本确定单元,被配置成从所述样本知识内容集合中确定初始样本知识内容;模型训练单元,被配置成对待训练模型执行以下模...

【专利技术属性】
技术研发人员:徐伟程鸣权杨海涛步君昭蒋俊翔刘欢骆金昌何伯磊和为陈坤斌毛丽媛周敏
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1