基于机器学习的信息推送方法及装置、存储介质、终端制造方法及图纸

技术编号:35330300 阅读:17 留言:0更新日期:2022-10-26 11:47
一种基于机器学习的信息推送方法及装置、存储介质、终端,所述方法包括:获取目标数据集,所述目标数据集包括多个备选用户的文献数据;根据多个备选用户的文献数据计算每个备选用户的特征数据,所述特征数据包括每篇文献的第一评价指数;将所述每个备选用户的特征数据输入训练后的网络模型,以得到每个备选用户的评价结果;基于每个备选用户的评价结果进行信息推送。在本发明专利技术的方案中,将包含第一评价指数的特征数据输入训练后的网络模型中得到各个备选用户的评价结果,并根据得到的评价结果进行信息推送,能够提高信息推送的准确性。能够提高信息推送的准确性。能够提高信息推送的准确性。

【技术实现步骤摘要】
基于机器学习的信息推送方法及装置、存储介质、终端


[0001]本专利技术涉及数据处理
,尤其涉及一种基于机器学习的信息推送方法及装置、存储介质、终端。

技术介绍

[0002]现有技术中通常采用用户的论文、专利等数据确定该用户的学术水平或学术价值,随着大数据时代的到来以及科学技术的不断发展,论文、专利、科研项目等数据越来越多,且不同用户的数据之间互相引用的情况越来越复杂。
[0003]因此,亟需一种方法能够基于各个文献之间的引用关系,对用户的相关学术信息进行更精准的信息推送。

技术实现思路

[0004]本专利技术解决的技术问题是如何准确地基于用户的文献数据等学术信息进行信息推送。
[0005]为解决上述技术问题,本专利技术实施例提供一种基于机器学习的信息推送方法,所述方法包括:获取目标数据集,所述目标数据集包括多个备选用户的文献数据;根据多个备选用户的文献数据计算每个备选用户的特征数据,所述特征数据包括每篇文献的第一评价指数;将所述每个备选用户的特征数据输入训练后的网络模型,以得到每个备选用户的评价结果,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价结果作为训练数据,对预设的网络模型进行训练得到的;基于每个备选用户的评价结果进行信息推送;其中,文献的第一评价指数的计算方法包括:从所述文献数据中提取各篇文献之间的引用关系,并根据各篇文献之间的引用关系确定引用网络,所述引用网络包括多个节点以及节点之间的连接线,所述节点表示文献,所述连接线表示文献之间具有引用关系;确定中心迭代节点;在所述引用网络中确定与所述中心迭代节点具有引用关系的引用节点,并根据引用节点所引用的节点数量将所述引用节点的权重分配给所述中心迭代节点的权重;迭代地在所述引用网络中确定与上一次迭代中确定的引用节点具有引用关系的引用节点,并根据本次迭代确定的引用节点所引用的节点数量将所述引用节点的权重分配给其引用的节点的权重,将所述上一次迭代中确定的权重发生变化的引用节点的权重变化值分配给其引用的节点的权重,当迭代次数达到预设值,或者所述中心迭代节点的权重变化值落入预设数值范围时,所述中心迭代节点的权重即为所述中心迭代节点对应文献的第一评价指数。
[0006]可选的,所述特征数据还包括第二评价指数,所述第二评价指数的计算方法包括:根据所述文献数据提取用户的发表文献数据以及引用文献数据,所述用户为用户样本或备选用户,所述发表文献数据包括发表的文献数量,所述引用文献数据包括引用文献数量;至少根据所述发表文献数据以及所述引用文献数据计算确定所述用户的第二评价指数。
[0007]可选的,所述特征数据还包括第三评价指数,所述文献数据包括时间字段,所述第三评价指数的计算方法包括:针对每个备选用户,根据所述文献数据中的时间字段,筛选出
属于预设时间范围内的文献数据;从所述属于预设时间范围内的文献数据中筛选出包含预设字段的文献数据;计算包含所述预设字段的文献数据占所述属于预设时间范围内的文献数据的比例,以得到所述第三评价指数。
[0008]可选的,每个用户样本具有第一类别标识,所述评价结果具有第二类别标识,获取所述多个用户样本的评价结果的方法包括:将每个用户样本的特征数据输入初始模型,以得到该用户样本的分值,所述初始模型通过层次分析法计算确定每个用户样本的分值;根据所述第一类别标识对所述多个用户样本进行分类,以得到多个用户样本集;根据每个用户样本的分值确定该用户样本在其所属的用户样本集中的排序;根据每个用户样本在其所属的用户样本集中的排序确定该用户样本的第二类别标识。
[0009]可选的,获取所述多个用户样本的评价结果的方法还包括:根据所述第一类别标识确定每个用户样本匹配的外部终端;将每个用户样本的文献数据发送至与该用户样本匹配的外部终端,并从所述外部终端接收每个用户样本的第三类别标识;针对每个用户样本,将该用户样本的所述第二类别标识与所述第三类别标识进行比对,如果两者不同,则将所述第三类别标识作为该用户样本的第二类别标识。
[0010]可选的,所述第二类别标识包括一级标识、二级标识和三级标识,根据每个用户样本在其所属的用户样本集中的排序确定该用户样本的第二类别标识包括:如果每个用户样本的排序在其所属的用户样本集中属于领先的第一预设范围,则确定该用户样本的第二类别标识为一级标识;如果每个用户样本的排序在其所属的用户样本集中处于第一预设范围之后并落入第二预设范围,则确定该用户样本的第二类别标识为二级标识;如果每个用户样本的排序在其所属的用户样本集中处于第二预设范围之后并落入第三预设范围,则确定该用户样本的第二类别标识为三级标识。
[0011]可选的,将所述每个备选用户的特征数据输入训练后的网络模型之前还包括:获取测试数据集,所述测试数据集包括多个测试样本的特征数据和第一评价结果;将每个测试样本的特征数据输入所述训练后的网络模型,以得到第二评价结果;计算所述第一评价结果与所述第二评价结果一致的测试样本的数量占所有测试样本的数量的比例,如果所述第一评价结果与所述第二评价结果一致的测试样本的数量占所有测试样本的数量的比例超过预设阈值,则判断所述训练后的网络模型是准确的。
[0012]为了解决上述技术问题,本专利技术实施例还提供一种基于机器学习的信息推送装置,所述装置包括:获取模块,用于获取目标数据集,所述目标数据集包括多个备选用户的文献数据;特征确定模块,用于根据多个备选用户的文献数据计算每个备选用户的特征数据,所述特征数据包括每篇文献的第一评价指数;结果计算模块,用于将所述每个备选用户的特征数据输入训练后的网络模型,以得到每个备选用户的评价结果,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价结果作为训练数据,对预设的网络模型进行训练得到的;信息推送模块,用于基于每个备选用户的评价结果进行信息推送;其中,所述特征确定模块包括第一特征子模块,所述第一特征子模块用于计算文献的第一评价指数,所述第一特征子模块包括:引用网络构建单元,用于从所述文献数据中提取各篇文献之间的引用关系,并根据各篇文献之间的引用关系确定引用网络,所述引用网络包括多个节点以及节点之间的连接线,所述节点表示文献,所述连接线表示文献之间具有引用关系;中心迭代节点确定单元,用于确定中心迭代节点;初次迭代单元,用于在所述引用网络中确定
与所述中心迭代节点具有引用关系的引用节点,并根据所述引用节点所引用的节点数量将所述引用节点的权重分配给所述中心迭代节点的权重;迭代计算单元,迭代地在所述引用网络中确定与上一次迭代中确定的引用节点具有引用关系的引用节点,并根据本次迭代确定的引用节点所引用的节点数量将所述引用节点的权重分配给其引用的节点的权重,将所述上一次迭代中确定的权重发生变化的引用节点的权重变化值分配给其引用的节点的权重,当迭代次数达到预设值,或者所述中心迭代节点的权重变化值落入预设数值范围时,所述中心迭代节点的权重即为所述中心迭代节点对应文献的第一评价指数。
[0013]本专利技术实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的信息推送方法,其特征在于,所述方法包括:获取目标数据集,所述目标数据集包括多个备选用户的文献数据;根据多个备选用户的文献数据计算每个备选用户的特征数据,所述特征数据包括每篇文献的第一评价指数;将所述每个备选用户的特征数据输入训练后的网络模型,以得到每个备选用户的评价结果,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价结果作为训练数据,对预设的网络模型进行训练得到的;基于每个备选用户的评价结果进行信息推送;其中,文献的第一评价指数的计算方法包括:从所述文献数据中提取各篇文献之间的引用关系,并根据各篇文献之间的引用关系确定引用网络,所述引用网络包括多个节点以及节点之间的连接线,所述节点表示文献,所述连接线表示文献之间具有引用关系;确定中心迭代节点;在所述引用网络中确定与所述中心迭代节点具有引用关系的引用节点,并根据引用节点所引用的节点数量将所述引用节点的权重分配给所述中心迭代节点的权重;迭代地在所述引用网络中确定与上一次迭代中确定的引用节点具有引用关系的引用节点,并根据本次迭代确定的引用节点所引用的节点数量将所述引用节点的权重分配给其引用的节点的权重,将所述上一次迭代中确定的权重发生变化的引用节点的权重变化值分配给其引用的节点的权重,当迭代次数达到预设值,或者所述中心迭代节点的权重变化值落入预设数值范围时,所述中心迭代节点的权重即为所述中心迭代节点对应文献的第一评价指数。2.根据权利要求1所述的基于机器学习的信息推送方法,其特征在于,所述特征数据还包括第二评价指数,所述第二评价指数的计算方法包括:根据所述文献数据提取用户的发表文献数据以及引用文献数据,所述用户为用户样本或备选用户,所述发表文献数据包括发表的文献数量,所述引用文献数据包括引用文献数量;至少根据所述发表文献数据以及所述引用文献数据计算确定所述用户的第二评价指数。3.根据权利要求1所述的基于机器学习的信息推送方法,其特征在于,所述特征数据还包括第三评价指数,所述文献数据包括时间字段,所述第三评价指数的计算方法包括:针对每个备选用户,根据所述文献数据中的时间字段,筛选出属于预设时间范围内的文献数据;从所述属于预设时间范围内的文献数据中筛选出包含预设字段的文献数据;计算包含所述预设字段的文献数据占所述属于预设时间范围内的文献数据的比例,以得到所述第三评价指数。4.根据权利要求1所述的基于机器学习的信息推送方法,其特征在于,每个用户样本具有第一类别标识,所述评价结果具有第二类别标识,获取所述多个用户样本的评价结果的方法包括:将每个用户样本的文献数据输入初始模型,以得到该用户样本的分值,所述初始模型
通过层次分析法计算确定每个用户样本的分值;根据所述第一类别标识对所述多个用户样本进行分类,以得到多个用户样本集;根据每个用户样本的分值确定该用户样本在其所属的用户样本集中的排序,并根据每个用户样本在其所属的用户样本集中的排序确定该用户样本的第二类别标识。5.根据权利要求4所述的基于机器学习的信息推送方法,其特征在于,获取所述多个用户样本的评价结果的方法还包括:根据所述第一类别标识确定每个用户样本匹配的外部终端;将每个用户样本的文献数据发送至与该用户样本匹配的外部终端,并从所述外部终端接收每个用户样本的第三类别标识;针对每个用户样本,将该用户样本的所述第二类别标识与所述第三类别标识进行比对,如果两者不同,则将所述第三类别标识作为...

【专利技术属性】
技术研发人员:江明李永智谷俊
申请(专利权)人:上海柏观数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1