【技术实现步骤摘要】
基于机器学习的信息推送方法及装置、存储介质、终端
[0001]本专利技术涉及数据处理
,尤其涉及一种基于机器学习的信息推送方法及装置、存储介质、终端。
技术介绍
[0002]现有技术中通常采用用户的论文、专利等数据确定该用户的学术水平或学术价值,随着大数据时代的到来以及科学技术的不断发展,论文、专利、科研项目等数据越来越多,且不同用户的数据之间互相引用的情况越来越复杂。
[0003]因此,亟需一种方法能够基于各个文献之间的引用关系,对用户的相关学术信息进行更精准的信息推送。
技术实现思路
[0004]本专利技术解决的技术问题是如何准确地基于用户的文献数据等学术信息进行信息推送。
[0005]为解决上述技术问题,本专利技术实施例提供一种基于机器学习的信息推送方法,所述方法包括:获取目标数据集,所述目标数据集包括多个备选用户的文献数据;根据多个备选用户的文献数据计算每个备选用户的特征数据,所述特征数据包括每篇文献的第一评价指数;将所述每个备选用户的特征数据输入训练后的网络模型,以得到每个备选用户的评价结果,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价结果作为训练数据,对预设的网络模型进行训练得到的;基于每个备选用户的评价结果进行信息推送;其中,文献的第一评价指数的计算方法包括:从所述文献数据中提取各篇文献之间的引用关系,并根据各篇文献之间的引用关系确定引用网络,所述引用网络包括多个节点以及节点之间的连接线,所述节点表示文献,所述连接线表示文献之间具有引用关系;确定中心迭 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的信息推送方法,其特征在于,所述方法包括:获取目标数据集,所述目标数据集包括多个备选用户的文献数据;根据多个备选用户的文献数据计算每个备选用户的特征数据,所述特征数据包括每篇文献的第一评价指数;将所述每个备选用户的特征数据输入训练后的网络模型,以得到每个备选用户的评价结果,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价结果作为训练数据,对预设的网络模型进行训练得到的;基于每个备选用户的评价结果进行信息推送;其中,文献的第一评价指数的计算方法包括:从所述文献数据中提取各篇文献之间的引用关系,并根据各篇文献之间的引用关系确定引用网络,所述引用网络包括多个节点以及节点之间的连接线,所述节点表示文献,所述连接线表示文献之间具有引用关系;确定中心迭代节点;在所述引用网络中确定与所述中心迭代节点具有引用关系的引用节点,并根据引用节点所引用的节点数量将所述引用节点的权重分配给所述中心迭代节点的权重;迭代地在所述引用网络中确定与上一次迭代中确定的引用节点具有引用关系的引用节点,并根据本次迭代确定的引用节点所引用的节点数量将所述引用节点的权重分配给其引用的节点的权重,将所述上一次迭代中确定的权重发生变化的引用节点的权重变化值分配给其引用的节点的权重,当迭代次数达到预设值,或者所述中心迭代节点的权重变化值落入预设数值范围时,所述中心迭代节点的权重即为所述中心迭代节点对应文献的第一评价指数。2.根据权利要求1所述的基于机器学习的信息推送方法,其特征在于,所述特征数据还包括第二评价指数,所述第二评价指数的计算方法包括:根据所述文献数据提取用户的发表文献数据以及引用文献数据,所述用户为用户样本或备选用户,所述发表文献数据包括发表的文献数量,所述引用文献数据包括引用文献数量;至少根据所述发表文献数据以及所述引用文献数据计算确定所述用户的第二评价指数。3.根据权利要求1所述的基于机器学习的信息推送方法,其特征在于,所述特征数据还包括第三评价指数,所述文献数据包括时间字段,所述第三评价指数的计算方法包括:针对每个备选用户,根据所述文献数据中的时间字段,筛选出属于预设时间范围内的文献数据;从所述属于预设时间范围内的文献数据中筛选出包含预设字段的文献数据;计算包含所述预设字段的文献数据占所述属于预设时间范围内的文献数据的比例,以得到所述第三评价指数。4.根据权利要求1所述的基于机器学习的信息推送方法,其特征在于,每个用户样本具有第一类别标识,所述评价结果具有第二类别标识,获取所述多个用户样本的评价结果的方法包括:将每个用户样本的文献数据输入初始模型,以得到该用户样本的分值,所述初始模型
通过层次分析法计算确定每个用户样本的分值;根据所述第一类别标识对所述多个用户样本进行分类,以得到多个用户样本集;根据每个用户样本的分值确定该用户样本在其所属的用户样本集中的排序,并根据每个用户样本在其所属的用户样本集中的排序确定该用户样本的第二类别标识。5.根据权利要求4所述的基于机器学习的信息推送方法,其特征在于,获取所述多个用户样本的评价结果的方法还包括:根据所述第一类别标识确定每个用户样本匹配的外部终端;将每个用户样本的文献数据发送至与该用户样本匹配的外部终端,并从所述外部终端接收每个用户样本的第三类别标识;针对每个用户样本,将该用户样本的所述第二类别标识与所述第三类别标识进行比对,如果两者不同,则将所述第三类别标识作为...
【专利技术属性】
技术研发人员:江明,李永智,谷俊,
申请(专利权)人:上海柏观数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。