一种信息推送方法及装置、存储介质、终端,所述方法包括:按照第一预设时间步长采集目标数据集,所述目标数据集包括备选用户的文献数据;根据所述文献数据计算所述备选用户的特征数据,将所述备选用户的特征数据输入训练后的网络模型,以得到所述备选用户的评价值;计算确定本次采集时所述备选用户的评价值随时间的变化率,以得到本次采集时所述备选用户的成长指数;根据本次采集时所述备选用户的成长指数进行信息推送。本发明专利技术的方案中,将特征数据输入训练后的网络模型中得到各个备选用户的评价值,根据评价结果计算成长指数,并根据各个备选用户的成长指数进行信息推送,能够提高信息推送的准确性。信息推送的准确性。信息推送的准确性。
【技术实现步骤摘要】
信息推送方法及装置、存储介质、终端
[0001]本专利技术涉及数据处理
,尤其涉及一种信息推送方法及装置、存储介质、终端。
技术介绍
[0002]现有技术中,通常根据用户的论文、专利的文献数据确定所要推送的用户信息并进行信息推送,但随着大数据时代的到来以及科学技术的迅速发展,论文、专利、科研项目等数据越来越多,用户的文献数据中通常会包含失效的文献数据(例如,文献的发表时间与进行信息推送的时间差值超过预设时间差),根据这些失效的文献数据确定推送信息往往会导致信息推送的不准确。
[0003]因此,亟需一种信息推送方法,能够基于文献数据进行准确的信息推送。
技术实现思路
[0004]本专利技术解决的技术问题是如何准确地基于用户的文献数据等学术信息进行信息推送。
[0005]为解决上述技术问题,本专利技术实施例提供一种信息推送方法,所述方法包括:按照第一预设时间步长采集目标数据集,所述目标数据集包括备选用户的文献数据;根据所述文献数据计算所述备选用户的特征数据,将所述备选用户的特征数据输入训练后的网络模型,以得到所述备选用户的评价值,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价值作为训练数据,对预设的网络模型进行训练得到的;根据本次采集时所述备选用户的评价值、上一次采集时所述备选用户的评价值以及所述第一预设时间步长,计算确定本次采集时所述备选用户的评价值随时间的变化率,以得到本次采集时所述备选用户的成长指数;根据本次采集时所述备选用户的成长指数进行信息推送。
[0006]可选的,所述特征数据包括每篇文献的第一评价指数,文献的第一评价指数的计算方法包括:从所述文献数据中提取各篇文献之间的引用关系,并根据各篇文献之间的引用关系确定引用网络,所述引用网络包括多个节点以及节点之间的连接线,所述节点表示文献,所述连接线表示文献之间具有引用关系;确定中心迭代节点;在所述引用网络中确定与所述中心迭代节点具有引用关系的引用节点,并根据引用节点所引用的节点数量将所述引用节点的权重分配给所述中心迭代节点的权重;迭代地在所述引用网络中确定与上一次迭代中确定的引用节点具有引用关系的引用节点,并根据本次迭代确定的引用节点所引用的节点数量将所述引用节点的权重分配给其引用的节点的权重,将所述上一次迭代中确定的权重发生变化的引用节点的权重变化值分配给其引用的节点的权重,当迭代次数达到预设值,或者所述中心迭代节点的权重变化值落入预设数值范围时,所述中心迭代节点的权重即为所述中心迭代节点对应文献的第一评价指数。
[0007]可选的,所述特征数据包括第二评价指数,所述第二评价指数的计算方法包括:根据所述文献数据提取用户的发表文献数据以及引用文献数据,所述用户为所述备选用户或
所述用户样本,所述发表文献数据包括发表的文献数量,所述引用文献数据包括引用文献数量;至少根据所述发表文献数据以及所述引用文献数据计算确定所述用户的第二评价指数。
[0008]可选的,根据所述文献数据计算所述备选用户的特征数据之前,所述方法还包括:计算同名的备选用户的文献数据之间的主题相似度;如果所述主题相似度小于第一预设阈值,则确定所述同名的备选用户的文献数据在同一时间段内出现同名机构的比例;如果所述在同一时间段内出现同名机构的比例大于第二预设阈值,则确定所述同名的备选用户的文献数据在所述同一时间段以及同一机构内合作用户相同的比例;如果在所述同一时间段以及同一机构内合作用户相同的比例大于第三预设阈值,则确定所述同名的备选用户为同一备选用户,否则确定所述同名的备选用户为不同的备选用户。
[0009]可选的,根据本次采集时所述备选用户的成长指数进行信息推送包括:根据所述备选用户在每次采集所述目标数据集时的成长指数计算确定本次采集时所述备选用户的综合成长指数;根据本次采集时所述备选用户的综合成长指数进行所述信息推送。
[0010]可选的,所述目标数据集包括所述备选用户的用户标识,所述用户标识和所述备选用户一一对应,根据所述文献数据计算所述特征数据之前,所述方法还包括:在预设的用户数据集中依次查找所述用户标识;如果在所述用户数据集中查找到所述用户标识,将所述用户标识对应的备选用户在所述目标数据集中的文献数据与在所述用户数据集中的文献数据进行比对,以判断所述备选用户的文献数据是否发生更新;对于所述文献数据发生更新的备选用户,将其在所述目标数据集中的文献数据更新至所述用户数据集中。
[0011]可选的,所述用户数据集具有更新标记,所述更新标记用于指示本次采集时所述文献数据发生更新的备选用户,根据所述文献数据计算所述特征数据,将所述备选用户的特征数据输入所述训练后的网络模型,以得到所述备选用户的评价值包括:按照第二预设时间步长扫描所述用户数据集,当扫描到所述更新标记时,根据所述文献数据计算所述更新标记指示的备选用户的特征数据,将所述更新标记指示的备选用户的特征数据输入所述训练后的网络模型,以得到所述更新标记指示的备选用户的评价值。
[0012]为了解决上述技术问题,本专利技术实施例还提供一种信息推送装置,所述装置包括:采集模块,用于按照第一预设时间步长采集目标数据集,所述目标数据集包括备选用户的文献数据;第一计算模块,用于根据所述文献数据计算所述备选用户的特征数据,将所述备选用户的特征数据输入训练后的网络模型,以得到所述备选用户的评价值,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价值作为训练数据,对预设的网络模型进行训练得到的;第二计算模块,用于根据本次采集时所述备选用户的评价值、上一次采集时所述备选用户的评价值以及所述第一预设时间步长,计算确定本次采集时所述备选用户的评价值随时间的变化率,以得到本次采集时所述备选用户的成长指数;推送模块,用于根据本次采集时所述备选用户的成长指数进行信息推送。
[0013]本专利技术实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述信息推送方法的步骤。
[0014]本专利技术实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述信息推送方法的步骤。
[0015]与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:
[0016]本专利技术实施例的方案中,按照第一预设时间步长采集文献数据,对于每次采集到的文献数据,计算确定得到每个备选用户的特征数据,并基于特征数据计算得到本次采集时的评价值,根据本次采集时的评价值、上一次采集时的评价值以及第一预设时间步长计算得到成长指数,由于成长指数可以表示评价值随时间的变化率,因此,得到的成长指数可以准确地表示预设时间范围内备选用户的文献数据等学术信息的变化情况,根据这一变化情况确定所要推送的信息可以避免失去时效性的文献数据对信息推送造成错误的影响,从而提高信息推送的准确性。
[0017]进一步,在计算评价值时,采用的特征数据包含每个备选用户的每篇文献的第一评价指数,本专利技术实施例的方案中根据多个备选用户的文献数据构建本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种信息推送方法,其特征在于,所述方法包括:按照第一预设时间步长采集目标数据集,所述目标数据集包括备选用户的文献数据;根据所述文献数据计算所述备选用户的特征数据,将所述备选用户的特征数据输入训练后的网络模型,以得到所述备选用户的评价值,所述训练后的网络模型是通过将多个用户样本的特征数据及其评价值作为训练数据,对预设的网络模型进行训练得到的;根据本次采集时所述备选用户的评价值、上一次采集时所述备选用户的评价值以及所述第一预设时间步长,计算确定本次采集时所述备选用户的评价值随时间的变化率,以得到本次采集时所述备选用户的成长指数;根据本次采集时所述备选用户的成长指数进行信息推送。2.根据权利要求1所述的信息推送方法,其特征在于,所述特征数据包括每篇文献的第一评价指数,文献的第一评价指数的计算方法包括:从所述文献数据中提取各篇文献之间的引用关系,并根据各篇文献之间的引用关系确定引用网络,所述引用网络包括多个节点以及节点之间的连接线,所述节点表示文献,所述连接线表示文献之间具有引用关系;确定中心迭代节点;在所述引用网络中确定与所述中心迭代节点具有引用关系的引用节点,并根据引用节点所引用的节点数量将所述引用节点的权重分配给所述中心迭代节点的权重;迭代地在所述引用网络中确定与上一次迭代中确定的引用节点具有引用关系的引用节点,并根据本次迭代确定的引用节点所引用的节点数量将所述引用节点的权重分配给其引用的节点的权重,将所述上一次迭代中确定的权重发生变化的引用节点的权重变化值分配给其引用的节点的权重,当迭代次数达到预设值,或者所述中心迭代节点的权重变化值落入预设数值范围时,所述中心迭代节点的权重即为所述中心迭代节点对应文献的第一评价指数。3.根据所述权利要求1所述的信息推送方法,其特征在于,所述特征数据包括第二评价指数,所述第二评价指数的计算方法包括:根据所述文献数据提取用户的发表文献数据以及引用文献数据,所述用户为所述备选用户或所述用户样本,所述发表文献数据包括发表的文献数量,所述引用文献数据包括引用文献数量;至少根据所述发表文献数据以及所述引用文献数据计算确定所述用户的第二评价指数。4.根据权利要求1所述的信息推送方法,其特征在于,根据所述文献数据计算所述备选用户的特征数据之前,所述方法还包括:计算同名的备选用户的文献数据之间的主题相似度;如果所述主题相似度小于第一预设阈值,则确定所述同名的备选用户的文献数据在同一时间段内出现同名机构的比例;如果所述在同一时间段内出现同名机构的比例大于第二预设阈值,则确定所述同名的备选用户的文献数据在所述同一时间段以及同一机构内合作用户相同的比例;如果在所述同一时间段以及同一机构内合作用户相同的比例大于第三预设阈值,则确定所述同名的备选...
【专利技术属性】
技术研发人员:谷俊,江明,李永智,
申请(专利权)人:上海柏观数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。