System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于科研大数据预测的可视化推荐系统及方法技术方案_技高网

基于科研大数据预测的可视化推荐系统及方法技术方案

技术编号:40376201 阅读:18 留言:0更新日期:2024-02-20 22:16
本发明专利技术提供一种基于科研大数据预测的可视化推荐系统及方法。本发明专利技术面向目标对象针对性整合科研大数据,从中提取与所述目标对象的研究能力发展趋势具备时间相关性的预测特征序列;进而基于训练优化的预测模型,获得所述目标对象研究能力发展趋势的量化表征;根据量化表征,在可视化交互界面上显示针对目标对象的推荐信息。本发明专利技术为用户对科研信息的分析运用提供了带有预测性的指引和参考,提升了科研数据库及其可视化检索分析工具等产品的准确性和易用性。

【技术实现步骤摘要】

本专利技术涉及大数据分析和预测,特别涉及一种基于科研大数据预测的可视化推荐系统及方法


技术介绍

1、当前,基于大数据分析进行目标对象相关的趋势预测,已经成为一种重要的技术手段,其基本原理是通过收集、清洗、整合大量的数据,从数据中提取出目标对象的多维度特征,并根据特征的重要性和时间相关性从中选择最能够反映趋势变化的特征作为预测特征,进而选择合适的预测模型,在基于历史数据完成模型训练和优化基础上,对形成了可靠预测能力的模型导入以上预测特征,实现趋势预测。以上大数据分析基础上的趋势预测,可以应用于各个领域。基于预测能够向用户推荐更有针对性和前瞻性的信息,从而便于用户的决策。例如,在电子商务平台,通过分析历史销售数据、用户搜索和浏览产品数据等,可以预测未来一定时段的用户更为关注的商品,推荐给商户进行生产、库存等方面的计划。在社交网络中,通过分析社交媒体数据、用户行为数据,可以预测用户的兴趣话题,以便进行个性化内容推荐。

2、科研大数据是在论文、专利、学术会议报告、研究报告等对象中包含的数据信息,包括这些对象的正文内容,也包括作者或专利技术人、单位、引用记录、被引用记录、摘要、关键词、所属领域、发表时间、期刊名、会议名等标引字段的信息。科研大数据是非常重要的数据资源,可以用于判断某一学科的研究热点、发展趋势和前沿方向,了解了解某一科研机构及其涵盖各个学科的发展状况,揭示科研机构及其研究者之间的学术合作关系网络,实现学术资源的管理和推荐。

3、为了便于对科研大数据的检索、查阅、摘引、注释、分类、管理以及分析,目前存在一些专门性的数据库和相关工具,例如学术搜索引擎、学术数据分析平台、科研数据可视化工具等。以上数据库和工具提供了关键词搜索、作者搜索、引证关系追踪、排序展示和推荐、数据统计和分析可视化等方面的功能。

4、但是,以上针对科研大数据的数据库和相关工具,在基于科研大数据实现对象研究能力发展趋势的预测,以及基于以上预测进行推荐的方面,仍然存在比较大的空白。具体来说,一方面,特定对象的研究能力发展趋势,特别是对于某些领域新且发展快的细分学科而言,具有比较强的动态变化性,受到该特定对象在具体细分学科研发能力的内在积累、外在输出以及全学科整体作用的综合影响。传统的指标维度和统计评估方法,主要依靠发表数量、引用和被引用次数等少数现有指标,只能表征特定对象在细分学科的研发能力现状,对未来发展趋势的预测性不足。另一方面,现有的科研数据库和工具在排序展示推荐的功能上,主要是依据用户查询关键词与科研信息的匹配程度、引证和被引证频次、时间因素、科研机构的学术排名等因素计算排名顺序和推荐优先级的,而没有将对象研究能力发展趋势预测纳入排序和推荐的考虑范畴。


技术实现思路

1、针对现有技术中存在的不足,本专利技术提供了一种基于科研大数据预测的可视化推荐系统及方法。本专利技术面向目标对象针对性整合科研大数据,从中提取与所述目标对象的研究能力发展趋势具备时间相关性的预测特征序列;进而基于训练优化的预测模型,获得所述目标对象研究能力发展趋势的量化表征;根据量化表征,在可视化交互界面上显示针对目标对象的推荐信息。

2、本专利技术提供的一种基于科研大数据预测的可视化推荐系统,其特征在于,包括:

3、用户查询接口,用于提供可视化交互界面,通过所述可视化交互界面接收用户输入的查询条件,解析所述查询条件形成查询请求数据;

4、数据检索汇集单元,用于在存储科研大数据的数据库中利用所述查询请求数据进行检索,并以目标对象为单位汇集检索命中的科研数据信息,形成与目标对象相对应的对象数据集,所述对象数据集包含目标对象在一个或多个细分学科上的科研数据信息;

5、预测特征序列建立模块,用于针对所述目标对象,通过统计对应的对象数据集中包含的科研数据信息,获得所述目标对象在一个或多个细分学科的分布特征;并判断所述分布特征与所述目标对象的研究能力发展趋势的时间相关性,根据时间相关性强度确定所述目标对象的研究能力发展趋势的预测特征;进而根据所述预测特征在时间维度上的分布,建立所述目标对象的研究能力发展趋势的预测特征序列;

6、量化预测模块,用于将所述目标对象的预测特征序列输入训练优化后的预测模型,获得所述目标对象研究能力发展趋势的量化表征字段;所述预测模型是以训练集中包含的样本对象的预测特征序列和量化表征字段执行训练优化后获得的神经网络模型;

7、可视化推荐模块,用于根据所述目标对象研究能力发展趋势的量化表征字段,在可视化交互界面上显示针对目标对象的推荐信息。

8、优选的是,所述预测特征序列建立模块利用多元回归分析方法、主成分分析方法、基于模型的l1正则化方法中的至少一种,判断所述分布特征与所述目标对象的研究能力发展趋势的时间相关性,根据时间相关性强度确定所述目标对象的研究能力发展趋势的预测特征。

9、优选的是,所述预测特征序列建立模块将所述预测特征在时间维度上的分布表示为:;

10、其中表示第一预测特征在时间维度上的分布,表示第二预测特征在时间维度上的分布,表示第一预测特征相对于第二预测特征的权重比例系数在时间维度上的分布。

11、优选的是,所述量化预测模块的所述预测模型包括序列特征编码器和字段特征编码器,所述序列特征编码器和字段特征编码器均采用resnet神经网络。

12、优选的是,所述序列特征编码器表示为,其中为所述预测特征序列,为该序列特征编码器的resnet神经网络的全部网络参数构成的参数向量。

13、优选的是,所述字段特征编码器表示为,其中为表示目标对象细分学科研究能力发展趋势的量化表征字段,为该字段特征编码器的resnet神经网络的全部参数构成的参数向量。

14、优选的是,所述训练集中样本对象的预测特征序列和量化表征字段表示为;其中为预测特征序列的序列元素,为以上预测特征序列的序列元素各自对应的量化表征字段。

15、优选的是,量化预测模块在训练所述预测模型的过程中,将训练集随机划分为大小为的多个子集,其中子集数;这里第个子集;进行多轮训练,每轮训练依次采用一个子集;对于第个子集,将其中每个输入序列特征编码器,每个输入字段特征编码器,获得的特征编码以及的特征编码;和分别表示本轮训练时序列特征编码器和字段特征编码器的参数向量;进而,利用第个子集中的每个和所得的特征编码,形成2组特征编码序列, ;再对以上2组特征编码序列进行线性投影和归一化:

16、这里和表示本轮训练时线性投影矩阵的参数和,函数表示把一个矩阵进行归一化;通过以上特征编码序列和的相似度,构建训练所述预测模型的损失函数如下:

17、

18、这里,是余弦相似度矩阵的第个元素,该矩阵为:

19、其中是预先设定值的超参数;计算损失函数相对于序列特征编码器、字段特征编码器以及线性投影矩阵的全部参数的梯度:

20、这里表示所有参数组成的参数向量;进而,基于该梯度更新下一轮训练中本文档来自技高网...

【技术保护点】

1.一种基于科研大数据预测的可视化推荐系统,其特征在于,包括:

2.根据权利要求1所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述预测特征序列建立模块利用多元回归分析方法、主成分分析方法、基于模型的L1正则化方法中的至少一种,判断所述分布特征与所述目标对象的研究能力发展趋势的时间相关性,根据时间相关性强度确定所述目标对象的研究能力发展趋势的预测特征。

3.根据权利要求2所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述预测特征序列建立模块将所述预测特征在时间维度上的分布表示为:

4.根据权利要求3所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述量化预测模块的所述预测模型包括序列特征编码器和字段特征编码器,所述序列特征编码器和字段特征编码器均采用ResNet神经网络。

5.根据权利要求4所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述序列特征编码器表示为,其中为所述预测特征序列,为该序列特征编码器的ResNet神经网络的全部网络参数构成的参数向量。

6.根据权利要求5所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述字段特征编码器表示为,其中为表示目标对象细分学科研究能力发展趋势的量化表征字段,为该字段特征编码器的ResNet神经网络的全部参数构成的参数向量。

7.根据权利要求6所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述训练集中样本对象的预测特征序列和量化表征字段表示为;其中为预测特征序列的序列元素,为以上预测特征序列的序列元素各自对应的量化表征字段。

8.根据权利要求7所述的基于科研大数据预测的可视化推荐系统,其特征在于,量化预测模块在训练所述预测模型的过程中,将训练集随机划分为大小为的多个子集,其中子集数;这里第个子集;进行多轮训练,每轮训练依次采用一个子集;对于第个子集,将其中每个输入序列特征编码器,每个输入字段特征编码器,获得的特征编码以及的特征编码;和分别表示本轮训练时序列特征编码器和字段特征编码器的参数向量;进而,利用第个子集中的每个和所得的特征编码,形成2组特征编码序列, ;再对以上2组特征编码序列进行线性投影和归一化:

9.根据权利要求8所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述量化预测模块将目标对象研究能力发展趋势的量化表征字段模板,输入训练好的字段特征编码器并通过参数的线性投影形成特征编码序列;该量化表征字段模板包含优势学科、传统学科、潜力学科、弱势学科的字段;量化预测模块将预测特征序列建立模块建立的所述目标对象的研究能力发展趋势的预测特征序列输入训练好的序列特征编码器并通过参数的线性投影形成特征编码;量化预测模块基于以上特征编码和特征编码序列相互求内积,确定序列中与特征编码内积值最大的特征编码,则将所述目标对象的研究能力发展趋势识别为特征编码序列中该内积值最大的特征编码对应的字段。

10.一种基于科研大数据预测的可视化推荐方法,其特征在于,包括:

...

【技术特征摘要】

1.一种基于科研大数据预测的可视化推荐系统,其特征在于,包括:

2.根据权利要求1所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述预测特征序列建立模块利用多元回归分析方法、主成分分析方法、基于模型的l1正则化方法中的至少一种,判断所述分布特征与所述目标对象的研究能力发展趋势的时间相关性,根据时间相关性强度确定所述目标对象的研究能力发展趋势的预测特征。

3.根据权利要求2所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述预测特征序列建立模块将所述预测特征在时间维度上的分布表示为:

4.根据权利要求3所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述量化预测模块的所述预测模型包括序列特征编码器和字段特征编码器,所述序列特征编码器和字段特征编码器均采用resnet神经网络。

5.根据权利要求4所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述序列特征编码器表示为,其中为所述预测特征序列,为该序列特征编码器的resnet神经网络的全部网络参数构成的参数向量。

6.根据权利要求5所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述字段特征编码器表示为,其中为表示目标对象细分学科研究能力发展趋势的量化表征字段,为该字段特征编码器的resnet神经网络的全部参数构成的参数向量。

7.根据权利要求6所述的基于科研大数据预测的可视化推荐系统,其特征在于,所述训练集中样本对象的预测特征序...

【专利技术属性】
技术研发人员:杨代庆王璐
申请(专利权)人:中国科学技术信息研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1