System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及文献数据处理领域,具体地,涉及一种用于交叉学科的规律分析方法及装置。
技术介绍
1、新工科是工程教育用于解决重大战略与科学技术发展的重大需求问题,培养和造就一大批复合型、创新型的工程技术人才。其关键要求包括发展交叉学科和改革传统学科。在此背景下,交叉学科文献发现成为研究交叉学科领域的重要一环,它有助于科研人员快速定位到融合多个学科知识和方法的文献资源。
2、虽然部分文献对学科交叉方式有所关注,但鲜有分析出具有科学依据的学科交叉规律。
技术实现思路
1、为了解决现有技术中存在的上述问题,本专利技术提供了一种用于交叉学科的规律分析方法及装置。
2、识别预处理后的文献数据集中的交叉学科文献;其中,所述文献数据集包括文献及所述文献对应的学科类别标签,所述学科类别标签表征所述文献的所属学科类别,所述交叉学科文献为所属学科类别的数量为两个及以上的文献;
3、对所述交叉学科文献进行科研实体识别,得到各个所述交叉学科文献对应的研究问题和研究方法;
4、根据聚类算法分别对各个所述交叉学科文献对应的研究问题和研究方法进行聚类,得到研究问题方向集合和研究方法方向集合;
5、根据所述研究问题方向集合和所述研究方法方向集合分别和对应的交叉学科文献的所属学科类别合并,得到布尔型数据;
6、对所述布尔型数据进行处理,得到多条关联规则;
7、根据所述多条关联规则分别计算对应的时序置信度指标,当所述时序置信度指标大于置
8、可选地,在所述根据所述多条关联规则分别计算对应的时序置信度指标,当所述时序置信度指标大于置信度阈值时,判定对应的关联规则为目标交叉学科规律,并对所述目标交叉学科规律进行分析之后,所述方法还包括:
9、根据各个所述交叉学科文献的发表年份,得到由发表年份相同的交叉学科文献对应的目标交叉学科规律组成的多个学科交叉规律集合;
10、根据不同发表年份对应的学科交叉规律集合构建不同发表年份对应的知识子图谱;
11、将每个所述知识子图谱组合,得到知识图谱。
12、可选地,在识别所述文献数据集中的交叉学科文献,得到交叉学科文献之前,所述方法还包括:
13、采集所述文献数据集;
14、对所述文献数据集进行规范化处理,得到格式统一的所述文献数据集;
15、利用正则表达式对格式统一的所述文献数据集进行处理,得到预处理后的所述文献数据集。
16、可选地,所述识别预处理后的文献数据集中的交叉学科文献,包括:
17、利用词向量对预处理后的所述文献数据集中的文献摘要进行处理,得到处理后的文献摘要词向量;
18、将处理后的所述文献摘要词向量和所述学科类别标签输入训练好的多分类模型,得到预处理后的所述文献数据集中各个文献对各个学科类别标签的隶属概率;其中,所述隶属概率表征所述文献隶属于各个学科类别标签的概率;
19、根据所述隶属概率识别预处理后的文献数据集中的交叉学科文献。
20、可选地,所述文献数据集还包括文献标题列和文献关键词;所述对所述交叉学科文献进行科研实体识别,得到所述交叉学科文献中各个交叉学科文献对应的研究问题和研究方法,包括:
21、利用正则表达式对所述交叉学科文献的文献标题列进行处理,得到所述交叉学科文献对应的研究问题;
22、对所述交叉学科文献的文献关键词进行词向量转换后,得到转换后的所述文献关键词;
23、计算转换后的所述文献关键词与所述交叉学科文献对应的研究问题之间的余弦相似度,去除所述余弦相似度大于预设阈值的文献关键词,得到剩余文献关键词;
24、根据所述剩余文献关键词得到所述交叉学科文献对应的研究方法。
25、可选地,所述根据聚类算法分别对各个所述交叉学科文献对应的研究问题和研究方法进行聚类,得到研究问题方向集合和研究方法方向集合,包括:
26、利用聚类算法分别对各个所述交叉学科文献对应的研究问题和研究方法进行聚类,得到多个问题聚类中心和多个方法聚类中心;
27、根据所述多个问题聚类中心得到主要研究问题集合,根据所述多个方法聚类中心得到主要研究方法集合;
28、计算其余研究问题与所述主要研究问题集合之间的第一隶属度,并计算其余研究方法与所述主要研究方法集合之间的第二隶属度;
29、将所述第一隶属度大于第一隶属度阈值的其余研究问题和所述主要研究问题集合作为所述研究问题方向集合;
30、将所述第二隶属度大于第二隶属度阈值的其余研究方法和所述主要研究方法集合作为所述研究方法方向集合。
31、可选地,所述对所述布尔型数据进行处理,得到多条关联规则,包括:
32、根据所述布尔型数据,获取频繁项集;
33、根据所述频繁项集求解得到所述多条关联规则;其中,每条所述关联规则均包括前项、后项和关联指标,所述前项包括对应的交叉学科文献的研究方向,所述后项包括对应的交叉学科文献的所属学科类别,所述关联指标表征对应的交叉学科文献的学科交叉规律情况。
34、可选地,所述根据所述多条关联规则分别计算对应的时序置信度指标,当所述时序置信度指标大于置信度阈值时,判定对应的关联规则为目标交叉学科规律,并对所述目标交叉学科规律进行分析,包括:
35、根据所述多条关联规则各自的提升度、稳定度和影响衰减,计算对应的时序置信度指标;
36、当所述时序置信度指标大于置信度阈值时,判定对应的关联规则为目标交叉学科规律;
37、对所述目标交叉学科规律进行分析,以得到学科交叉的发展规律。
38、可选地,所述时序置信度指标表示如下:
39、;
40、其中,表示第年的关联规则对应的时序置信度指标,表示所述第年的关联规则对应的提升度,表示所述第年的关联规则的稳定度,表征所述第年的关联规则的稳定度对提升度的影响衰减。
41、根据本专利技术实施例的第二方面,提供一种用于交叉学科的规律分析装置,所述装置包括:
42、文献识别模块,用于识别预处理后的文献数据集中的交叉学科文献;其中,所述文献数据集包括文献及所述文献对应的学科类别标签,所述学科类别标签表征所述文献的所属学科类别,所述交叉学科文献为所属学科类别的数量为两个及以上的文献;
43、实体识别模块,用于对所述交叉学科文献进行科研实体识别,得到各个所述交叉学科文献对应的研究问题和研究方法;
44、聚类模块,用于根据聚类算法分别对各个所述交叉学科文献对应的研究问题和研究方法进行聚类,得到研究问题方向集合和研究方法方向集合;
45、合并模块,用于根据所述研究问题方向集合和所述研究方法方向集合分别和对应的交叉学科文献的所属学科类别合本文档来自技高网...
【技术保护点】
1.一种用于交叉学科的规律分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,在所述根据所述多条关联规则分别计算对应的时序置信度指标,当所述时序置信度指标大于置信度阈值时,判定对应的关联规则为目标交叉学科规律,并对所述目标交叉学科规律进行分析之后,所述方法还包括:
3.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,在识别所述文献数据集中的交叉学科文献,得到交叉学科文献之前,所述方法还包括:
4.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,所述识别预处理后的文献数据集中的交叉学科文献,包括:
5.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,所述文献数据集还包括文献标题列和文献关键词;所述对所述交叉学科文献进行科研实体识别,得到所述交叉学科文献中各个交叉学科文献对应的研究问题和研究方法,包括:
6.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,所述根据聚类算法分别对各个所述交叉学科文献对应的研究问题和研究方法进行聚类
7.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,所述对所述布尔型数据进行处理,得到多条关联规则,包括:
8.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,所述根据所述多条关联规则分别计算对应的时序置信度指标,当所述时序置信度指标大于置信度阈值时,判定对应的关联规则为目标交叉学科规律,并对所述目标交叉学科规律进行分析,包括:
9.根据权利要求8所述的用于交叉学科的规律分析方法,其特征在于,所述时序置信度指标表示如下
10.一种用于交叉学科的规律分析装置,其特征在于,所述装置包括:
...【技术特征摘要】
1.一种用于交叉学科的规律分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,在所述根据所述多条关联规则分别计算对应的时序置信度指标,当所述时序置信度指标大于置信度阈值时,判定对应的关联规则为目标交叉学科规律,并对所述目标交叉学科规律进行分析之后,所述方法还包括:
3.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,在识别所述文献数据集中的交叉学科文献,得到交叉学科文献之前,所述方法还包括:
4.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,所述识别预处理后的文献数据集中的交叉学科文献,包括:
5.根据权利要求1所述的用于交叉学科的规律分析方法,其特征在于,所述文献数据集还包括文献标题列和文献关键词;所述对所述交叉学科文献进行科研实体识别,得到所述交叉学科文献中各个交叉...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。