本发明专利技术提供一种基于关键词共现的研究热点边连通度分析方法,包括如下步骤:a.从文献数据库DB中获取若干候选关键词n1,n2,n3,……,nm的步骤;b.根据上述关键词ni在文献数据库DB中所有文献中的权重确定该关键词ni的权值wi的步骤;c.构建各关键词的无向赋权图G的步骤;d.将无向赋权图G转化为有向赋权图D并进行运算的步骤;e.根据有向赋权图D来求取研究热点关键词的步骤。采用本发明专利技术的方法分析出的关键词能覆盖本领域所需讨论的关键技术问题,能够提炼出有待挖掘的研究热点,作为科技预测、发现新的学科增长点的突破口,从而推动学科的进步和发展。本发明专利技术的方法适用于文献知识分析管理技术领域,也同样适用于科学研究领域。
【技术实现步骤摘要】
本专利技术涉及一种文献知识分析管理
,特别涉及一种。
技术介绍
最近几年来,人们对文献管理的研究不断深入,研究的范围不断扩大,文献中标示的关键词范围越来越广,数量越来越多。文献中的关键词是
技术实现思路
的提示符,是作者学术思想及学术观点的凝炼,也是文献计量研究的重要指标。同时,有些关键词常常共同出现, 两个或更多关键词在同一篇文献中同时出现的现象,人们称之为关键词共现。关键词共现分析是文献计量学常用的一种重要的量化研究方法,这种方法以文献的关键词为基础,通过描述关键词与关键词之间的关联与结合,提示某一领域学术研究内容的内在相关性和学科领域的微观结构人们通过关键词的共现分析来了解学科的发展动态和发展趋势。某些关键词频频共现,说明这些关键词所反映的学科领域正在蓬勃发展,而且二关键词关系密切,人们通过比较不同时期共现的关键词便可获得关于学科发展、交叉、渗透和兴衰的趋势的相关知识。因此,基于关键词共现对现阶段学术界研究热点的分析,对把握学科的发展动态和发展趋势,具有重要的意义。例如,某一时期发现某一学科有相当一部分科学家的论文显示某两个或更多术语频频共现,便认为这种共现展示了该学科的一个新的蓬勃发展的研究领域。基于关键词共现分析还可以用于科技预测,发现新的学科增长点和突破口。例如,如果有文献研究表明术语A与术语B之间存在较强的共现关系,术语A与术语C之间也存在较强的共现关系,那么,可以推测术语B和术语C之间也可能存在某种关联,通过揭示术语 B和术语C之间的关系便有可能导致科学上的某种创新性发现。现阶段基于关键词共现进行研究热点分析的方法主要采用观察值矩阵表面分析, 这种分析方法通常只研究观察值矩阵所对应网络图的关联度,其分析的关键词局限于文献所列出的3-5个关键词,通常不能全面反应全文的综合内容及创新观点。并且该方法在关键词共现的分析过程中,往往通过出现频次来定义关键词共现权重,并绘制简单的图标进行表示,对关键词之间的关联度研究分析达不到所想要的结果;分析出的关键词并未能覆盖本领域所需讨论的关键技术问题,难以提炼出有待挖掘的研究热点,更难以通过这种方法来展示学科的发展动态和发展趋势。
技术实现思路
为了解决上述技术问题,本专利技术提供一种,在文献数据库DB中的每篇文献中提取若干个关键词,其关键词并不局限于文献自身提供的关键词,再对关键词进行权重分析,结合基于赋权图的边连通度的关键词共现分析算法,得到研究热点关键词。本专利技术采用的技术解决方案是,一种,包括如下步骤 a.从文献数据库DB中获取若干候选关键词Ii1, n2, n3,……,nffl的步骤;b.根据上述关键词Iii在文献数据库DB中所有文献中的权重确定该关键词Iii的权值Wi的步骤;c.构建各关键词的无向赋权图G的步骤d.将无向赋权图G转化为有向赋权图D并进行运算的步骤e.根据有向赋权图D来求取研究热点关键词的步骤。进一步的,所述步骤a.从文献数据库DB中获取若干候选关键词ηι,η2,η3,……, nm的步骤,包括al.从需要进行研究热点分析的文献数据库中选取每篇文献的若干关键词;a2.计算每个关键词在文献数据库中的所有文献中出现的频次;a3.取频次从高到低排列的前m个关键词,依次记为叫,n2, n3,……,nm。更进一步的,所述步骤al.从需要进行研究热点分析的文献数据库中选取每篇文献的若干关键词,其方法是根据语义分析检索引擎选取每篇文献的若干关键词。进一步的,所述步骤b.根据上述关键词Iii在文献数据库DB中所有文献中的权重确定该关键词Ili的权值的步骤,包括bl.根据语义分析检索引擎计算出关键词Iii在语义分析检索引擎中的权重值,权重值介于0到255之间;b 2 .计算所述的该关键词η i的权值为巧=255_关_在语义分析搜索引擎中酸重值,此时关键词n的权值介于ο到2· 55之间。m进一步的,所述步骤C.构建各关键词的无向赋权图G的步骤包括cl.建立关键词点集为In1, n2, n3,……nj,点权值集为Iw1, w2, W3,……wm};c2.若两个关键词Iii和Iij在文献数据库DB的同一文献中共现,则该两个关键词Iii 和~为赋权图中的一条边rw并以该两个关键词共现的文献数量作为边的权值Wij。进一步的,所述步骤d.将无向赋权图G转化为有向赋权图D并进行运算的步骤包括dl.计算有向赋权图D中点Iii到其他所有顶点的边不交的路的数目最大值Ici ;d2.再计算出 IiiWi。更进一步的,所述步骤dl.计算有向赋权图D中点Iii到其他所有顶点的边不交的路的数目最大值其详细步骤是dll.设Iii和η」为无向赋权图G的两个不同顶点;dl2.将无向赋权图G转化成有向赋权图D,并取零流;dl3.扩大含Iii的树T,并寻找fir可扩路;dl4.运用最大流最小割定理计算出两顶点Iii和η」之间的最大流值val (fu), val (f.j)则为点Iii到点~的边不交的路的数目最大值;mdl5.计算点IIi到其他所有顶点的边不交的路的数目最大值η^χνα/α),记为&。进一步的,所述步骤e.根据有向赋权图D来求取研究热点关键词的步骤,包括在有向赋权图D中,计算出满足尽义= Itiax^;.的点nt。z'=l进一步的,所述步骤a 3、步骤b2和步骤cl中的m彡2。优选的,所述的m = 100。选取m = 100个关键词,既能保证所选取的关键词能够覆盖本领域所需讨论的关键技术问题,且能够保证计算机进行数据处理时快速有效。本专利技术提供一种,在文献数据库DB 中的每篇文献中提取若干个关键词,其关键词并不局限于文献自身提供的关键词,再对关键词进行权重分析,结合基于赋权图的边连通度的关键词共现分析算法,得到研究热点关键词。分析出的关键词能覆盖本领域所需讨论的关键技术问题,能够提炼出有待挖掘的研究热点,作为科技预测、发现新的学科增长点的突破口,从而推动学科的进步和发展。本专利技术的方法适用于文献知识分析管理
,也同样适用于科学研究领域。附图说明图1是本专利技术实施例的流程示意图;图2是本专利技术实施例的步骤41算法的软件实现流程。具体实施例方式现结合附图和具体实施方式对本专利技术进一步说明。下面实施中将主要以Autonomy软件为例进行说明,Autonomy是基于语义计算 (MBC)的,以之为例是因为Autonomy是该领域公认的领导者,并且在商业应用领域中名声煊赫,在政府、国防、新闻、金融、电信、教育等领域拥有大量中坚客户;但是,从理论上来说, 用其它的相似功能的软件或者方式也是可以的,具体需要实现何种功能或者达到何种效果,相应的实施例中也将给具体说明,因此,Autonomy软件为例仅用于教导本领域技术人员具体如何实施本专利技术,但不意味仅能使用Autonomy软件,实施过程中可以结合实践需要来确定相应的软件或者方式。图1是本专利技术实施例的流程示意图,如图所示,包括如下步骤步骤1.从文献数据库DB中获取若干候选关键词ηι,η2,η3,……,nm的步骤,其中, 步骤1具体包括步骤11.运用Autonomy软件从需要进行研究热点分析的文献数据库中选取每篇文献的若干关键词;步骤12.计算每个关键词在文献数据库中的所有文献中出现的频次;步骤13.取频次从高到低排列的前m个关键词,依次本文档来自技高网...
【技术保护点】
1.一种基于关键词共现的研究热点边连通度分析方法,其特征在于,包括如下步骤:a.从文献数据库DB中获取若干候选关键词n1,n2,n3,……,nm的步骤;b.根据上述关键词ni在文献数据库DB中所有文献中的权重确定该关键词ni的权值wi的步骤;c.构建各关键词的无向赋权图G的步骤;d.将无向赋权图G转化为有向赋权图D并进行运算的步骤;e.根据有向赋权图D来求取研究热点关键词的步骤。
【技术特征摘要】
【专利技术属性】
技术研发人员:缪惠芳,郑剑香,吴一纯,蔡岗全,陈少敏,
申请(专利权)人:厦门大学,
类型:发明
国别省市:92
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。