语义脑图实时表达系统及其操作方法技术方案

技术编号:16153047 阅读:36 留言:0更新日期:2017-09-06 18:22
本发明专利技术公开了一种语义脑图实时表达系统及其操作方法,该系统包括关联矩阵、聚焦关联操作模块,关联矩阵与聚焦关联操作模块相连,其中:关联矩阵包括起点节点、直接关联模块、间接关联模块、弱关联模块、角标模块等,聚焦关联操作模块包括聚焦节点、聚焦关联节点等。本发明专利技术应用于搜索引擎包括跨库搜索引擎时,是对搜索结果服务界面的扩充,用以实时帮助用户更好地鉴别和发现相关兴趣文献。

【技术实现步骤摘要】
语义脑图实时表达系统及其操作方法
本专利技术涉及一种表达系统及其操作方法,特别是涉及一种语义脑图实时表达系统及其操作方法。
技术介绍
就文献搜索引擎而言,通常是依据搜索提问给出一组相关文献列表。也有不少搜索引擎在文献检出结果中,试图对文献的某些特征进一步细分和聚类(比如将搜索结果按年代细分聚类或者按作者细分聚类等等),以帮助用户更好地区分和识别相关兴趣文献。现有的搜索结果呈现模式缺乏实时深层次地揭示文献中文本信息之间的复杂语义网络关系的手段,也不能够同时揭示这些相关文本信息之间的共现文献指引。
技术实现思路
本专利技术所要解决的技术问题是提供一种语义脑图实时表达系统及其操作方法,其能够以文献中的文本特征词构建一个m行乘n列关联矩阵,并在此关联矩阵基础上,揭示文本信息之间多层次的语义网络关系,以及揭示相关文本信息之间的共现文献指引;本专利技术应用于搜索引擎包括跨库搜索引擎时,是对搜索结果服务界面的扩充,用以实时帮助用户更好地鉴别和发现相关兴趣文献。本专利技术是通过下述技术方案来解决上述技术问题的:一种语义脑图实时表达系统,其包括:关联矩阵,与聚焦关联操作模块相连,关联矩阵包括起点节点、直接关联模块、间接关联模块、弱关联模块、角标模块,其中:起点节点,与直接关联模块相连,在一个显示界面上用于标注关联矩阵左侧第一列,可以是1到m个文本特征词,初始值可以是用户的搜索提问词,m为自然数;直接关联模块,与间接关联模块相连,用于标注关联矩阵中起点节点右侧后续各列中与起点节点文本特征词有文本同句共现关系的节点;间接关联模块,与弱关联模块相连,用于标注关联矩阵中各直接关联节点右侧后续各列中与前期任一直接关联节点文本特征词有文本同句共现关系的未标注节点;弱关联模块,与角标模块相连,用于标注关联矩阵各间接关联节点右侧后续各列中与间接关联节点文本特征词有同句共现关系的未标注节点,或者用于减少层级复杂性而将关联矩阵中的全部剩余未标注节点;角标模块,赋予关联矩阵中的各个节点右上角角标,用于标注该节点在当前搜索结果子集中的相关联文献数;聚焦关联操作模块,其包括聚焦节点、聚焦关联节点,其中:聚焦节点,用于选取关联矩阵任意节点,使之成为当前聚焦节点;聚焦关联节点,与聚焦节点相连,用于标注关联矩阵各列中所有与聚焦节点文本特征词有同句或同篇共现关系的节点。优选地,所述赋予聚焦关联节点的左上角数字角标,标注当前聚焦相关节点基于聚焦节点的文本特征词同篇共现文献数;赋予聚焦关联节点的左下角数字角标,标注当前聚焦相关节点基于聚焦节点的文本特征词同句共现的句子数。优选地,所述关联矩阵受屏幕界面显示面积的物理限制,关联矩阵表现为一个m行乘n列关联矩阵阵列显示,关联矩阵中的各个节点是从搜索文本文献中分解提取的文本特征词,n为自然数。本专利技术还提供一种语义脑图实时表达系统的操作方法,其包括以下步骤:步骤九十,获取语义脑图实时数据源;步骤九十一,提取语义脑图文本特征词;步骤九十二,构成语义脑图的关联矩阵基本数据;步骤九十三,对语义脑图的呈现及表达;步骤九十四,对语义脑图中聚焦节点操作;步骤九十五,对语义脑图中文献揭示操作;步骤九十六,重构语义脑图;其中:步骤九十包括以下步骤:步骤一,在文献搜索过程中,实时截获当前文献搜索结果的前若干篇文献,也就是动态获得与读者提问相关的Top-N篇文献;步骤二,截获内容包括每篇文献的文献篇名、文献摘要、甚至扩展到文献全文的文本信息;步骤九十一包括以下步骤:步骤十,文本信息的预处理,以句子为单位进行文本切分,获得句子中一连串的自由词或自由词组片段;步骤十一,取自由词或自由词组片段的词干模式为文本特征信息;由此,每一文本句子转换为一组文本特征词串;每一文本句子依据其文献在搜索结果中的权重,以及在当前文献中的位置赋予一定的经验权重;步骤九十二是对一个知识发现数据发散的过程,其包括以下步骤:步骤二十,将语义脑图的基本数据集定义为一个m行乘n列的关联矩阵;步骤二十一,将读者搜索提问的文本特征词作为语义脑图的左侧第一列起始节点;步骤二十二,依据当前列中的现有文本特征词,在搜索结果的所有句子全集当中,搜索密切相关的文本特征词;步骤二十三,去重语义脑图关联矩阵中左侧中已经出现过的文本特征词;步骤二十四,依据所获取的新文本特征词的权重,取权值最高的m个文本特征词作为语义脑图新的一列;步骤二十五,重复步骤二十二至步骤二十四,直至完成全部n列数据;步骤九十三是对一个知识发现数据层级收敛的过程,其包括以下步骤:步骤三十,语义脑图的呈现是在语义脑图基本数据集m行乘n列的关联矩阵基础上,针对其中的每个节点元素分别赋予不同节点类型;节点类型包括起点节点、直接关联节点、间接关联节点、弱关联节点等四种节点类型;步骤三十一,语义脑图左侧第一列定义为当前语义脑图的起点节点;步骤三十二,将关联矩阵起点节点右侧后续各列中与起点节点文本特征词有文本同句共现关系的节点,标注为直接关联节点;步骤三十三,将关联矩阵各直接关联节点右侧后续各列中与前期任一直接关联节点文本特征词有文本同句共现关系的未标注节点,标注为间接关联节点;步骤三十四,将关联矩阵各间接关联节点右侧后续各列中与间接关联节点文本特征词有同句共现关系的未标注节点,标注为弱关联节点,为减少层级复杂性而将关联矩阵中的全部剩余未标注节点也标注为弱关联节点;步骤三十五,在关联矩阵各个节点右上角的角标处,标注该节点在当前搜索结果子集中的相关联文献数;步骤九十四是对一个知识联想发现过程,其包括以下步骤:步骤四十,选取关联矩阵中的任意一个语义节点,使之成为当前聚焦节点,以表示当前节点是用户选中的兴趣聚焦节点;步骤四十一,在语义脑图中计算该聚焦节点文本特征词的所有同句共现或同篇共现的节点词,标注为聚焦关联节点;步骤四十二,赋予所述聚焦关联节点的左上角数字角标,标注当前聚焦相关节点基于聚焦节点的文本特征词同篇共现文献数;步骤四十三,赋予所述聚焦关联节点的左下角数字角标,标注当前聚焦相关节点基于聚焦节点的文本特征词同句共现文献数;步骤九十五包括以下步骤:步骤五十,单击语义脑图关联矩阵中任意节点上角标数字,系统弹出窗口,显示该数字所链接的相关文献详细介绍;步骤五十一,在文献详情窗口,点击具体的任意一篇文献,则转跳到原始搜索引擎的具体文献显示页面;步骤九十六包括以下步骤:步骤六十,在当前语义脑图关联矩阵中拖拽任意语义节点词至核心词列的位置,则该语义节点词成为新的核心词;步骤六十一,语义脑图将以此新的核心词在原先文献搜索结果的基础上重构一幅新的语义脑图。本专利技术的积极进步效果在于:本专利技术能够通过关联矩阵的呈现模式能够揭示一个搜索主题下语义概念的扩展关联和多层次的语义网络关系,能够揭示关联矩阵中任一节点相互间的的直接联想关系,每个语义节点的不同角标能够揭示该节点在搜索结果中的相关文献数,揭示相关节点之间的同句或同篇共现文献数及其链接,关联矩阵列内语义节点保有语义权重的有序性。本专利技术应用于搜索引擎包括跨库搜索引擎时,是对搜索结果服务界面的扩充,以实时帮助用户更好地鉴别和启发相关兴趣文献。附图说明图1为本专利技术的结构示意图。图2为本专利技术显示界面的结构示意图。图3为本专利技术的聚焦节点的结构示意图。具体实施方式下面结合附图给出本专利技术较佳实施例,以详细说明本专利技术本文档来自技高网...
语义脑图实时表达系统及其操作方法

【技术保护点】
一种语义脑图实时表达系统,其特征在于,其包括:关联矩阵,与聚焦关联操作模块相连,关联矩阵包括起点节点、直接关联模块、间接关联模块、弱关联模块、角标模块,其中:起点节点,与直接关联模块相连,在一个显示界面上用于标注关联矩阵左侧第一列,是1到m个文本特征词,初始值是用户的搜索提问词,m为自然数;直接关联模块,与间接关联模块相连,用于标注关联矩阵中起点节点右侧后续各列中与起点节点文本特征词有文本同句共现关系的节点;间接关联模块,与弱关联模块相连,用于标注关联矩阵中各直接关联节点右侧后续各列中与前期任一直接关联节点文本特征词有文本同句共现关系的未标注节点;弱关联模块,与角标模块相连,用于标注关联矩阵各间接关联节点右侧后续各列中与间接关联节点文本特征词有同句共现关系的未标注节点,或者用于减少层级复杂性而将关联矩阵中的全部剩余未标注节点;角标模块,赋予关联矩阵中的各个节点右上角角标,用于标注该节点在当前搜索结果子集中的相关联文献数;聚焦关联操作模块,其包括聚焦节点、聚焦关联节点,其中:聚焦节点,用于选取关联矩阵任意节点,使之成为当前聚焦节点;聚焦关联节点,与聚焦节点相连,用于标注关联矩阵各列中所有与聚焦节点文本特征词有同句或同篇共现关系的节点。...

【技术特征摘要】
1.一种语义脑图实时表达系统,其特征在于,其包括:关联矩阵,与聚焦关联操作模块相连,关联矩阵包括起点节点、直接关联模块、间接关联模块、弱关联模块、角标模块,其中:起点节点,与直接关联模块相连,在一个显示界面上用于标注关联矩阵左侧第一列,是1到m个文本特征词,初始值是用户的搜索提问词,m为自然数;直接关联模块,与间接关联模块相连,用于标注关联矩阵中起点节点右侧后续各列中与起点节点文本特征词有文本同句共现关系的节点;间接关联模块,与弱关联模块相连,用于标注关联矩阵中各直接关联节点右侧后续各列中与前期任一直接关联节点文本特征词有文本同句共现关系的未标注节点;弱关联模块,与角标模块相连,用于标注关联矩阵各间接关联节点右侧后续各列中与间接关联节点文本特征词有同句共现关系的未标注节点,或者用于减少层级复杂性而将关联矩阵中的全部剩余未标注节点;角标模块,赋予关联矩阵中的各个节点右上角角标,用于标注该节点在当前搜索结果子集中的相关联文献数;聚焦关联操作模块,其包括聚焦节点、聚焦关联节点,其中:聚焦节点,用于选取关联矩阵任意节点,使之成为当前聚焦节点;聚焦关联节点,与聚焦节点相连,用于标注关联矩阵各列中所有与聚焦节点文本特征词有同句或同篇共现关系的节点。2.如权利要求1所述的语义脑图实时表达系统,其特征在于,所述赋予聚焦关联节点的左上角数字角标,标注当前聚焦相关节点基于聚焦节点的文本特征词同篇共现文献数;赋予聚焦关联节点的左下角数字角标,标注当前聚焦相关节点基于聚焦节点的文本特征词同句共现的句子数。3.如权利要求1所述的语义脑图实时表达系统,其特征在于,所述关联矩阵受屏幕界面显示面积的物理限制,关联矩阵表现为一个m行乘n列关联矩阵阵列显示,关联矩阵中的各个节点是从搜索文本文献中分解提取的文本特征词,n为自然数。4.一种语义脑图实时表达系统的操作方法,其特征在于,其包括以下步骤:步骤九十,获取语义脑图实时数据源;步骤九十一,提取语义脑图文本特征词;步骤九十二,构成语义脑图的关联矩阵基本数据;步骤九十三,对语义脑图的呈现及表达;步骤九十四,对语义脑图中聚焦节点操作;步骤九十五,对语义脑图中文献揭示操作;步骤九十六,重构语义脑图;其中:步骤九十包括以下步骤:步骤一,在文献搜索过程中,实时截获当前文献搜索结果的前若干篇文献,也就是动态获得与读者提问相关的Top-N篇文献;步骤二,截获内容包括每篇文献的文献篇名、文献摘要、甚至扩展到文献全文的文本信息;步骤九十一包括以下步骤:步骤十,文本信息的预处理,以句子为单位进行文本切分,获得句子中一连串的自由词或自由词组片段;步骤十一,取自由词或自由词组片段的词干模式为文本特征信息;由此,每一文本句子转换为一组文本特征词串;每一文本句子依据其文献在搜索结果...

【专利技术属性】
技术研发人员:耿亦兵
申请(专利权)人:上海半坡网络技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1