一种基于专家逻辑结构树的地学数据发现方法技术

技术编号：25757169 阅读：42 留言：0更新日期：2020-09-25 21:06

本发明专利技术公开了一种基于专家逻辑结构树的地学数据发现方法，包括以下步骤：步骤1，地质叙词表的补充及整理；步骤2，逻辑结构树的实例化；步骤3，分词，将输入的词条利用分词手段进行分词，获取单个关键词；步骤4，叙词表比对；步骤5，数据获取。本发明专利技术的优点是：不仅可以获取从包含输入关键词的网页中获取数据，还可以从不含关键词但与关键词相关性较强的网页中获取数据，网页顺序依照地学相关性计算方法进行计算后得到的相关系数进行排序，从而获取用户真正需要的搜索结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于专家逻辑结构树的地学数据发现方法
本专利技术涉及地学数据计算
，特别涉及一种基于专家逻辑结构树的地学数据发现方法。
技术介绍
近年来，以大数据为首的互联网技术是当前信息化领域的重要内容和技术手段，各行业都在积极研究大数据在该领域的应用。同样，地质行业的发展也需要大数据等相关信息技术的支持与应用。随着云计算、人工智能、深度学习等信息技术的飞速发展，大数据的研究与应用在各领域取得突破。开展地质大数据的应用研究是我国大数据战略的重要组成部分。在大数据理念下，提高了“数据”资源的利用水平，消除了数据“孤岛”，获得了大量的成果，给地质行业带来了前所未有的机遇。随着信息技术快速发展与多年的成果积累，地质文本数据已达到海量的规模，同时其又具有多源、多元、异构、时空性、相关性等特征。要做到充分利用这些地质文本数据，精选所需的有效信息，挖掘数据背后的知识，需要实现相关技术的融合与创新。传统的爬虫技术无法在海量的网络数据中精准获得地质领域数据；传统的数据检索、管理方式主要适应于规范、数据量低的结构化数据，但处理文本等非结构化地质数据则实效性差、覆盖率低、结果不准确，无法进行定向或专题式的检索；传统的数据分析方法更是难以实现深层次的信息提取和知识挖掘。与此同时，找矿工作的难度日益增大，其成功率越来越依赖于新技术手段对成矿规律的深入研究和矿产资源预测的综合评价(赵鹏大，夏庆霖.中国学者在数学地质学科发展中的成就与贡献.地球科学：中国地质大学学报，2009，第2期:225-231)。如何充分利用已有的地质大数据，...

【技术保护点】
1.一种基于专家逻辑结构树的地学数据发现方法，其特征在于，包括以下步骤：/n步骤1，地质叙词表的补充及整理；/n依据地质叙词表原有序词与地质学知识结点的树状知识图谱组成新的地质叙词表，依照既定格式将知识节点补充到地质叙词表的相应位置，并将地质学知识节点与地质叙词表原有节点中的重复节点进行比对和更新；地质叙词表包括：上位词、下位词、相关词、族首词及同义词；/n步骤2，逻辑结构树的实例化；/n将上位词、下位词、相关词、族首词及同义词的相关关系依据地质叙词表转换为对应的相关系数，将更新后的地质叙词表中的各个节点按树状结构存入选用的计算机程序，并存入每种关系对应的相关系数；/n步骤3，分词，将输入的词条利用分词手段进行分词，获取单个关键词；/n步骤4，叙词表比对；/n遍历地质叙词表，找出有效关键词在表中对应的位置，找到有效关键词的上位词、下位词、相关词、族首词及同义词，依据树形结构层层递进，直到找到的词汇相关性不足为止，相关性由加权的逻辑关系设定相关系数累积决定，根据自己设定的相关性阈值进行终止判断；/n步骤5，数据获取；/n根据相关性从大到小排列相关词，再将关键词与相关词依次导入传统搜索引擎...

【技术特征摘要】
1.一种基于专家逻辑结构树的地学数据发现方法，其特征在于，包括以下步骤：
步骤1，地质叙词表的补充及整理；
依据地质叙词表原有序词与地质学知识结点的树状知识图谱组成新的地质叙词表，依照既定格式将知识节点补充到地质叙词表的相应位置，并将地质学知识节点与地质叙词表原有节点中的重复节点进行比对和更新；地质叙词表包括：上位词、下位词、相关词、族首词及同义词；
步骤2，逻辑结构树的实例化；
将上位词、下位词、相关词、族首词及同义词的相关关系依据地质叙词表转换为对应的相关系数，将更新后的地质叙词表中的各个节点按树状结构存入选用的计算机程序，并存入每种关系对应的相关系数；
步骤3，分词，将输入的词条利用分词手段进行分词，获取单个关键词；
步骤4，叙词表比对；
遍历地质叙词表，找出有效关键词在表中对应的位置，找到有效关键词的上位词、下位词、相关词、族首词及同义词，依据树形结构层层递进，直到找到的词汇相关性不足为止，相关性由加权的逻辑关系设定相关系数累积决定，根据自己设定的相关性阈值进行终止判断；
步骤5，数据获取；
根据相关性从大到小排列相关词，再将关键词与相关词依次导入传统搜索引擎，进行数据搜索；在搜索的过程中将网页中所有的文字进行进一步获取，将获取到的所有的文本信息进行重新的分词，比对，从而获得在潜在网页中可能会有的与主题相关的文本信息，再将这些文本信息进行回传到搜索引擎待搜索的队列当中用以进一步的扩张搜索，达到覆盖式的相关数据检索，从而更全面地获得数据。

2.根据权利要求1所述的一种基于专家逻辑结构树的地学数据发现方法，其特征在于：所述逻辑结构树通过计算机编程，将地质叙词表中各个序词根据规定词汇关系存成树状结构；将需搜索的关键词与生成的逻辑结构树进行比...

【专利技术属性】
技术研发人员：陈建平，李诗，李志斌，刘苏庆，张亚光，
申请(专利权)人：中国地质大学北京，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人