基于差别矩阵的OGC地理信息服务描述词汇约简方法技术

技术编号:10567088 阅读:139 留言:0更新日期:2014-10-22 17:44
本发明专利技术提供一种基于差别矩阵的OGC地理信息服务描述词汇约简方法,对OGC地理信息服务样本数据进行解析,并提取每条服务的所有特征描述词汇内容,构成OGC地理信息服务实例描述词汇集数据库;建立面向OGC地理信息服务的描述词汇约简模型,并对OGC地理信息服务的实例描述词汇集数据库进行约简,获得OGC地理信息服务各自最优描述词汇集。该种OGC地理信息服务描述词汇约简方法,无须任何先验知识,且可靠性强、工作效率高、具备处理海量数据的能力,大大克服了传统方法中需要大量数据、结果可靠性差的缺陷,该方法将为面向OGC地理信息服务的语义搜索奠定基础。

【技术实现步骤摘要】
基于差别矩阵的OGC地理信息服务描述词汇约简方法
本专利技术涉及一种基于差别矩阵的OGC地理信息服务描述词汇约简方法。用于解决OGC地理信息服务词汇描述、约简方法与语义信息搜索问题,属于地理信息处理

技术介绍
随着Web服务概念及其软件架构思想的兴起,地理信息服务也日渐成熟,成为目前地理信息共享与互操作的主要手段。为实现地理信息资源的充分共享和广泛应用,体现其最大价值,一些政府机构或组织已相继资助了一批项目,在这些项目实施的过程中,产生了大量的以地理信息服务资源为主要形式的研究成果,伴随着信息网络技术特别是传感网的发展,与地理信息相关的服务必定会越来越多。OGC是一个非赢利性组织,目的是促进采用新的技术和商业方式来提高地理信息处理的互操作性,OGC(OpenGeospatialConsortium,开放地理空间联合会)地理信息服务是基于OGC标准形成的具有一定共享格式的地理信息服务,也是目前发布最多的地理信息服务。OGC地理信息服务描述文件中含有大量的描述词汇,有着比一般数据库更加丰富和复杂的GIS描述信息,然而OGC地理信息服务在地理空间知识的有效组织和表达方面的能力比较弱,缺乏对服务信息的语义描述,处于数据丰富而知识缺乏的境地,造成了已有的数据在知识的表示和检索上的缺陷,要充分利用好大量的已有数据信息,就必须对数据做一些精化处理,保留其有用的知识并对其进行语义信息的描述处理,这就迫切需要一种从大数据量中发现、提取描述词汇并构建语义知识的有效方法。传统的OGC地理信息服务最优描述词汇获取方法是使用概率统计方法或者经验法,这些方法要以大量数据为前提,求出先验的统计规律,一般这种大量数据很难获得,同时客观的世界存在着大量的模糊地理对象,用传统方法处理数据就会出现误差或不确定性,从而导致OGC地理信息服务知识库的结果不完全可靠,甚至错误,最终将导致决策的失误或失败。粗糙集(RoughSet,RS)理论是一种刻划不完整性和不确定性的数学工具,仅利用数据本身提供的信息,无须任何先验知识,有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。将粗糙集的相关理论应用于OGC地理信息服务描述词汇约简研究,不但发展了OGC地理信息服务语义共享方法,而且能更好的服务于OGC地理信息服务的智能推理,对OGC地理信息服务智能语义推理研究与应用具有十分重要的意义。
技术实现思路
本次专利技术的目的是提出一种全新的OGC地理信息服务描述词汇约简模型,来解决OGC地理信息服务词汇描述、约简方法和语义信息搜索问题,本专利技术提供了一种基于差别矩阵的OGC地理信息服务描述词汇约简方法,具备准确、高效、可靠的特点。本专利技术的技术解决方案是:一种基于差别矩阵的OGC地理信息服务描述词汇约简方法,对所有OGC地理信息服务数据进行解析,提取各服务的描述词汇内容构成OGC地理信息服务实例描述词汇集数据库;建立面向OGC地理信息服务的描述词汇约简模型,对OGC地理信息服务的实例描述词汇集数据库进行约简,获得各个OGC地理信息服务的最优描述词汇集。优选地,确定需要解析的能力文件描述信息,采用面向应用的对象式解析方法进行解析,应用JAXB数据绑定框架,实现对OGC地理信息服务能力描述文件的解析,将解析后的数据词汇集插入数据库,形成OGC地理信息服务实例描述词汇集数据库。优选地,OGC地理信息服务描述词汇约简模型的建立步骤如下:第1步对OGC地理信息服务样本数据进行解析,构成OGC地理信息服务描述词汇集实例数据库,将每一条OGC地理信息服务描述词汇集的数据组成一个研究对象,结合领域知识形成宜于实施分析的数据形式;同时,基于信息系统的定义,将所有OGC地理信息服务的描述词汇集数据作为论域,描述词汇集作为属性集合,形成一个面向OGC地理信息服务描述词汇的信息系统S;第2步结合信息系统S和差别矩阵的定义,形成面向OGC地理信息服务描述词汇的差别矩阵第3步求出S的核,根据系统核的定义,搜索差别矩阵中所有的单个描述词汇,即中包含的的个数为1,将其赋给CORE(A),并设B=CORE(A);第4步将差别矩阵中与系统核集不存在交集的集合设置为空,即如果则令α(xi,xj)=0;第5步判断差别矩阵中的所有集合是否为空,即如果有α(xi,xj)=0,则转到第7步,否则转到第6步;第6步统计差别矩阵中每个描述词汇出现的次数,选取出现次数最多的描述词汇加入属性核集CORE(A)中,即a=max{a在差别矩阵中出现的次数},B=B∪a,转到第4步;第7步输出CORE(A),CORE(A)中包含的描述词汇即为各OGC地理信息服务的最优描述词汇。优选地,信息系统S定义为:S=<U,A,V,f>其中,U是所有OGC地理信息服务的描述词汇集数据;A是描述词汇集;V=∪Va,Va表示描述词汇a的具体数据内容;f:U×A→V。优选地,S=(U,A,V,f)是一个描述OGC地理信息服务的信息系统,其中U={x1,x2,...,xn},n为OGC地理信息服务样本数据个数,则定义其中,为OGC地理信息服务描述信息系统的差别矩阵,差别矩阵的元素就是能够区分对象xi和xj的所有简单描述词汇组成的集合。优选地,系统的核等于信息系统的差别矩阵中OGC地理信息服务单个描述词汇组成的集合,即优选地,确定需要解析的能力文件描述信息为:服务标题、服务链接、图层标题、服务摘要、图层名称、服务类型、服务版本信息、地图投影、地图最小边框X坐标、地图最小边框Y坐标、地图最大边框X坐标、地图最大边框Y坐标和地图输出模式。本专利技术的有益效果是:本专利技术是一种基于差别矩阵的OGC地理信息服务描述词汇约简方法,不仅无须任何先验知识,而且可靠性强、工作效率高,大大克服了传统方法中需要大量数据、结果可靠性差的缺陷,将为OGC地理信息服务的语义描述提供支持。该种基于差别矩阵的OGC地理信息服务描述词汇约简方法,在没有任何先验知识和已知信息量小的情况下,可实现海量OGC地理信息服务数据的知识约简;比传统的获取最优描述词汇集方法效率更高,可靠性更强,可处理的数据量更大。该种基于差别矩阵的OGC地理信息服务描述词汇约简方法,用最精简的描述词汇对OGC地理信息服务进行表达,解决了OGC地理信息服务数据离散化描述的问题;确定了OGC地理信息服务最优描述词汇,为解决面向OGC地理信息服务语义层面的演绎推理提供了最优描述词汇集合。附图说明图1是本专利技术实施例的说明框图;图2是本专利技术实施例中JAXB数据绑定框架的流程图;图3是本专利技术实施例中JAXB数据绑定框架中的两组操作的说明示意图;图4是本专利技术实施例中OGC地理信息服务的约简流程图。具体实施方式下面结合附图详细说明本专利技术的优选实施例。如图1所示,本实施例以互联网上随机获取的300条OGC地理信息服务为研究对象,基于OGC地理信息服务的能力描述文档和描述词汇,对OGC地理信息服务样本数据进行解析,并提取每条服务的所有特征描述词汇内容,构成OGC地理信息服务实例描述词汇集数据库;基于差别矩阵的约简方法,建立面向OGC地理信息服务的描述词汇约简模型,并对OGC地理信息服务的实例描述词汇集数据库进行约简,获得OGC地理信息服务各自最优描述词汇集。一本文档来自技高网
...
基于差别矩阵的OGC地理信息服务描述词汇约简方法

【技术保护点】
一种基于差别矩阵的OGC地理信息服务描述词汇约简方法,其特征在于,对OGC地理信息服务进行解析,提取每条服务的所有特征描述词汇内容构成OGC地理信息服务实例描述词汇集数据库; 基于差别矩阵建立面向OGC地理信息服务的描述词汇约简模型,对OGC地理信息服务的实例描述词汇集数据库进行约简,获得各OGC地理信息服务最优描述词汇集。

【技术特征摘要】
1.一种基于差别矩阵的OGC地理信息服务描述词汇约简方法,其特征在于,对OGC地理信息服务进行解析,提取每条服务的所有特征描述词汇内容构成OGC地理信息服务实例描述词汇集数据库;基于差别矩阵建立面向OGC地理信息服务的描述词汇约简模型,对OGC地理信息服务的实例描述词汇集数据库进行约简,获得各OGC地理信息服务最优描述词汇集;其中,描述词汇约简模型的建立步骤如下:第1步对OGC地理信息服务样本数据进行解析,构成OGC地理信息服务描述词汇集实例数据库,将每一条OGC地理信息服务描述词汇集的数据组成一个研究对象,结合领域知识形成宜于实施分析的数据形式;同时,基于信息系统的定义,将所有OGC地理信息服务的描述词汇集数据作为论域,描述词汇集作为属性集合,形成一个面向OGC地理信息服务描述词汇的信息系统S;具体为,信息系统S定义为:S=<U,A,V,f>其中,U是所有OGC地理信息服务的描述词汇集数据;A是描述词汇集;V=∪Va,Va表示描述词汇a的具体数据内容;f:U×A→V,S=(U,A,V,f)是一个描述OGC地理信息服务的信息系统,其中U={x1,x2,...,xn},n为OGC地理信息服务样本数据个数,则定义其中,Aij={a|(a∈A)∧(fa(xi)≠fa(xj)},j=1,2,…,n,Mn×n为OGC地理信息服务描述信息系统的差别矩阵,差别矩阵的元素Aij就是能够区分对象xi和xj的所有单个描述词汇组成的集合;第2步结合信息系统S和差别矩阵的定义,形成面向OGC地理信息服务描述词汇的差别矩阵Mn×n=(Aij)n×n;第3步求出...

【专利技术属性】
技术研发人员:苗立志胥婕
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1