当前位置: 首页 > 专利查询>刘超专利>正文

信息资源管理及语义检索方法技术

技术编号:8215740 阅读:436 留言:0更新日期:2013-01-17 13:44
本发明专利技术公开了一种资源信息的管理方法及系统,包括:创建或利用属性信息库中的属性信息,所述属性信息包括属性的语义描述信息及分类和检索过程中使用的语义逻辑关系信息;根据属性信息库中的属性信息创建资源库和目录库,所述资源库中用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息。本发明专利技术通过分离语义信息与语义逻辑关系信息实现了对私密信息的保护,结合语义逻辑关系信息的结构化处理优化了语义搜索算法,提高了检索效率;再结合对公共属性的综合处理,实现了跨语言的语义检索。

【技术实现步骤摘要】

本专利技术涉及一种信息资源的分类管理及检索技术,尤其涉及一种信息资源的智能化管理方法及系统。
技术介绍
随着电子技术及信息技术的快速发展,电子设备中需要管理的资源信息也越来越多。这就对资源信息的合理管理提出了更高的要求。目前,在电子设备中,通常采用树状目录存储显示结构进行资源信息的管理。树状目录下的每个目录(根目录除外)都仅有一个直接父目录。如图I所示,相应的树状目录的存储根据目录节点的从属关系使用链表方式实现。 从图I所示的基于树状目录的资源信息管理方式可以看出,其具有以下缺点假设有如下文件类型的信息资源需要分类管理从专业方向分社会科学(经济学,哲学),自然科学(数学,物理学);从文件类型分期刊(权威类期刊,一般期刊),图书(专著,汇编);从语言上分中文(简体,繁体),外文(英文,日文);此时,若采用图I所示的信息资源管理方式,则对于某一文件,只能将其放置于某一目录下,其对应的父目录只有一个。如果想建立一些交叉学科的目录(或资源),比如建立一个包含经济学与哲学领域目录(比如经济哲学)或数学与哲学(数学哲学)的目录或者想建立三个目录(数学目录,期刊目录,数学期刊目录)等,则图I提供的目录树中是无法实现的。为了解决上述问题,有些工程实践采用文件复制的方式或者建立快捷方式的方法,但是,该方法不能维护资源间的一致性,当删除(或修改)资源时,需要把所有备份信息同时删除(或修改),因而缺乏一种高效的方法进行智能化处理。再者,假设“中文\繁体”目录下面有一个文件“深入浅出MFC. pdf”,则该文件只有在“中文\繁体”目录下才可以看见,而“中文”目录或者“图书”目录下均无法看到,这不符合自然语言中对于资源分类的理解,在自然语言中,通常的逻辑是如果“深入浅出MFC.pdf”是一个繁体图书,那么“深入浅出MFC. pdf”也一定属于“中文”目录和“图书”目录。近年来,理论界中也出现了语义目录的概念,试图处理多个上级目录问题,但是,当目录比较多时,依然缺少一种实用的工程方法及能够在有限的空间内展示目录关系的技术手段。概念格理论也称为形式概念分析,是由Wille教授于20世纪80年代提出的一种概念表示模型,它客观地反映了人类自然语言的概念间的语义逻辑关系,即一个概念可能拥有多个上级父概念(比如白马是分别是白色与马的概念的子概念),概念码理论在概念格理论的基础之上(刘超,王文杰.基于可能世界的网构软件之自动推理研究,计算机工程与设计,2011年4月1401-1405)进行了优化处理,对每个概念给出一个三进制编码(概念码),并用概念码之间的偏序关系反映概念之间的语义关系。然而,概念码理论是基于三值逻辑的,依然缺乏一种实用的工程化方法。利用本体技术进行资源分类是另一种技术实现方式(如一种使用本体进行文本文档自动分类的方法,CN 101944099B,基于形式概念分析的遥感信息处理服务分类本体构建方法,CN 101699444B),但是这方面的现有技术都缺乏有关目录与资源的概念上的严格区分,相似度本身也缺乏一种与自然语言相一致的直观体验,即在自然语言中,一个对象是否属于某个概念,其结果是确定的。在生活中,大多数名词概念具有一种为公众所共知的内涵,这是一种客观事实,除此之外,每个人都可以建立自己的概念分类体系,虽然这些概念本身是主观的,但是,承认每个人可以应用自己的主观概念和同自己进行交流,这种认识本身是客观的。以上两种客观性需要一种技术手段来帮助人们挖掘概念背后的语义关系。谓词逻辑一种常见的技术手段,然而,谓词逻辑除了理论上存在不可判定性之外,其工作效率也是低下的;同时,针对用户私人建立的主观概念,当利用第三方提供的服务时,用户也希望保护自己的隐私,比如说,在通讯录中建立分组时,有亲人组(家人,老舅,老妹等),当用户使用服务器协助检索时,用户往往并不希望把分组的名称等信息传递到服务器。以上讨论中提出的问题或者在理论上存在障碍,或者缺少实用的工程化方法,目 前尚没有相应问题的工程化解决方案。
技术实现思路
本专利技术的目的是提供一种信息资源的智能化管理方法,从而便于对网络及电子设备中的资源信息的有效管理。本专利技术的目的是通过以下技术方案实现的一种信息资源的智能化管理方法,包括创建或利用属性信息库中的属性信息,所述属性信息包括属性的语义描述信息及分类和检索过程中使用的语义逻辑关系信息;根据属性信息库中的属性信息创建资源库和目录库,所述资源库中用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息;根据信息资源在属性信息库中对应引用的语义逻辑关系信息及目录在属性信息库中对应引用的语义逻辑关系信息,对资源库和目录库中的内容进行语义检索。该方法还包括建立非私密的资源库和非私密的目录库,所述非私密的资源库包含或着不包含信息资源的语义描述信息,所述非私密的目录库包含或着不包含目录的语义描述信息;若多个用户创建的非私密资源库及非私密目录库放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述非私密资源库或非私密目录库所隶属的用户;当委托第三方服务器完成检索服务时,第三方服务器可以通过所述非私密资源库和非私密目录库完成语义检索。所述属性信息库、资源库和目录库为一个或多个用户所创建,并保存在相同或不同的联网实体设备中,若多个用户创建的资源库或目录库或属性信息库放在同一个实体设备中,则需要增加一个描述资源库或目录库或属性信息库和用户之间的关联关系的用户信息库,通过所述用户信息库能够识别所述资源库或目录库或属性信息库所属的用户。所述属性信息库包括至少一个公共属性,以及零个或一个或多个私人属性;或者,至少一个私人属性,以及零个或一个或多个公共属性;所述的公共属性及私人属性分别采用属性值描述属性的语义描述信息,属性值编码描述属性的语义逻辑关系信息;所述的公共属性是指由系统设定的不可被用户自由修改的属性;所述的私人属性是指由创建者自己解释应用的属性;所述的语义逻辑关系是指概念在语义上的包含、不包含、部分包含或者部分不包 含关系;所述公共属性包括资源管理的公共属性,若资源库中具有两种或两种以上操作方式的信息资源,则属性信息库中至少包含一个用于描述信息资源的运行或使用方式的属性信息。所述属性信息库中的属性的属性值编码是一种二进制编码或字符串编码,所述二进制编码或字符串编码把属性值上的语义关系转换为数学上的值或字符串模式匹配上的偏序关系;目录库中各个目录在属性信息库中引用的属性值标识及属性值编码确定了目录的目录码;资源库中各个资源在属性信息库中引用的属性值标识及属性值编码确定了资源的资源码;所述目录码及属性码可以用于计算目录与目录之间,目录与资源之间的语义逻辑关系;在目录的浏览或资源检索操作过程中,是针对资源库中的资源码及目录库中的目录码的进行关系比较查询实现的。该方法还包括当用户利用自己的目录库去检索其他用户创建的资源库时,所应用的资源码及目录码中的有效部分只来自所述公共属性,且所述的检索过程由用户直接完成或委托第三方服务器完成。所述属性信息库本文档来自技高网
...

【技术保护点】
一种信息资源的智能化管理方法,其特征在于,包括:创建或利用属性信息库中的属性信息,所述属性信息包括属性的语义描述信息及分类和检索过程中使用的语义逻辑关系信息;根据属性信息库中的属性信息创建资源库和目录库,所述资源库中用于保存需要管理的信息资源对应的资源标识信息及信息资源在属性信息库中对应的引用的语义逻辑关系信息,所述目录库中用于保存用户创建的目录对应的目录标识信息及目录在属性信息库中对应的引用的语义逻辑关系信息;根据信息资源在属性信息库中对应引用的语义逻辑关系信息及目录在属性信息库中对应引用的语义逻辑关系信息,对资源库和目录库中的内容进行语义检索。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘超
申请(专利权)人:刘超
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1