一种基于OWL的互联网供求信息匹配系统及其匹配方法技术方案

技术编号:7482252 阅读:236 留言:0更新日期:2012-07-05 16:36
本发明专利技术公开了一种基于OWL的互联网供求信息匹配系统和供求信息匹配方法,用户输入供应或需求后进行预处理;OWL本体实例转换模块将查询语句转换为OWL本体实例;OWL查询条件预处理模块将核心的和外延的查询条件本体实例进行本体元化处理,OWL本体搜索匹配模块把查询条件集中的每一个本体元与本体元倒排列表中的所有项进行匹配,原始文档管理系统提取出相应的原始文档集作为结果输出;由配对结果排序模块对多个结果进行排序;排序结果输出到用户界面做结果显示;循环往复,直到遍历所有的供应或需求。本发明专利技术采用基于OWL的检索方法来实现互联网海量供求信息的自动配对,大大提高了信息匹配的准确性。

【技术实现步骤摘要】

本专利技术涉及一种基于OWL的互联网供求信息匹配系统,属于计算机

技术介绍
在互联网上有很多种成对的互动信息,比如供求信息、求职与招聘信息,等等。大部分这样成对信息的匹配是人工处理的,即通过软件本身设置的供求区或跟贴区来实现自然的配对。如果是在海量的互联网信息中自动配对,则往往还是靠关键词匹配,匹配准确性差。OffL (Web Ontology Language)是W3C开发的一种网络本体语言,用于对本体进行语义描述。如果按OffL创建互联网,互联网本身就成为一个计算机可以在一定程度上“理解”的知识结构。在这个基础上软件工程师们可以为计算机设计一系列推理规则和引擎,在 OffL语义网络上让计算机自己“理解”互联网信息内容,并做出正确的判断和操作。OWL可以用来处理资讯的内容而不是仅仅向人类呈现信息的应用。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于OWL的互联网供求信息匹配系统,采用基于OWL的检索方法来实现互联网海量供求信息的自动配对,信息匹配准确性高。为解决上述技术问题,本专利技术提供一种基于OWL的互联网供求信息匹配系统,其特征是,包含保存互联网海量需求或供应信息的原始文档数据库,OffL本体实例转换模块,将需求或供应信息转换为OWL本体实例存入OWL本体实例数据库,倒排索引数据库,将本体元倒排索引,OffL查询规则库,由OWL知识模型对倒排索引进行校对,并产生查询规则存入OWL查询规则库。还包含OffL本体辞典,用于从文本格式查询条件向OWL本体实例的转换; OffL本体模型库,用于从文本格式查询条件向OWL本体实例的转换; OffL本体实例转换模块,负责从文本格式查询条件向OWL本体实例的转换; OffL查询条件预处理模块,负责OWL查询条件的延展推理,获取更多相关查询条件,同时对所有查询条件进行本体元化,从所有查询条件中提取本体元;OffL本体搜索匹配模块,负责完成查询条件本体元与OWL本体元倒排索引表中的搜索和匹配;待匹配供求条件及其分析模块,负责人机交互,包括查询条件的输入和配对结果的显示;同时负责对准自然语言的查询条件做初步的分析,以便做OffL本体的转换。一种基于OffL的互联网供求信息匹配系统的供求信息匹配方法,其特征是,包含以下步骤1)用户通过用户界面输入准自然语言的供应或需求信息;2)待匹配供求条件及其分析模块对用户的输入信息进行预处理;3)OffL本体实例转换模块在OWL辞典和OWL知识模型的帮助下将查询语句转换为OWL 本体实例;4)OffL查询条件预处理模块利用OWL推理引擎对查询条件做知识延伸扩展,获取额外的相关查询本体实例;5)OffL查询条件预处理模块将核心的和外延的查询条件本体实例进行本体元化处理, 提取出所有的本体元,作为最终的查询条件集;6)OffL本体搜索匹配模块把查询条件集中的每一个本体元与本体元倒排列表中的所有项进行匹配,并将获得所有的查询结果输出给原始文档管理系统和原始文档结果排序系统;7)原始文档管理系统根据查询结果与OWL本体实例数据库的对应关系,映射到原始文档数据库中相应的文件,提取出相应的原始文档集作为输出;8)当有多个结果对应一个供应或需求问题时,配对结果排序模块根据基于知识的查询规则和知识比较算法判断结果与条件的知识吻合度,并根据这种吻合度对结果进行排序;9)排序结果输出到用户界面做结果显示;选择另外一个供应或需求信息,重复步骤1)到9),循环往复,直到遍历所有的供应或需求。步骤1)中所述的准自然语言为采用自然语言的格式,所使用的语法和词汇在一个有限的或事先规定好的范围内。步骤2)中所述预处理至少包含识别、有效性检测、词性标注。步骤6)中OWL本体搜索匹配模块进行匹配的步骤为a)利用遍历算法快速定位本体元在列表中的位置;b)利用知识比较算法判定查询条件中的本体元是否与倒排列表中的本体元相同或相似;往复循环,直到遍历每一个本体元查询条件,并获得所有的查询结果,输出给原始文档管理系统和原始文档结果排序系统。本专利技术所达到的有益效果本专利技术的基于OWL的互联网供求信息匹配系统及其信息匹配方法,利用基于OWL检索的互联网内容的配对,既可以由一个供应信息去在海量的需求信息中寻找合适的需求,也可以从一个需求信息在海量的供应信息中寻找与之对应的供应,大大提高了信息匹配的准确性。附图说明图1是基于OWL的互动供求信息匹配系统示意图。 具体实施例方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。利用基于OffL检索的互联网内容的配对,既可以由一个供应信息去在海量的需求信息中寻找合适的需求,也可以从一个需求信息在海量的供应信息中寻找与之对应的供应。以由供应信息找需求信息为例,互动匹配系统如图一所示。本例子是从供应去寻找需求,如果是从需求找供应,则整个过程需要反过来。其中,假定已经获得了海量的需求信息,此信息存在原始文档数据库内,并由OWL 本体实例转换把它转换为OffL本体实例存入本体实例数据库,已经对本体实例数据库做好了本体元倒排索引,并通过OWL知识模型对倒排索引进行了校对,产生了查询规则,存入 OffL查询规则库。除上述基本模块外,该系统还包括UOffL本体辞典,用于从文本格式查询条件向OWL本体实例的转换;2、OWL本体模型库,用于从文本格式查询条件向OWL本体实例的转换;3、OffL本体实例转换模块,负责从文本格式查询条件向OWL本体实例的转换;4、OffL查询条件预处理模块,负责OWL查询条件的延展推理,获取更多相关查询条件, 同时对所有查询条件进行本体元化,即从所有查询条件中提取本体元;5、OffL本体搜索匹配模块,即本专利技术的核心模块,负责完成查询条件本体元(集)与 OffL本体元倒排索引表中的搜索和匹配。其关键技术是a)本体元倒排索引表的遍历算法,即如何高效、快速地搜索到倒排索引表的每一个节点的方法;b)知识比较算法,即如何判断两个本体元所描述的知识相同或相似的方法,并非简单的字符串匹配,这里基于知识模型的OffL本体查询规则起重要作用;6、待匹配供求条件及其分析模块,负责人机交互,包括查询条件的输入和配对结果的显示。同时负责对准自然语言的查询条件做初步的分析,以便做OffL本体的转换。基于上述系统的主流程如下1、用户通过用户界面输入准自然语言的供应信息。准自然语言,即采用自然语言的格式,但所使用的语法和词汇都在一个有限的、或事先规定好的范围内;2、待匹配供求条件及其分析模块对用户的问题进行识别、有效性检测、词性标注等预处理;是对查询条件的预处理,这时输入的查询条件是“供应”信息。3、OffL本体转换模块在OWL辞典和OWL知识模型的帮助下将查询语句转换为OWL 本体实例;4、OffL查询条件预处理模块利用OWL推理引擎对查询条件做知识延伸扩展,获取额外的相关查询本体实例;5、OffL查询条件预处理模块将核心的和外延的查询条件本体实例进行本体元化处理, 即提取出所有的本体元,作为最终的查询条件集;6>OffL本体搜索匹配模块把查询条件集中的每一个本体元与本体元倒排列表中的所有项进行匹配a)利用遍历算法快速定位本体元在列表中的位置;b)利用知识比较本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:王楠
申请(专利权)人:江苏联著实业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术