一种基于一阶逻辑和神经网络的数据对应方法技术

技术编号：8022430 阅读：209 留言：0更新日期：2012-11-29 04:40

本发明专利技术属于数据迁移、数据集成领域，具体涉及一种高匹配效率和准确率的基于一阶逻辑和神经网络的数据对应方法。本发明专利技术包括：（1）分析已完成匹配的数据模式；（2）将模式转换为表向量，存放在待匹配表训练集合中；（3）对集合中的表进行特征提取；（4）存储提取的表的特征。（5）对待匹配模式中的待匹配表进行匹配；（6）对已完成匹配的模式中的字段进行训练，修正字段的表示形式和建立的神经网络；（5）使用训练好的神经网络和修正后的字段表示格式，对已完成匹配的表进行字段匹配。本发明专利技术减少了在数据对应过程中的时间，提高了匹配的效率和准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据迁移、数据集成领域，具体涉及一种高匹配效率和准确率的基于一阶逻辑和神经网络的数据对应方法。
技术介绍
随着网络和数据库技术的不断发展，数据的种类和数量也在不断的增加，因此，对于异构数据的共享和相互之间的转换等技术问题也变成迫切需要解决的问题。在语义WEB、数据仓库、P2P数据库、模式集成和电子商务等领域，都对异构数据的共享和相互之间的转换进行了深入的研究。模式匹配作为实现异构数据共享的第一步，在整个数据处理过程中起到了不能替代的作用。目前实现异构数据的转换等工作大都是由操作人员手工进行，这就要求操作人员必须对数据库的信息，比如模式结构和模式中元素的语义都很熟悉，这样才能够完成对异构数据的共享和转换，因此对异构系统数据的处理是一个比较复杂的过程。随着业务复杂度和系统复杂度的不断增加，系统所需要的数据的复杂程度，都比现有的数据情况要复杂的多，在这种情况下，单纯依靠人工来完成异构数据集成过程，显然太困难，因此对异构数据集成的自动化需求就越来越迫切。到目前为止,对数据对应的方法研究也取得了一些成果。2000年NorthwesternUniversity 开发的 SemInt (A Tool for Identifying Attribute Correspondences inHeterogeneous Database Using Neural Networks)是一个应用混合匹配技术的模式匹配系统，它主要应用神经网络技术去确定匹配候选集，并在两个模式的单属性间建立一个映射，匹配基数是 I: I ;2001 年 VLDB (Very Lar...

【技术保护点】
一种基于一阶逻辑和神经网络的数据对应方法，其特征在于，包括如下步骤：（1）分析已完成匹配的数据模式，建立待匹配模式的表和字段形式的格式；（2）将选择训练的模式转换为表向量，存放在待匹配表训练集合中，包括表名、正样本数据、负样本数据和断言集合；（3）使用一阶逻辑的表特征提取算法对集合中的表进行特征提取；（4）存储提取的表的特征；（5）使用提取的表的特征字段对待匹配模式中的待匹配表进行匹配；（6）通过生成反馈的神经网络算法对已完成匹配的模式中的字段进行训练，修正字段的表示形式和建立的神经网络；（7）使用训练好的神经网络和修正后的字段表示格式，对已完成匹配的表进行字段匹配。

【技术特征摘要】

【专利技术属性】
技术研发人员：黄少滨，刘国峰，朴秀峰，申林山，刘刚，刘建华，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人