一种基于深度学习的机器人数据互操作领域本体构建方法技术

技术编号：20724976 阅读：34 留言：0更新日期：2019-03-30 17:42

本发明专利技术请求保护一种基于深度学习的机器人数据互操作领域本体构建方法，包括数据源的预处理，基于深度学习的机器人领域术语提取和概念抽取，构建机器人数据与概念之间的关系模型。该方法解决了机器人异构系统数据互操作的关键问题，即如何解决异构数据源语义异构问题。该方法主要应用于制造业异构系统中的数据互操作性，完成对机器人领域本体的半自动化构建，是对国内现有本体理论和应用研究的完善，填补了本体理论在工业机器人领域的应用研究盲点，该方法与传统人工方法相比，本体构建过程更加方便快捷，并且适用于大量数据源的本体构建。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的机器人数据互操作领域本体构建方法
本专利技术属于制造业信息化领域的本体构建技术，属于机器人数据互操作方面，尤其涉及一种基于深度学习的机器人数据互操作领域本体构建方法。
技术介绍
随着制造业信息化时代的到来，信息共享成为信息化发展的一项重要技术。然而大部分的制造业设备只是为特定的工作环境而开发的，一些更多、更加复杂的任务需要多个设备的协作才能完成。工业现场中各种设备协同工作的场景应用很多，但是我国在此方面的技术基础并不雄厚，随着技术的不断发展，人们对数据共享提出了更高的要求，希望能够消除异构数据之间的冲突和异常。这些数据资源由于软硬件平台各异、数据模型各异而形成了异构数据，使各数据间的互操作变得复杂、困难，使它们成为信息孤岛。为了更好地利用工业网络上浩如烟海的信息，以及不造成企业应用系统的重复建设和数据资源的浪费，人们迫切需要重用和共享这些地理上分布、管理上自治、模式上异构的异构数据。异构数据互操作其目的是在数据源逻辑层上建立统一的访问界面，实现异构数据的分布式共享，使用户不必考虑数据模型的异构性、数据抽取、数据合成等问题，用户只需指定他们想要的数据，而不必描述怎样得到数据。这样就减轻了用户寻找相关数据源、和每个数据源交互然后返回结果的负担。从而为企业综合应用系统提供统一的、安全的、快捷的互访、信息查询、数据挖掘和决策支持服务。为了满足这个需求条件，最终的数据必须保证一定的集成性、完整性、一致性和访问安全性。目前的数据互操作中所解决的问题大部分都是结构异构的问题，采用GAV(Global-as-view)或者LAV(Local-as-vie...

【技术保护点】
1.一种基于深度学习的机器人数据互操作领域本体构建方法，其特征在于，包括以下步骤：a.机器人领域的数据源的获取和预处理步骤；b.基于深度学习的机器人领域术语提取和概念抽取步骤；采用TF‑IDF方法，选用词频、文档频率、逆文档频率、词频方差、领域一致度这5种特征作为特征向量并将其作为深度学习的网络输入，进而抽取机器人领域概念；c.采用改进的k‑means聚类算法构建机器人数据概念之间的关系模型，形成机器人领域本体，由于k‑means聚类算法存在初始聚类中心的随机选择可能使聚类效果受到离群数据的影响，造成聚类结果的局部最优而非全局最优，所以对此作出改进，计算Rd空间上数据集X中的每一个数据点x在给定邻域半径δ范围内的最近邻居点集合G(x)，计算数据点x的密度函数Density(x)得到其密度值，并且按照升序放入集合X′中，剔除密度值小于平均密度值的数据点，从集合X′中选出密度值最大的数据点为聚类中心点，以选定的初始聚类中心点开始聚类，这样聚类结果相对稳定并可以保证全局最优。

【技术特征摘要】
1.一种基于深度学习的机器人数据互操作领域本体构建方法，其特征在于，包括以下步骤：a.机器人领域的数据源的获取和预处理步骤；b.基于深度学习的机器人领域术语提取和概念抽取步骤；采用TF-IDF方法，选用词频、文档频率、逆文档频率、词频方差、领域一致度这5种特征作为特征向量并将其作为深度学习的网络输入，进而抽取机器人领域概念；c.采用改进的k-means聚类算法构建机器人数据概念之间的关系模型，形成机器人领域本体，由于k-means聚类算法存在初始聚类中心的随机选择可能使聚类效果受到离群数据的影响，造成聚类结果的局部最优而非全局最优，所以对此作出改进，计算Rd空间上数据集X中的每一个数据点x在给定邻域半径δ范围内的最近邻居点集合G(x)，计算数据点x的密度函数Density(x)得到其密度值，并且按照升序放入集合X′中，剔除密度值小于平均密度值的数据点，从集合X′中选出密度值最大的数据点为聚类中心点，以选定的初始聚类中心点开始聚类，这样聚类结果相对稳定并可以保证全局最优。2.根据权利要求1所述的基于深度学习的机器人数据互操作领域本体构建方法，其特征在于，所述步骤a机器人领域的数据源的获取步骤，具体包括：根据包括领域相关知识、机器人领域相关文本、工业机器人相关国际标准、机器人领域相关知识报告及机器人xml数据在内的方式获取源数据，构建机器人领域词典。3.根据权利要求2所述的基于深度学习的机器人数据互操作领域本体构建方法，其特征在于，所述步骤a预处理步骤具体包括：首先对机器人领域词典进行分词，将文本数据切分成单个词语，然后对分词之后的文本进行降噪处理，停用词过滤。4.根据权利要求2所述的基于深度学习的机器人数据互操作领域本体构建方法，其特征在于，所述步骤b采用TF-IDF方法，选用TF、DF、IDF、TV、DC这5种特征作为特征向量并将其作为深度学习的网络输入，进而抽取机器人领域概念，具体包括：计算TF、DF、IDF、TV、DC这5种特征向量的值并将其作为深度学习的训练输入，根据深度学习算法，首先训练一部分样本数据得到分类函数，然后将剩下的数据作为测试数据，根据前面训练好的函数来判断候选概念是否属于机器人领域概念，不断调整网络的权值及阈值，训练出神经网络模型；最后利用训练好的网络抽取机器人领域概念，通过人工审核的方式排除抽取出的错误的机器人领域概念，得到机器人领域概念集。5.根据权利要求4所述的基于深度学习的机器人数据互操作领域本体构建方法，其特征在于，所述深度学习的模型采用...

【专利技术属性】
技术研发人员：罗志勇，于士杰，赵杰，范志鹏，马国喜，郑焕平，罗蓉，蔡婷，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人