一种企业智能问答系统、控制方法、介质、设备及终端技术方案

技术编号:34097166 阅读:27 留言:0更新日期:2022-07-11 22:35
本发明专利技术属于智能问答技术领域,公开了一种企业智能问答系统、控制方法、介质、设备及终端,所述企业智能问答系统基于Flask框架设计开发,前端使用HTML、JavaScript、Css工具完成系统界面的设计,使用Ajex通信技术进行前后端的交互,包括数据采集模块、知识图谱构建模块、用户输入模块、问句分类模块、实体识别模块、模板匹配模块和答案反馈模块。本发明专利技术通过自然语言处理的方法帮助企业从工业领域知识图谱中快速准确的获取目标信息,对于工厂以后的设备检修、故障处理、人员调度、设备采购都起到了至关重要的作用,具有实用性和有效性,同时还能够对企业的设备选型、设备检修、人员调度以及故障维修等问题提供回复。故障维修等问题提供回复。故障维修等问题提供回复。

【技术实现步骤摘要】
一种企业智能问答系统、控制方法、介质、设备及终端


[0001]本专利技术属于智能问答
,尤其涉及一种企业智能问答系统、控制方法、介质、设备及终端。

技术介绍

[0002]目前,在工业生产中,企业对于高速、精准获得目标信息的需求愈加强烈,问答系统是一门集合自然语言处理、信息检索、信息挖掘的多学科技术,以提问的方式进行呈现,通过分析问句的含义,真正理解提问者的意图,直接为提问者提供想要的结果,而不是大量的访问链接。这种简单的方式,更加适合追求高效率工作的企业。在深度学习技术和大数据的驱动下,可以通过神经网络在大量数据中学习特征表示从而寻找规律,无需人工制定规则模板,提高了问答系统的准确率。问答系统的诞生是以海量数据为基础的,传统形式的知识库仅支持机械性的检索,无法满足精准快速的问答系统的需求,知识图谱能够将零碎的数据组织起来,更有利于知识的搜索和分析,在自然语言处理方面的应用十分广泛,将知识图谱应用于问答系统,能够提高问答系统的智能性。
[0003]在知识存储方面,将工业知识以知识图谱的形式进行存储,不仅能够提高信息查询效率,而且通过图数据库能够对数据和关系进行直观的展示,为知识的存储、分析和利用提供良好的解决方案。
[0004]在信息检索方面,使用自然语言技术搭建的以知识图谱为基础的智能化问答系统,能够对自然语义进行精准分析,从而为用户提供更加精确快速的查询结果。
[0005]在工业领域,智能化工厂4.0的概念成为社会讨论热点,越来越多的工厂使用智能机器人或者计算机视觉检测技术代替人工劳动力,工厂的生产数据、设备数据、故障数据也逐渐转为智能存储,这对传统数据库和信息检索渠道造成一定压力,一方面数据量的攀升导致检索速度急剧下降,另一方面由于数据种类繁多,难以建立不同数据之间的联系,无法直观的对数据进行展示。因此,建立基于知识图谱的工业问答系统具有现实性的意义,不仅能够快速准确的满足非技术人员的业务需求,也为大量零散的工业知识提供了形式灵活的存储空间。
[0006]通过上述分析,现有技术存在的问题及缺陷为:
[0007](1)传统形式的知识库仅支持机械性的检索,无法满足精准快速的问答系统的需求。本专利技术所构建的问答系统能够通过神经网络模型获取用户输入的意图,通过完善查询模板,在知识图谱中进行查找,将正确答案直接反馈给用户,对知识图谱数据以图数据结构进行存储,查询速度更快。
[0008](2)工业智能化改革导致数据量激增、数据专业性较高、信息检索效率低的问题。本专利技术将工业知识以知识图谱的形式进行存储,不仅能够提高信息查询效率,而且通过图数据库能够对数据进行直观展示,为知识的存储、分析和利用提供良好的解决方案。
[0009](3)目前尚未出现成熟的工业问答系统。领域知识图谱的研究能够为传统行业带来便利,将成为未来的研究热点。根据前期的准备在企业进行实地调研的过程中发现,随着
工厂智能化的发展,数据种类及数量大大增加,目前尚未存在成熟的工业领域知识图谱。对于知识图谱能够高效实现数据组织、存储和管理,所以基于工业领域的知识图谱具有一定的研究价值。

技术实现思路

[0010]针对现有技术存在的问题,本专利技术提供了一种企业智能问答系统、控制方法、介质、设备及终端,尤其涉及一种基于工业领域知识图谱的企业智能问答系统、控制方法、介质、设备及终端,旨在解决工业智能化改革导致的数据量激增、数据专业性较高、信息检索效率低的问题。
[0011]本专利技术是这样实现的,一种企业智能问答系统,所述企业智能问答系统基于Flask框架设计开发,后端使用Python编程语言,前端使用HTML、JavaScript、Css工具完成系统界面的设计,使用Ajex通信技术进行前后端的交互,包括以下功能模块:
[0012]数据采集模块,用于收集企业设备信息、故障信息、生产信息和人员信息,通过爬虫获取互联网上的工业信息,并对数据进行清洗和整理,保存在MySQL数据库中;
[0013]知识图谱构建模块,用于选择Neo4j作为存储知识图谱的数据库,读取MySQL中的数据,将MySQL数据库中指定类型的数据导入知识图谱;
[0014]用户输入模块,用于接收用户在网页输入的自然语言问题,同时将问句发送给问句分类模块;
[0015]问句分类模块,用于构建问句分类数据集,并提出基于数据增强的CNN

BiGRU(卷积神经网络

双向门控循环单元)问句分类模型,对输入的自然语言问句进行特征提取及分类,得到分类结果;
[0016]实体识别模块,用于构建实体识别数据集,使用BiLSTM

CRF(双向长短期记忆网络

条件随机场)深度神经网络识别问句中出现过的实体,并通过实体链接技术找到知识图谱中对应的节点名称;
[0017]模板匹配模块,用于通过问句分类结果匹配查询模板,利用实体链接后的节点名称完善查询语句,在Neo4j图数据库中进行查询,将答案返回;
[0018]答案反馈模块,用于将模板匹配模块返回的答案展示在网页。
[0019]本专利技术的另一目的在于提供一种应用所述的企业智能问答系统的企业智能问答系统的控制方法,所述企业智能问答系统的控制方法包括以下步骤:
[0020]步骤一,利用数据采集模块收集企业设备信息、故障信息、生产信息和人员信息,通过爬虫获取互联网上的工业信息,并对数据进行清洗和整理,保存在MySQL数据库中;
[0021]步骤二,利用知识图谱构建模块选择Neo4j作为存储知识图谱的数据库,读取MySQL中的数据,将MySQL数据库中指定类型的数据导入知识图谱;
[0022]步骤三,利用用户输入模块接收用户在网页输入的自然语言问题,同时将问句发送给问句分类模块;
[0023]步骤四,利用问句分类模块构建问句分类数据集,并提出基于数据增强的CNN

BiGRU问句分类模型,对输入的自然语言问句进行特征提取及分类,得到分类结果;
[0024]步骤五,利用实体识别模块构建实体识别数据集,使用BiLSTM

CRF深度神经网络识别问句中出现过的实体,并通过实体链接技术找到知识图谱中对应的节点名称;
[0025]步骤六,利用模板匹配模块通过问句分类结果匹配查询模板,利用实体链接后的节点名称完善查询语句,在Neo4j图数据库中进行查询,将答案返回;
[0026]步骤七,利用答案反馈模块将模板匹配模块返回的答案展示在网页。
[0027]进一步,所述步骤一中的通过爬虫获取互联网上的工业信息包括:
[0028]基于python编程的Requests库、bs4库设计爬虫工具,通过逻辑代码自动进行浏览器的访问和数据定位,并将爬取到的信息进行整合,写入数据库中。
[0029]其中,所述数据采集包括:
[0030](1)通过Requests的get方法或post方法获取网页信息;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业智能问答系统,其特征在于,所述企业智能问答系统基于Flask框架设计开发,前端使用HTML、JavaScript、Css工具完成系统界面的设计,使用Ajex通信技术进行前后端的交互,包括以下功能模块:数据采集模块,用于收集企业设备信息、故障信息、生产信息和人员信息,通过爬虫获取互联网上的工业信息,并对数据进行清洗和整理,保存在MySQL数据库中;知识图谱构建模块,用于选择Neo4j作为存储知识图谱的数据库,读取MySQL中的数据,将MySQL数据库中指定类型的数据导入知识图谱;用户输入模块,用于接收用户在网页输入的自然语言问题,同时将问句发送给问句分类模块;问句分类模块,用于构建问句分类数据集,并提出基于数据增强的CNN

BiGRU问句分类模型,对输入的自然语言问句进行特征提取及分类,得到分类结果;实体识别模块,用于构建实体识别数据集,使用BiLSTM

CRF深度神经网络识别问句中出现过的实体,并通过实体链接技术找到知识图谱中对应的节点名称;模板匹配模块,用于通过问句分类结果匹配查询模板,利用实体链接后的节点名称完善查询语句,在Neo4j图数据库中进行查询,将答案返回;答案反馈模块,用于将模板匹配模块返回的答案展示在网页。2.一种应用如权利要求1所述的企业智能问答系统的企业智能问答系统的控制方法,其特征在于,所述企业智能问答系统的控制方法包括以下步骤:步骤一,利用数据采集模块收集企业设备信息、故障信息、生产信息和人员信息,通过爬虫获取互联网上的工业信息,并对数据进行清洗和整理,保存在MySQL数据库中;步骤二,利用知识图谱构建模块选择Neo4j作为存储知识图谱的数据库,读取MySQL中的数据,将MySQL数据库中指定类型的数据导入知识图谱;步骤三,利用用户输入模块接收用户在网页输入的自然语言问题,同时将问句发送给问句分类模块;步骤四,利用问句分类模块构建问句分类数据集,并提出基于数据增强的CNN

BiGRU问句分类模型,对输入的自然语言问句进行特征提取及分类,得到分类结果;步骤五,利用实体识别模块构建实体识别数据集,使用BiLSTM

CRF深度神经网络识别问句中出现过的实体,并通过实体链接技术找到知识图谱中对应的节点名称;步骤六,利用模板匹配模块通过问句分类结果匹配查询模板,利用实体链接后的节点名称完善查询语句,在Neo4j图数据库中进行查询,将答案返回;步骤七,利用答案反馈模块将模板匹配模块返回的答案展示在网页。3.如权利要求2所述的企业智能问答系统的控制方法,其特征在于,所述步骤一中的通过爬虫获取互联网上的工业信息包括:基于python编程的Requests库、bs4库设计爬虫工具,通过逻辑代码自动进行浏览器的访问和数据定位,并将爬取到的信息进行整合,写入数据库中;其中,所述数据采集包括:(1)通过Requests的get方法或post方法获取网页信息;(2)查看网页源代码确定所需爬取信息的位置,通过bs4定位至目标位置;(3)将目标信息保存至数据库中。
4.如权利要求2所述的企业智能问答系统的控制方法,其特征在于,所述步骤二中的图数据库Neo4j包...

【专利技术属性】
技术研发人员:杨清海曲芮莹刘佳宜李静磊沈中沈八中
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1