当前位置: 首页 > 专利查询>高小翎专利>正文

智能高效的印刷业管理系统NLQI改进方法技术方案

技术编号:29021870 阅读:46 留言:0更新日期:2021-06-26 05:23
本发明专利技术的智能高效的印刷业管理系统NLQI改进方法,改进后语义文法的分析规则简化为对三类非完结点的判定,且将判定过程彻底交由本体完成,较好的解决了现有技术语义文法存在的问题;基于自然语言检索语句结构化与非结构化短语并存的特征,结合改进后语义文法树的特有结构,提出一种以结构化短语分析为主,非结构化短语单独处理的语义分析方法;为满足印刷业管理系统在新形势下,提出印刷业管理系统NLQI的系统架构,并提出印刷物料管理模块的NLQI,实验证明本发明专利技术的印刷业管理系统NLQI改进方法具有高效性,能够显著增强印刷业管理系统的检索功能,能够以更为友好和智能的方式满足印刷业管理系统信息检索的需要。刷业管理系统信息检索的需要。刷业管理系统信息检索的需要。

【技术实现步骤摘要】
智能高效的印刷业管理系统NLQI改进方法


[0001]本专利技术涉及一种印刷业管理系统NLQI改进方法,特别涉及一种智能高效的印刷业管理系统NLQI改进方法,属于高效NLQI改进


技术介绍

[0002]随着大数据时代的到来,数据已成为一种重要的生产力。面对海量数据,如何以更为友好的方式实现对数据快速检索成为一项难题。现阶段,对关系数据库的检索方式主要有两种:一种是面向专业人员的形式化检索语言,如SQL,另一种是面向用户的图形化操作界面。形式化检索语言功能强大,但其有着较强的语法限定,对于普通用户来说较难掌握。而图形化检索界面在检索时需要将后台数据库结构呈现给用户,对于复杂的数据库结构,其界面会过于复杂,从而会大幅降低图形化界面的人机交互性和检索效率。另外,图形化界面的检索功能较弱,只能进行简单的单表检索。
[0003]自然语言检索接口(NLQI)是一种用户可通过自然语言的方式同计算机进行交互,以获得相关信息的智能化界面,它是自然语言处理技术在人机交互接口上的具体应用,利用自然语言处理技术将用户自然检索语句转换为形式化检索语言,由形式化语言完成具体检索过程。与形式化检索语言、图形化检索界面相比,NLQI具有以下优势:一是较强的人机交互性,以自然语言的方式进行检索,或者结合语音识别技术进行语音检索,更加符合用户习惯;二是物理与逻辑独立性,NLQI是架构于形式化检索语言之上的检索技术,它依靠领域内相关术语进行数据库检索,数据库物理存储及逻辑上的结构无需呈现给用户,人机交互界面更加简洁;三是易于掌握,用户通过自然语言进行数据库检索不用去学习那些多样且特定的语法结构,更易于掌握;四是较强的表达能力,常见网络搜索引擎一般都是基于关键词检索,这种方式损失了大量的语义信息,表达能力受到限制,检索结果有时并不能彻底符合用户需求,而NLQI能充分利用用户表达的信息,具有较高的查准率。
[0004]在印刷行业中,ERP系统是最常见的管理软件,它以信息技术为基础,将印刷业中各个部门数据信息系统的联系在一起,实现了资源的优化及信息的共享,以达到对印刷业的物料、资金、时间、人力等资源与信息等进行系统化管理。但印刷ERP系统在实际生产中的应用还存在着许多问题,例如物料管理中存在物料代码多导致记忆困难、界面复杂、检索速度慢、检索方式单一等问题。而且目前印刷业管理系统在印刷业中还远没有普及,作为传统行业,印刷业在“互联网+”的风口上面临巨大挑战,无论是经营生产方式,还是管理方式上都在发生巨大的变革,对于印刷业管理系统所存在的问题以及正在发生的变化,现有技术印刷ERP基于图形化的交互界面,已经很难应对。首先,图形化交互界面需要将后台数据的存储和逻辑结构彻底呈现给用户,以供用户进行检索,而功能覆盖面的增加会使后台数据增加且数据库结构更为复杂,这势必也会增加用户界面的复杂程度,带来用户检索效率的下降,影响用户体验。另外,企业管理系统客户端越来越趋向便捷、小型化的发展趋势也使得复杂、繁多的图形化界面难以适应。最重要的是,面对企业管理系统到商业智能系统转变所带来的智能性交互的增加,现有技术图形化检索界面仅能够处理单数据表内简单检索的
特征已经不能满足需求。而NLQI技术能较好解决上述问题,首先它将后台数据的逻辑和存储结构彻底屏蔽,用户只需要一个输入接口就能完成对整个ERP系统的控制,因此,用户界面简洁,更能适应印刷ERP系统架构上的变化,相对于图形化界面,其灵活性与适用范围也大大增强。并且,自然语言最符合人类输入习惯,具有较好的人机交互性,它能最大限度的理解用户的意图,进而进行逻辑推理,辅助用户做出最正确的决策,因此自然语言接口也最为适应印刷ERP系统智能化转变的接口。
[0005]但是,现有技术的NLQI技术运用在印刷业管理系统中依然存在诸多不足,现有技术的难点和本专利技术解决的问题主要集中在以下方面:
[0006]第一,现有技术印刷ERP系统在实际生产中的应用还存在着许多问题,例如物料管理中存在物料代码多导致记忆困难、界面复杂、检索速度慢、检索方式单一等问题,而且目前印刷业管理系统在印刷业中还远没有普及,对于印刷业管理系统所存在的问题以及正在发生的变化,现有技术印刷ERP基于图形化的交互界面,已经很难应对,图形化交互界面需要将后台数据的存储和逻辑结构彻底呈现给用户,而功能覆盖面的增加会使后台数据增加且数据库结构更为复杂,增加用户界面的复杂程度,带来用户检索效率的下降,影响用户体验,企业管理系统客户端越来越趋向便捷、小型化的发展趋势也使得复杂、繁多的图形化界面难以适应,面对企业管理系统到商业智能系统转变所带来的智能性交互的增加,现有技术图形化检索界面仅能够处理单数据表内简单检索的特征已经不能满足需求;
[0007]第二,受信息技术和印刷业数字化发展的影响,印刷业管理系统在功能和架构上发生了巨大的变化,现有技术的图形化人机交互模式显得越来越繁杂,交互友好性迅速下降,NLQI能较好的应对这些问题,但现有技术自然语言处理技术的发展依然不够成熟,将结构化短语与非结构短语并存的自然语言转换为彻底结构化形式的检索语言,存在诸多困难,自然语言检索语句常存在嵌套检索、组合检索等复杂句式结构及冗缺模糊等问题,且印刷业管理系统数据库复杂,跨表检索非常常见,这些都增加了理解自然语言的困难程度;
[0008]第三,为了对检索语句进行更加明确的表示,语义文法将语义信息引入到语法树的结构中,虽然语义文法相对于现有技术的形式文法来说具有诸多优点,但语义信息的加入也带来一些问题。首先语义文法以具有语义信息的词语作为非完结点,增加非完结点之间的区分度,使语法树结构更为复杂,造成语义文法分析规则数量的大幅增加,从而增加了分析规则编写工作量;其次,语义信息具有较强的领域相关性,语义文法的通用性会受到较大限制;另外,语义文法树的结点种类多,使语法树的结构极为复杂,增加后续语义分析和SQL语句生成的难度,甚至影响自然语言检索语句转换的准确性;
[0009]第四,语法分析树本质上还是在语法层次上对句式结构进行分析,分析的准确性很难得到保证,尤其是语法分析没有对语法树结构中的检索条件短语和检索目标短语进行详尽的分析,无法保证对实体修饰关系的准确性,也还尚未彻底转化为结构化数据,无法进行SQL语句转换,因此还需对检索条件和检索目标进行语义分析。NLQI是架构于关系型数据库之上的人机交互方式,关系型数据库的存储结构决定其所存储的数据与信息结构化较强。因此,自然语言检索语句也具有较强的结构性,但自然语言检索语句作为自然语言的子集,仍是一个无限集,也具有自然语言模糊的特征,尤其是NLQI直接与人类进行交互,检索语句的口语化较强,自然语言检索语句中非结构化短语也时常出现;
[0010]第五,汉语自然语言检索语句是一种对关系数据库进行检索的方式,其结构化往
往较强。但自然语言检索语句作为自然语言的子集,口语化强,非结构化短语也时常存在,现有技术没有合适的处理方法,对于语法分析树的构建是在语法层面的分析过程,存在一定的片面性的问题。另外,结构化单检索条件存在冗缺指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.智能高效的印刷业管理系统NLQI改进方法,其特征在于,一是对语义文法进行改进,改进后语义文法的分析规则简化为对三类非完结点的判定,且将判定过程交由本体完成;二是基于自然语言检索语句结构化与非结构化短语并存的特征,结合改进后语义文法树的特有结构,提出一种以结构化短语分析为主,非结构化短语单独处理的语义分析方法,该方法包括:基于词性模板匹配细分检索短语、基于本体的结构化短语语义解析、基于规则的非结构化短语语义演绎推断、语义树校正和形式化语言SQL生成五部分;三是提出印刷业管理系统NLQI的系统架构,并提出印刷物料管理模块的NLQI;本发明基于数据库NLQI的语法分析、语义分析和算法,对印刷业管理系统NLQI进行改进,主要包括:第一,采用语义文法构建检索语句语法分析树,并对语义文法进行改进;对语义文法的结构进行了改进,将非完结点归纳为三类:实体、检索条件和检索目标,分析规则被简化为对这三类非完结结点的判定,且判定过程交由专业本体负责,改进后语义文法,使语义文法树结构得到简化,降低文法规则的编写工作量,同时增强语义文法的可移植性;第二,针对改进后语法树结构,提出一种结构与非结构化分别处理的语义分析算法;基于改进后的语义文法构建的语法树特殊结构,并结合自然语言检索语句结构化短语与非结构化短语并存的特征,提出基于专业本体与产生式规则的语义分析算法,采用词性模板匹配算法对检索短语进行细分,根据匹配结果将细分短语划分为:结构化短语和非结构化短语,对两类细分短语分别采用基于专业本体模型的分析算法和基于产生式规则的推理算法进行语义分析,将其转换为标准检索条件六元组和标准检索目标两元组结构,最后根据语义分析结果,对语义分析树进行校正,将校正后的语义树转换为形式化检索语言SQL,结构化短语和非结构化短语分而治之,扩大NLQI的适用范围,提高自然语言检索语句的转换准确率;第三,设计实现印刷业管理系统物料管理模块NLQI,设计印刷业管理系统NLQI的系统架构,以此为基础实现物料管理模块NLQI,构建物料管理模块数据库、专业本体以及规则库、分词和词性标注词典、同义词词典、单位换算词典和属性值语义库,增强印刷业管理系统的检索功能。2.根据权利要求1所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,构建语法树对词性序列进行语法分析,首先基于语义文法的形式文法和上下文无关文法存在的缺点进行改进,并基于改进后的语义文法构建语法分析树;NLQI语义文法改进方法和过程:检索语句由三部分构成:目标实体、目标实体属性和目标实体的修饰成分,其中,目标实体的修饰成分由两部分构成:一个是对目标实体进行修饰的其它实体,另一个是实体的修饰短语,依次类推,每一个实体的修饰成分都均由这两部分构成,另外,结合对SQL的分析,在语法功能上,所提到的目标实体的修饰成分、目标实体及目标实体属性同SQL语句中的Where子句、From子句和Select子句相对应,本发明在现有技术语义文法的基础之上做如下定义以及改进:定义1:语法分析树CR={Entity,Target},其中,Entity表示实体,是对某一具体概念的表示,Target表示检索目标短语,是用户要检索目标实体的属性,或为缺省值;定义2:实体Entity={Text,Entity*,Condition},其中,Text表示该实体的名称,Entity*表示修饰Entity的实体,Condition表示修饰实体的短语,即检索条件短语;
对比形式文法四元组F=(M,Σ,Q,C),实体Entity、检索目标Target和检索条件Condition对应形式文法F中集合M所包含的非完结结点,检索条件Condition和检索目标Target中的各词语对应形式文法F中集合Σ所包含的完结符,CR为语句的初始符,对应F中的C,规则的有限集合Q则被简化为三条,即对实体Entity、检索条件短语Condition和目标属性短语Target的判定。3.根据权利要求2所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,基于改进后语义文法构建语法树:本发明基于移进规约算法构建语法分析树,首先对输入的检索语句自左至右进行扫描,并把输入的词语逐个移入一个先进后出的栈中,边移入边进行分析,移入的过程为移步,本发明规约的过程分为三种情形:情形一,根据专业本体知识模型判定栈顶元素是否为实体,若为实体,且栈中实体词对该实体存在修饰关系,则将该实体规约为当前实体的修饰实体Entity*,将栈中其它词语规约为当前实体的检索条件短语Condition,若不为实体,则继续移步过程;情形二,根据专业本体知识模型判定栈顶词语是否为实体与实体之间的关系词,如果为关系词,由专业本体获取该关系词的实施实体,如果栈中实体词对实施实体存在修饰关系,则将该实体规约为当前实体的修饰实体Entity*,将栈中其它词语规约为当前实体的检索条件短语Condition,如果不为关系词,则继续移步过程;情形三,根据属性值语义库判定栈顶词语是否为具有实体意义的属性值,如果若为此类属性值,则获取该属性值可代表的实体,如果栈中实体对属性值实体存在修饰关系,则将该实体规约为当前实体的修饰实体Entity*,将栈中其它词语及属性值规约为当前实体的检索条件短语Condition,如果不为实体属性值,则继续移步过程;不断重复以上过程,直至分析到输入语句的右边界为止,若栈中只剩一个实体则分析成功,将此实体赋值给语法分析树CR中的Entity,将栈中其余词语赋值给语法分析树CR中的Target。4.根据权利要求3所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,对检索语句中检索目标进行特殊处理,首先对于祈使句,句首的检索动词不具备实际的检索意义,与陈述句的句式结构并无大的差异,同陈述句一样,直接按照移进规约算法构建语法树,而不同疑问句之间的句式结构也存在较大差别,部分疑问句作为陈述句对待,对这类疑问句也直接利用移进规约算法进行分析,而另外一些疑问句同陈述句在句式结构上存在较大差别,这类检索语句的用户检索目标实体以及属性为语句的前半部分,在对语句进行分析前,首先根据疑问词的位置是否位于语句前半部分,判定语句是否为检索目标位于句首的疑问句,若为此类疑问句,则从句首依次进行遍历,当前词语为实体词时将此词语定义为实体,并赋值给语法树CR中的Entity,然后对剩余词语按照移进规约算法进行检索条件识别,将分析后的结果作为Entity的修饰成分。5.根据权利要求1所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,本发明的NLQI是架构于关系型数据库之上的人机交互方式,关系型数据库的存储结构决定其所存储的数据与信息结构化较强,结合改进后语义文法分析树的特有结构,本发明提出基于专业本体和产生式规则的语义分析算法,对结构化短语和非结构化短语分别进行处理,并进行语义树调整,包括基于词性模板匹配细分检索短语、检索短语语义分析、语义分析...

【专利技术属性】
技术研发人员:高小翎王成
申请(专利权)人:高小翎
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1