【技术实现步骤摘要】
智能高效的印刷业管理系统NLQI改进方法
[0001]本专利技术涉及一种印刷业管理系统NLQI改进方法,特别涉及一种智能高效的印刷业管理系统NLQI改进方法,属于高效NLQI改进
技术介绍
[0002]随着大数据时代的到来,数据已成为一种重要的生产力。面对海量数据,如何以更为友好的方式实现对数据快速检索成为一项难题。现阶段,对关系数据库的检索方式主要有两种:一种是面向专业人员的形式化检索语言,如SQL,另一种是面向用户的图形化操作界面。形式化检索语言功能强大,但其有着较强的语法限定,对于普通用户来说较难掌握。而图形化检索界面在检索时需要将后台数据库结构呈现给用户,对于复杂的数据库结构,其界面会过于复杂,从而会大幅降低图形化界面的人机交互性和检索效率。另外,图形化界面的检索功能较弱,只能进行简单的单表检索。
[0003]自然语言检索接口(NLQI)是一种用户可通过自然语言的方式同计算机进行交互,以获得相关信息的智能化界面,它是自然语言处理技术在人机交互接口上的具体应用,利用自然语言处理技术将用户自然检索语句转换为形式化检索语言,由形式化语言完成具体检索过程。与形式化检索语言、图形化检索界面相比,NLQI具有以下优势:一是较强的人机交互性,以自然语言的方式进行检索,或者结合语音识别技术进行语音检索,更加符合用户习惯;二是物理与逻辑独立性,NLQI是架构于形式化检索语言之上的检索技术,它依靠领域内相关术语进行数据库检索,数据库物理存储及逻辑上的结构无需呈现给用户,人机交互界面更加简洁;三是易于掌握,用户通 ...
【技术保护点】
【技术特征摘要】
1.智能高效的印刷业管理系统NLQI改进方法,其特征在于,一是对语义文法进行改进,改进后语义文法的分析规则简化为对三类非完结点的判定,且将判定过程交由本体完成;二是基于自然语言检索语句结构化与非结构化短语并存的特征,结合改进后语义文法树的特有结构,提出一种以结构化短语分析为主,非结构化短语单独处理的语义分析方法,该方法包括:基于词性模板匹配细分检索短语、基于本体的结构化短语语义解析、基于规则的非结构化短语语义演绎推断、语义树校正和形式化语言SQL生成五部分;三是提出印刷业管理系统NLQI的系统架构,并提出印刷物料管理模块的NLQI;本发明基于数据库NLQI的语法分析、语义分析和算法,对印刷业管理系统NLQI进行改进,主要包括:第一,采用语义文法构建检索语句语法分析树,并对语义文法进行改进;对语义文法的结构进行了改进,将非完结点归纳为三类:实体、检索条件和检索目标,分析规则被简化为对这三类非完结结点的判定,且判定过程交由专业本体负责,改进后语义文法,使语义文法树结构得到简化,降低文法规则的编写工作量,同时增强语义文法的可移植性;第二,针对改进后语法树结构,提出一种结构与非结构化分别处理的语义分析算法;基于改进后的语义文法构建的语法树特殊结构,并结合自然语言检索语句结构化短语与非结构化短语并存的特征,提出基于专业本体与产生式规则的语义分析算法,采用词性模板匹配算法对检索短语进行细分,根据匹配结果将细分短语划分为:结构化短语和非结构化短语,对两类细分短语分别采用基于专业本体模型的分析算法和基于产生式规则的推理算法进行语义分析,将其转换为标准检索条件六元组和标准检索目标两元组结构,最后根据语义分析结果,对语义分析树进行校正,将校正后的语义树转换为形式化检索语言SQL,结构化短语和非结构化短语分而治之,扩大NLQI的适用范围,提高自然语言检索语句的转换准确率;第三,设计实现印刷业管理系统物料管理模块NLQI,设计印刷业管理系统NLQI的系统架构,以此为基础实现物料管理模块NLQI,构建物料管理模块数据库、专业本体以及规则库、分词和词性标注词典、同义词词典、单位换算词典和属性值语义库,增强印刷业管理系统的检索功能。2.根据权利要求1所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,构建语法树对词性序列进行语法分析,首先基于语义文法的形式文法和上下文无关文法存在的缺点进行改进,并基于改进后的语义文法构建语法分析树;NLQI语义文法改进方法和过程:检索语句由三部分构成:目标实体、目标实体属性和目标实体的修饰成分,其中,目标实体的修饰成分由两部分构成:一个是对目标实体进行修饰的其它实体,另一个是实体的修饰短语,依次类推,每一个实体的修饰成分都均由这两部分构成,另外,结合对SQL的分析,在语法功能上,所提到的目标实体的修饰成分、目标实体及目标实体属性同SQL语句中的Where子句、From子句和Select子句相对应,本发明在现有技术语义文法的基础之上做如下定义以及改进:定义1:语法分析树CR={Entity,Target},其中,Entity表示实体,是对某一具体概念的表示,Target表示检索目标短语,是用户要检索目标实体的属性,或为缺省值;定义2:实体Entity={Text,Entity*,Condition},其中,Text表示该实体的名称,Entity*表示修饰Entity的实体,Condition表示修饰实体的短语,即检索条件短语;
对比形式文法四元组F=(M,Σ,Q,C),实体Entity、检索目标Target和检索条件Condition对应形式文法F中集合M所包含的非完结结点,检索条件Condition和检索目标Target中的各词语对应形式文法F中集合Σ所包含的完结符,CR为语句的初始符,对应F中的C,规则的有限集合Q则被简化为三条,即对实体Entity、检索条件短语Condition和目标属性短语Target的判定。3.根据权利要求2所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,基于改进后语义文法构建语法树:本发明基于移进规约算法构建语法分析树,首先对输入的检索语句自左至右进行扫描,并把输入的词语逐个移入一个先进后出的栈中,边移入边进行分析,移入的过程为移步,本发明规约的过程分为三种情形:情形一,根据专业本体知识模型判定栈顶元素是否为实体,若为实体,且栈中实体词对该实体存在修饰关系,则将该实体规约为当前实体的修饰实体Entity*,将栈中其它词语规约为当前实体的检索条件短语Condition,若不为实体,则继续移步过程;情形二,根据专业本体知识模型判定栈顶词语是否为实体与实体之间的关系词,如果为关系词,由专业本体获取该关系词的实施实体,如果栈中实体词对实施实体存在修饰关系,则将该实体规约为当前实体的修饰实体Entity*,将栈中其它词语规约为当前实体的检索条件短语Condition,如果不为关系词,则继续移步过程;情形三,根据属性值语义库判定栈顶词语是否为具有实体意义的属性值,如果若为此类属性值,则获取该属性值可代表的实体,如果栈中实体对属性值实体存在修饰关系,则将该实体规约为当前实体的修饰实体Entity*,将栈中其它词语及属性值规约为当前实体的检索条件短语Condition,如果不为实体属性值,则继续移步过程;不断重复以上过程,直至分析到输入语句的右边界为止,若栈中只剩一个实体则分析成功,将此实体赋值给语法分析树CR中的Entity,将栈中其余词语赋值给语法分析树CR中的Target。4.根据权利要求3所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,对检索语句中检索目标进行特殊处理,首先对于祈使句,句首的检索动词不具备实际的检索意义,与陈述句的句式结构并无大的差异,同陈述句一样,直接按照移进规约算法构建语法树,而不同疑问句之间的句式结构也存在较大差别,部分疑问句作为陈述句对待,对这类疑问句也直接利用移进规约算法进行分析,而另外一些疑问句同陈述句在句式结构上存在较大差别,这类检索语句的用户检索目标实体以及属性为语句的前半部分,在对语句进行分析前,首先根据疑问词的位置是否位于语句前半部分,判定语句是否为检索目标位于句首的疑问句,若为此类疑问句,则从句首依次进行遍历,当前词语为实体词时将此词语定义为实体,并赋值给语法树CR中的Entity,然后对剩余词语按照移进规约算法进行检索条件识别,将分析后的结果作为Entity的修饰成分。5.根据权利要求1所述的智能高效的印刷业管理系统NLQI改进方法,其特征在于,本发明的NLQI是架构于关系型数据库之上的人机交互方式,关系型数据库的存储结构决定其所存储的数据与信息结构化较强,结合改进后语义文法分析树的特有结构,本发明提出基于专业本体和产生式规则的语义分析算法,对结构化短语和非结构化短语分别进行处理,并进行语义树调整,包括基于词性模板匹配细分检索短语、检索短语语义分析、语义分析...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。