当前位置: 首页 > 专利查询>涂悦专利>正文

基于后验证的辅助控制方法及系统技术方案

技术编号:15329493 阅读:140 留言:0更新日期:2017-05-16 13:09
一种基于后验证的辅助控制方法及系统,通过对原始指令信号进行预处理得到辅助控制信息,按领域对辅助控制信息进行语法模板匹配,得到指令操作体部分和操作参数部分;再采用所述领域对应的后验证方法解析操作参数部分,将解析所得的匹配度最高的结果作为指令操作体部分的操作参数,生成辅助控制指令并发送至中央处理单元进行操作,从而实现辅助控制。本发明专利技术在现有的语法检索基础上大幅度提高语义识别的准确度,通过模拟人类对语言的理解方式,将用户输入的口语化表达内容中所有可以提取的语义全部进行识别,能够显著提高识别率和用户体验。

Auxiliary control method and system based on post verification

Based on the verified after auxiliary system and control method, based on the original signal auxiliary control information preprocessing, according to the field of auxiliary control information for syntax template matching, get instructions and operating parameters of body parts; then by the field of the verification operation parameters of analytical method, analytical the best matching result as part of the operating parameters of operating instructions, generating auxiliary control command is sent to the central processing unit to operate, so as to realize the auxiliary control. The invention greatly improves the retrieval based on the semantic recognition accuracy in the existing grammar, through the simulation of human understanding of the language, the content of colloquial expressions in all user input can be extracted from the semantic identification of all, can significantly improve the recognition rate and user experience.

【技术实现步骤摘要】
基于后验证的辅助控制方法及系统
本专利技术涉及的是一种语义识别领域的技术,具体是一种基于后验证的辅助控制方法及系统。
技术介绍
通过语义识别使得人工智能能够更好地理解人类,并最终对硬件工作状态进行调整是目前工业自动化控制领域面临的主要难题。现有的语义识别主要基于自然语言理解,通常采用语法+关键词列表的正则表达式检索方法。比如:语法为:我要吃<slot1>;而关键词,即<slot1>为具体食物名称、饭店名称等。一般的识别方法在符合语法的情况下,将关键词“吃”后的所有字符与关键词列表进行逐一匹配,当存在匹配结果时才会进行后续操作。虽然现有的语音/语义识别技术基本实现了识别用户语音内容中最关键信息,即意图。但对于附加与意图上的细节参数则很难精细识别。一旦知识库中没有记录过类似的关键词,则系统将会反馈报错、不知道用户在说什么或直接在网上搜索该字符作为后续操作。虽然可以通过不断对知识库进行更新以增加识别率,但自然语言的发展和理解速度发展则更快,因此而带来的不足非常明显:1、识别同步性和占用资源两者之间难以兼顾:随着事物更新发展,关键词列表将会变得非常庞大。维护不同语法的对应关键词列表将导致巨大的工作量和系统资源,从而降低识别性能;关键词列表的维护同步度不高则将导致对新的关键词无法识别;如增加模糊检索则将进一步导致资源的占用和用户体验的下降。2、语法表述的规范性:用户必须严格按照系统预设的方式进行语法表述,口语化的输入、倒置、后置或强调句式很难被明确地识别出正确的语义。使得实际识别过程中对用户的知识表达水平较高,限制了语音技术的普及。3、存在歧义或匹配无结果时无法后续智能处理:当多个不同领域采用相同的语法时,关键词的理解上很容易由于歧义产生冲突。如同一个句型在多个领域都出现(如”我要听<slot>”会同时出现在音乐,电台,听书,课程,诗词等领域),那么这些领域有相同关键词的时候,从语义解析本身,他们之间是无法区分优先级的。如“我要听满江红”,“满江红”同时属于音乐,书,诗词。或者当关键词和语法本身产生歧义的时候,难以区分,如“我要听张三的歌”,当歌手的关键词里有“张三”,同时歌名的关键词里有“张三的歌”时,会同时匹配两个语法:我要听<slot1>的歌,我要听<slot2>。综上,现有的识别技术虽然可以在一定程度上通过语法识别出用户的大致意图,但对于基于该意图的精确参数很难识别准确,识别的结果是直接将含有参数意义的内容判断为普通字符,使得用户输入的语义丢失。
技术实现思路
本专利技术针对现有技术存在的上述不足,提出一种基于后验证的辅助控制方法及系统,在现有的语法检索基础上大幅度提高语义识别的准确度,通过模拟人类对语言的理解方式,将用户输入的口语化表达内容中所有可以提取的语义全部进行识别,能够显著提高识别率和用户体验。本专利技术是通过以下技术方案实现的:本专利技术涉及一种基于后验证的辅助控制方法,通过对原始输入进行按领域的语法模板匹配,得到至少一组领域信息及其对应的操作参数部分,然后对每一组所述领域信息对应的知识库对操作参数部分进行匹配,再对匹配结果进行后验证,将后验证优选的至少一组匹配结果通过中央处理单元进行操作,实现辅助控制。所述的原始输入为多模态形式,包括影像、声音或其数字格式的文件、通过外部设备输入的字符串等,优选为声音或其数字格式的文件或其与字符串的组合。所述的原始输入优选经类型判断和对应的预处理,以得到能够进行逻辑操作的字符,即待解析语句字符串。所述的预处理,采用但不限于将原始输入中的声音或其数字格式统一调整为能够被现有的语音识别技术识别出的格式,并经特征提取后与模型匹配,得到对应的待解析语句字符串。所述的特征,优选采用MFCC(Mel‐frequencyCepstrumCoefficients,梅尔倒谱系数)。所述的模型,包括但不限于:隐马尔可夫模型、混合高斯模型、深度神经网络模型、卷积神经网络模型等。所述的语法模板匹配是指:以常见句式中所包含的关键字生成对应的正则表达式,以DFA(确定性有穷自动机)方式进行匹配,匹配后根据关键字将原始输入进行切分,并得到领域信息和由至少一个子参数体组成的操作参数部分。所述的控制对象包括但不限于:通过网络无线或有线连接的能够接收外部指令和参数的任何设备,优选为普通终端的外部设备,如音响、显示器、GPS定位模块、NFC模块、具有可调控制器的家用电器、载具等;也可以是普通终端的内部模块或程序,如导航模块、闹钟模块等。对应地,上述领域信息中包含有用户选择的具体某一个确定的控制对象;操作参数部分则是针对该控制对象的具体调整要求,如将音响音量调大/小,将显示器调亮/暗,开启导航软件并设置目的地进行导航等。每一个所述的领域信息对应至少一个正则表达式,不同的领域信息的正则表达式可以相同。所述的后验证是指:根据所述正则表达式确定的操作参数部分,在领域信息对应的实体知识库和/或行为知识库中进行匹配,再根据匹配结果对应的分值计算出后验证结果评价指标。本专利技术通过以至少一个语法匹配的方式得到至少一个原始输入的语义判断后,再通过前述后验证的方法评估多个语义判断中的最接近结果。优选地,所述的领域信息包括子参数体的类型,即实体知识库类型或行为知识库类型。优选地,所述的领域信息进一步包括其所对应的正则表达式的用于计算出后验证结果评价指标的分值。优选地,所述的匹配,预先对操作参数进行预处理后再进行匹配。所述的预处理包括但不限于:对操作参数部分进行字符增加冗余、删除首字符、删除尾字符、字符重排、拼音前后鼻音调整或方言拼音替换等,优选地,预处理所采用的操作与领域信息子参数体的类型相关,即根据自参数体的类型进行对应的预处理操作。所述的匹配,将自参数体与实体知识库和/或行为知识库进行匹配,并得到匹配结果分值。所述的实体知识库包括名词性的单词,其包括但不限于:通讯录或网络常见的人名、地名、时间、商品名等等。所述的实体知识库通过全文搜索引擎、关键词索引的方式实现匹配,并对匹配相似度进行赋值。所述的关键词索引优选包括所有关键词的拼音索引。所述的行为知识库包括动词性的单词及其短句,该行为知识库通过建立特征向量并比较其与子参数体之间的欧氏距离或通过全文搜索引擎、关键词索引的方式实现匹配。所述的实体知识库和/或行为知识库优选配置有程度知识库,该程度知识库包括形容词或副词性的单词,其包括但不限于:根据名词性的单词的种类或参数的描述、根据动词性的单词及其短句的程度的描述等。所述的程度知识库通过全文搜索引擎、关键词索引的方式实现匹配,并对匹配相似度进行赋值。所述的后验证结果评价指标采用但不限于:将上述所有分值累加或加权累加所得到的结果。所述的加权优选采用程度知识库的对应赋值实现。所述的后验证优选是指:将至少一组领域信息及其对应的操作参数部分的后验证结果评价指标与预设值进行比较、或将多组领域信息及其对应的操作参数部分的后验证结果评价指标之间进行比较,或其组合。优选地,所述的预设值在每次后验证后进行更新。进一步优选地,所述的预设值对应不同的领域信息各不相同。例如:在歌曲知识库中,以切分词为“的”,当外部对象为“张学友的歌”时,则提取到的外部子对象为“张学友”,后验证方法将本文档来自技高网
...
基于后验证的辅助控制方法及系统

【技术保护点】
一种基于后验证的辅助控制方法,其特征在于,通过对原始输入进行按领域的语法模板匹配,得到至少一组领域信息及其对应的操作参数部分,然后对每一组所述领域信息对应的知识库对操作参数部分进行匹配,再对匹配结果进行后验证,将后验证优选的至少一组匹配结果通过中央处理单元进行操作,实现辅助控制;所述的后验证是指:根据所述正则表达式确定的操作参数部分,在领域信息对应的实体知识库和/或行为知识库中进行匹配,再根据匹配结果对应的分值计算出后验证结果评价指标。

【技术特征摘要】
1.一种基于后验证的辅助控制方法,其特征在于,通过对原始输入进行按领域的语法模板匹配,得到至少一组领域信息及其对应的操作参数部分,然后对每一组所述领域信息对应的知识库对操作参数部分进行匹配,再对匹配结果进行后验证,将后验证优选的至少一组匹配结果通过中央处理单元进行操作,实现辅助控制;所述的后验证是指:根据所述正则表达式确定的操作参数部分,在领域信息对应的实体知识库和/或行为知识库中进行匹配,再根据匹配结果对应的分值计算出后验证结果评价指标。2.根据权利要求1所述的基于后验证的辅助控制方法,其特征是,所述的语法模板匹配是指:以常见句式中所包含的关键字生成对应的正则表达式,以DFA方式进行匹配,匹配后根据关键字将原始输入进行切分,并得到领域信息和由至少一个子参数体组成的操作参数部分。3.根据权利要求1或2所述的基于后验证的辅助控制方法,其特征是,所述的领域信息包括用户选择的具体某一个确定的控制对象;操作参数部分包括针对所述控制对象的具体调整要求。4.根据权利要求3所述的基于后验证的辅助控制方法,其特征是,每一个所述的领域信息对应至少一个正则表达式,不同的领域信息的正则表达式可以相同。5.根据权利要求3所述的基于后验证的辅助控制方法,其特征是,所述的领域信息包括子参数体的类型,即实体知识库类型或行为知识库类型。6.根据权利要求3所述的基于后验证的辅助控制方法,其特征是,所述的后验证中,通过以至少一个语法匹配的方式得到至少一个原始输入的语义判断后,再通过前述后验证的方法评估多个语义判断中的最接近结果。7.根据权利要求6所述的基于后验证的辅助控制方法,其特征是,所述的领域信息包括该领域所对应的正则表达式的用于计算出后验证结果评价指标的分值。8.根据权利要求6所述的基于后验证的辅助控制方法,其特征是,所述的匹配,预先对操作参数进行预处理后再进行匹配。9.根据权利要求8所述的基于后验证的辅助控制方法,其特征是,所述的预处理所采用的操作与领域信息子参数体的类型相关,即根据自参数体的类型进...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:涂悦
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1