当前位置: 首页 > 专利查询>彭楚奥专利>正文

一种服务机器人的语音语义识别方法技术

技术编号:15692534 阅读:157 留言:0更新日期:2017-06-24 06:38
本发明专利技术提供一种服务机器人的语音语义识别方法,具体包括如下步骤:系统词库建模:建立词库数据库;建立语义框架数据库;建立唇语模式库;系统通过语音识别系统采集用户输入的语音指令和面部视频,分别进行语音语义识别和视频片段唇语识别,根据二者结合识别的结果,将判断的所述中文语义通过显示界面显示。本发明专利技术针对不同服务领域设置名词数据库和语义框架数据库,机器人通过词库数据库、语义框架数据库与唇语模式库的结合,来理解所识别的语音指令所需要表达的中文含义,使得语音语义的识别更加准确。

A method of speech semantic recognition for service robot

The invention provides a voice recognition method for semantic service robot, and includes the following steps: System Modeling: establish thesaurus thesaurus database; establishing semantic database framework; the establishment of lip pattern library; system by speech recognition system to collect user input voice commands and facial video, respectively for voice and video clips for recognition of semantic recognition, according to the two the combination of recognition results, the Chinese semantic judgment through the display interface display. The present invention for different services set noun database and the semantic database framework, the robot through a combination of thesaurus database, semantic frame database and lip pattern library, Chinese meaning to understand the identified voice instructions need to express, make speech recognition more accurate semantic.

【技术实现步骤摘要】
一种服务机器人的语音语义识别方法
本专利技术涉及一种语音语义识别方法,尤其涉及一种服务机器人的语音语义识别方法。
技术介绍
计算机科学领域的一个重要分支就是“人工智能”,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。在自然语言处理方面,如何让机器人识别和理解人类的语言,并且模拟人类思维方式去思考、推理问题,是完成“人工智能”这个人类伟大理想的重要举措。不管是中文,还是英文的语言环境中,除了“你”“我”“他”等这类个别的例外之外,词组才是人类表达语义的最小单位。什么是语义?语义就是自然语言文本的涵义。对机器人来说,就是当机器人遇到这个文本输入的时候,应该进行的回答或响应。例如,当用户问“北京明天什么天气”,计算机能够理解这句话的意图是问天气信息,且城市是北京,时间是明天,从而执行的操作是从特定数据源中查询到北京明天的天气信息并呈现给用户。语义技术比较适合的应用类型至少有两种:一是操控类的应用,通过语音可以直接发出指令,如语音拨号,发短信等;二是信息查询类的应用,特别是查询条件比较多的情况,传统的交互方式需要用户用文字输入很多查询条件,这对用户来说很繁琐。而语义的交互方式可以让用户通过一句话或者多回合的对话方式获取其所要的信息。中国服务机器人的应用领域包括金融、家庭服务、教育、医疗、物流、国防、住宿餐饮、电子商务等。对于服务型机器人我们现阶段主要有的就是餐饮机器人、家居机器人、娱乐机器人以及医疗看护机器人等。而且现在的这种类型的机器人已经逐渐被人们接受,使用率也越来越高。对于服务机器人来说,语音语义技术需要实现的技术目标,是使服务机器人能够理解人类对他输入的句子的意思,这里需要强调的是“理解”,而不是“识别”。识别指的是语音识别,具体是指通过语音识别分析出这句话说的是什么;而理解指的是语义识别,具体是指语义识别分析出这句话是什么意思。机器人要正确理解用户的意思并作出反应,语义识别实际上更为关键。现有的服务机器人大部分设置有摄像头,通过摄像头的视频录制和实施人工监控,使得即使在嘈杂的环境中,语音识别的正确率仍能保持,在多音源的情况下,识别的准确度需要其他功能的辅助提升语音语义识别的准确度。目前的服务机器人在语音语义识别过程中,仍存在诸多的问题,例如语音设备在采集过程或采集设备本身会带来干扰,导致其准确率不高,或者语音识别基本能涵盖准确识别结果,但是在实时识别过程中需要采用大型的计算机硬件设备,计算量大。因此,对于服务机器人来说,不仅如何快速、准确识别用户发出的语音指令并对指令的语义进行理解后,做出相应的响应或者回复是体现一个服务机器人性能的重要指标,能否将识别设备变得轻巧、可移动和便携,是一个新的客体要求。对比文件1:CN102681982A公开一种可让计算机理解的自然语言句子的自动语义识别的方法,涉及到一种可以准确的识别汉语语言的方法。具体它包括以下步聚:a、在某个领域建立本体库;b、基于领域本体建立语义框架知识库;c、基于语义框架的本体映射,实现自然语言句子到语义结构的直观匹配;根据框架模式进行匹配性识别。在出现干扰时,其语音语义识别度容易出现误差,具有局限性。对比文件2:CN104409075A公开一种语音识别方法,在接收到语音信号时,控制图像采集装置进行图像采集,并在所述语音信号结束时,控制所述图像采集装置停止图像采集;对接收到的语音信号进行识别,以得到语音信号识别结果;对采集到的图像中包含唇部的图像进行唇语识别,以得到唇语识别结果;计算所述语音信号识别结果和唇语识别结果的准确度,将准确度较高的识别结果作为当前的语音识别结果。其通过对所采集的视频进行唇语识别,耗费时间长,计算机计算量大,且需要较大型计算机硬件设备进行支持。
技术实现思路
本专利技术要解决的技术问题是提供一种服务机器人的语音语义识别方法,该语音语义识别方法能快速、准确地识别用户发出的语音指令,并对语音指令的语义进行理解后作出相应的回复或者响应;通过唇语识别,对语音语义识别进行辅助后匹配,使得准确率更高。为了解决上述技术问题,本专利技术采用以下技术方案:提供一种服务机器人的语音语义识别方法,具体包括如下步骤:S1、系统词库建模:S101、建立词库数据库,所述词库数据库包括代词数据库、动词数据库和名词数据库,将中文汉字中为代词、动词和名词属性的词语和成语分别存入相应的代词数据库、动词数据库和名词数据库;S102、同时,建立语义框架数据库,所述语义框架数据库包括存入的词语可能的组合方式及组合在一起对应的中文意思;S103、同时建立唇语模式库,所建立模式库由面部唇语视频运算识别得到模式特征码或由中文文字反推得到标准模式特征码;S2、系统通过语音识别系统采集用户输入的语音指令和面部视频,将语音指令识别为中文语句,然后将中文语句进行拆解,拆解形式为:代词+动词+名词,并对应词库数据库和语义框架数据库,得到该语音指令的中文语义;S3、根据语义解析矫正语音识别结果,并输出综合评价概率Pa,其中,Pa为归一化值;S4、取参数C0,当Pa<C0时,进入S5;否则进入S10;S5、输出各语义片段识别结果可信概率Ps(1)~Ps(N);S6、取参数C1、K,当某语音片段识别结果可信概率Ps(n)<C1(n=1~N)时,语义识别输出可信概率最大的K个识别结果(K≥2),否则进入S9;S7、获取步骤S6中K个识别结果的唇语模式特征RTs(k),其中k=1~K;S8、根据语音识别系统截取的对应的面部视频片段,通过视频唇部运动模式提取,并形成唇部运动模式特征码RTs0;S8、使用模式匹配算法,以RTs0和RTs(1)~RTs(k)作为输入,获得VP(1)~VP(K),并取最小值,即Vpmin(k)=min//PTs(k)-PT0//(k=1~K),其中//为距离算子;S9、输出Vpmin对应的结果作为识别结果,进入S5循环直至N片段识别完成,进入S10;S10、所述中文语义通过显示界面显示。进一步地,所述步骤S101中所述名词数据库中的名词按不同服务领域进行分类存储,所述服务领域包括餐饮、医疗、购物、运动、住宿、交通;步骤S102中对应的语音框架数据库也根据不同服务领域进行分类存储。比如:我要吃“饭/小龙虾”,对应的是餐饮领域;比如:我要看“病”,对应的是医疗领域;比如:我要买“手机/书本”,对应的是购物领域;比如:我要打“球/健身”,对应的是运动领域;比如:我要找“酒店/住宿”,对应的是住宿领域;再比如:我要去“机场”,对应的是交通领域。进一步地,步骤S2中,当系统识别的语音指令的中文语义中包含用户“要”、“想要”、“需要”某件物品或者做某件事情或者“将要”做某件事情的语义时;所述语音语义识别方法还包括步骤:S11、系统获取当前用户的位置,同时在该位置附近对包含某件事情或者某件物品的名词相关的事务进行搜索,搜索结果通过显示界面显示。例如:当用户输入的语音指令为“我要买书”时,系统会获取到用户的当前位置,将附近可以的书店或者可以买书的商家关联对接起来,再查询出价格和库存等信息后对用户进行反馈,并将结果显示在显示界面上。进一步地,语音语义识别方法还包括步骤本文档来自技高网
...

【技术保护点】
一种服务机器人的语音语义识别方法,其特征在于,具体包括如下步骤:S1、系统词库建模:S101、建立词库数据库,所述词库数据库包括代词数据库、动词数据库和名词数据库,将中文汉字中为代词、动词和名词属性的词语和成语分别存入相应的代词数据库、动词数据库和名词数据库;S102、同时,建立语义框架数据库,所述语义框架数据库包括存入的词语可能的组合方式及组合在一起对应的中文意思;S2、系统通过语音识别系统采集用户输入的语音指令和面部视频,将语音指令识别为中文语句,然后将中文语句进行拆解,拆解形式为:代词+动词+名词,并对应词库数据库和语义框架数据库,得到该语音指令的中文语义;S3、根据语义解析矫正语音识别结果,并输出综合评价概率Pa,其中,Pa为归一化值;S4、取参数C0,当Pa<C0时,进入S5;否则进入S10;S5、输出各语义片段识别结果可信概率Ps(1)~Ps(N);S6、取参数C1、K,当某语音片段识别结果可信概率Ps(n)<C1(n=1~N)时,语义识别输出可信概率最大的K个识别结果(K≥2),否则进入S9;S7、建立唇语模式库,获取步骤S6中K个识别结果的唇语模式特征RTs(k),其中k=1~K;S8、根据语音识别系统截取的对应的面部视频片段,通过视频唇部运动模式提取,并形成唇部运动模式特征码RTs0;S8、使用模式匹配算法,以RTs0和RTs(1)~RTs(k)作为输入,获得VP(1)~VP(K),并取最小值,即Vpmin(k)=min//PTs(k)‑PT0//(k=1~K),其中////为距离算子;S9、输出Vpmin对应的结果作为识别结果,进入S5循环直至N片段识别完成,进入S10;S10、所述中文语义通过显示界面显示。...

【技术特征摘要】
1.一种服务机器人的语音语义识别方法,其特征在于,具体包括如下步骤:S1、系统词库建模:S101、建立词库数据库,所述词库数据库包括代词数据库、动词数据库和名词数据库,将中文汉字中为代词、动词和名词属性的词语和成语分别存入相应的代词数据库、动词数据库和名词数据库;S102、同时,建立语义框架数据库,所述语义框架数据库包括存入的词语可能的组合方式及组合在一起对应的中文意思;S2、系统通过语音识别系统采集用户输入的语音指令和面部视频,将语音指令识别为中文语句,然后将中文语句进行拆解,拆解形式为:代词+动词+名词,并对应词库数据库和语义框架数据库,得到该语音指令的中文语义;S3、根据语义解析矫正语音识别结果,并输出综合评价概率Pa,其中,Pa为归一化值;S4、取参数C0,当Pa<C0时,进入S5;否则进入S10;S5、输出各语义片段识别结果可信概率Ps(1)~Ps(N);S6、取参数C1、K,当某语音片段识别结果可信概率Ps(n)<C1(n=1~N)时,语义识别输出可信概率最大的K个识别结果(K≥2),否则进入S9;S7、建立唇语模式库,获取步骤S6中K个识别结果的唇语模式特征RTs(k),其中k=1~K;S8、根据语音识别系统截取的对应的面部视频片段,通过视频唇部运动模式提取,并形成唇部运动模式特征码RTs0;S8、使用模式匹配算法,以RTs0和RTs(1)~RTs(k)作为输入,获得VP(1)~VP(K),并取最小值,即Vpmin(k)=min//PTs(k)-PT0//(k=1~K),其中////为距离算子;S9、输出Vpmin对应的结果作为识别结果,进入S5循环直至N片段识别完成,进入S10;S10、所述中文语义通过显示界面显示。2.根据权利要求1所述的一种服务机器人的语音语义识别方法,其特征在于,所述步骤S101中所述名词数据库中的名词按不同服务领域进行分类存储,所述服务领域包括餐饮、医疗、购物、运动、住宿、交通;步骤S102中对应的语音框架...

【专利技术属性】
技术研发人员:彭楚奥
申请(专利权)人:彭楚奥
类型:发明
国别省市:湖南,43

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1