当前位置: 首页 > 专利查询>张建华专利>正文

一种控制方法及语音操作系统技术方案

技术编号:15355540 阅读:164 留言:0更新日期:2017-05-17 13:18
本发明专利技术提出了一种在操作系统上实现语音操作的方法,基于语义关键字和代表字关键字,其中代表字关键字尤其适合使用颜色,通过在相应元素上标识相应的文字或图形,以使用代表字关键字替代鼠标进行视窗内不同元素的定位选定操作,本发明专利技术还包括基于该方法的语音操作系统及应用程序。

【技术实现步骤摘要】

本专利技术提出了一种在操作系统上简易实现全语音操作的方法,以及基于该方法的操作系统和软件。
技术介绍
随着语音识别技术的发展与完善,语音识别逐渐走入人们的生活,甚至开始在生活中占据主导地位,然而,语音识别技术依然面临许多难题,阻碍了它融入人们生活的脚步,至今都没有一个完全可以用语音进行所有操作的操作系统,前几年大出风头的智能眼镜虽然可以用语音实现很多操作,但也有很多操作需要结合手势才能完成。
技术实现思路
本专利技术提出了一种可全语音操作的控制方法及基于该方法的语音操作系统、应用程序。本专利技术所采用的技术方案是:本专利技术所有内容都基于由语义关键字和代表字关键字构成的语音操作方法,由语义关键字进行快捷操作,而代表字关键字主要进行定位操作。本专利技术的有益效果是:一是该操作系统可以使用全语音方式进行操作,这样电视类不便移动且操作距离较远的电子产品操作更加方便,且更有利于其智能化;二是可利用触屏、鼠标、键盘等操作方式辅以语音操作使电子类产品的操作更加便捷高效;三是有利于各种家庭或个人消费类电子产品操作系统的融合统一,有利于互联互通方便人们的生活;四是有利于个人隐私、办公语音化,个人方面,在公共场合使用普通带语义的语音控制可能造成个人隐私偏好等泄露,同样也可能造成他人的困惑,但如果使用色码语音控制那就大大不一样啦,同理在办公场合也是,尤其人多的时候,使用色码语音控制更方便、也更像是在办公,这样办公也应该更有效率;五是本专利技术所述的突出显示方法更具娱乐性,上手更容易;六是所需语音识别内容的减少无疑会带来识别准确度的提升,减少各种系统资源占用,故而带来更小的成本包括个人更小的经济付出及社会各方面更少的投入。具体实施方式本专利技术权利要求1所述语音操作系统的控制方法,其基于语义关键字和代表字关键字进行控制,以替代鼠表、触屏进行视窗内不同元素或所有元素(专业中称为控件,但还包括控件中一些更小的元素,如多选框控件中的各选项等)的选定操作、单双击及右键快捷菜单操作、其他菜单等操作,,应作说明的是,该方式实现的全语音操作系统,只包括日常绝大多数的引用,但不包括需要记录鼠标的移动轨迹、不可分控件元素内更具体的某一点等不方便用色码进行替代的操作,此类操作的主要应用有绘图、现有的游戏等,故鉴于全语音操作系统的局限性,本专利技术不应限制于仅可语音操作的电子产品操作系统,而应是还可主要应用于鼠标、触屏、键盘等语音兼用的系统中。上述关键字中关键字并非仅限于一个字,也可以是多个字,语义关键字跟普通的音控产品一样都用于执行该关键字的语义相关的操作,如语音“打开我的电脑”“粘贴”“删除”等,而代表字关键字,如数字,颜色,天干地支序列,常见事物等,以它们的名称单个地或组合地指代视窗中的元素,每个元素上都标识有该元素的代表字关键字的相应标记文字或图形,如:若某元素代表字关键字为“苹果”,则在该元素上应有一个图像苹果标记;若某元素色码代表字关键字为“红色”,则在该元素上应有一个小的红色实心圆标记;若某元素的色码关键字为“红蓝白”,则在该元素上依序标识一个小的红色实心矩形、蓝色实心矩形和白色实心矩形。由于颜色做代表字优点很多,如远距离容易辨别,视窗内元素的标识记号占用空间可以较小,有很多可以用单字就可以表示的颜色,处理起来更方便,故下文仅以颜色作为代表字关键字进行说明。常见的颜色如:红橙黄绿青蓝紫白黑灰棕金银粉,此外还有一些单字可以用来代表不同深浅程度的颜色如:赤、墨、铅、朱、碧、苍、嫩、湛等,在此不再继续罗列,这些已基本足够日常使用,以上所列共22个色码关键字,如两两组合则为22乘以22共484种组合,若三个一组即三色编码则为484乘以22共10648种组合,可见用单双色即可满足一般应用中的元素数量,而用三色进行大体量文本编辑即字数较多时从第一个字开始逐字进行色码编码指代,不足时可以分页编码,其它大元素量的应用也可以同理进行,如放大某区域时,使用一个专用放大窗口,用色码制作成坐标系将屏幕分成若干规整的小块儿区域,并在各区域上标识相应色码标记,语音选择区域即可;再如电子表格,同样可以使用三色对每个单元格进行编码。各个应用可以根据自身情况选择何时使用单双色标识、何时使用三色标识,或者更多色组合的方法对视窗内的所有元素进行标识,并可以另外设置全局使能或局部使能的语义关键字(或代表字关键字)进行快捷语音操作。一般情况下代表字关键字只对当前活动窗口或当前活动程序有效,当然也可以预留一些代表字关键字进行跨窗口或系统全局、程序全局的操作。关于本专利技术权利要求3所述的语音操作系统,由于目前很多系统都推出了语音助手,通过远端的服务器向用户推送多种多样的服务,某些系统的语音助手还可以执行一些本地应用的内容,但基本都是对系统自带应用的支持,缺乏对应用的广泛支持,究其原因还是当前语音识别技术发展水平的限制,然而基于本专利技术所述操作方法的语音操作系统如能以代表字关键字对全部系统操作及全部可见元素进行编码指代,同时对少数常用操作以语义关键字进行替代,这样就大大降低了所需技术的复杂程度,如目前市场上的语音识别芯片中,能力最前的可以对非特定人的50组字词进行识别,而上文中所列仅22个颜色代码就可以满足对系统所有操作的广泛覆盖,剩余还有28组字词可供系统或应用程序分配使用,再加上很多时候色码关键字是比较富余的,也可以拿其来设置为某些快捷操作,从而使用户拥有丰富的选择性。基于这样的理念,所有的语音控制关键字,包括全局使能的关键字和局部使能的关键字,及该关键字在各应用的功能、使用方法,都应该由系统统一管理和分配,且都应被记录和管理于同一个文件或文件系统、程序、注册表、数据库中,应用程序或系统可以根据需要增加、删除或更改关键字及该关键字的功能、使用方法,或者称之为所有应用程序包括系统都应遵循同一个语音控制操作规范。关于权利要求4所述的语音操作系统,因由代表字构成的语音系统的特殊性,其语音控制命令不便于被记忆,故应有一个语音关键字导航侧边栏,随时全屏或非全屏显示可用的语音命令,包括全局命令、局部命令及视窗内所选元素的相关命令。而这些可用的命令都需要查询系统文件才能得到,即权利要求2中所述的统一记录所有语音控制关键字及其功能、使用方法的文件或文件系统、程序、注册表、数据库。关于权利要求5所述的语音操作系统,一般以孤立字进行识别的系统,字与字的语音输入之间一般需要间隔一小段时间,这一小段时间可能会使用户比较不安烦躁,故本专利技术增加了与用户的互动,更增添了一份娱乐性,即在每识别出一个代表字关键字后将视窗内所有元素的代表字标记的相应标识段与已识别出的标识内容进行匹配,并将匹配正确的元素的代表字标记,一个标记一个标记地突出显示,或将一整个标记整体突出显示,即在用户语音输入代表字关键字而尚未输入完毕时将所有可能匹配的元素的代表字标记进行突出显示。例如,视窗内某元素的代表字关键字为“红绿”,用户依次语音输入,用户语音输入“红”后,系统识别出“红”并将视窗内所有第一个色码标识为红的元素的首位的红色色码标记进行突出显示,这样用户也可以确认系统没有识别错误,减少了不必要的麻烦,用户再次语音输入“绿”,系统识别出“绿”并以前两位为红绿标识进行匹配,从而匹配出用户所要操作的对象并将该对象突出显示。关于权利要求5所述的语音控制应用程本文档来自技高网...

【技术保护点】
一种语音操作系统的控制方法,使用带语义的关键字进行控制,其特征是:还具有代表字关键字,用代表字关键字对视窗内的不同种类的元素进行统一编码,并在相应元素上做相应标记,以使用代表字关键字进行视窗内可见元素的语音选定操作。

【技术特征摘要】
1.一种语音操作系统的控制方法,使用带语义的关键字进行控制,其特征是:还具有代表字关键字,用代表字关键字对视窗内的不同种类的元素进行统一编码,并在相应元素上做相应标记,以使用代表字关键字进行视窗内可见元素的语音选定操作。2.基于权利要求1所述的控制方法,其特征是:所述的代表字关键字为代表颜色的字。3.基于权利要求1、2所述控制方法的语音操作系统,其特征是:系统内所有应用程序包括系统都遵循同一个语音控制操作规范,即所有语音控制关键字,包括全局使能的关键字和局部使能的关键字,及该关键字在各应用的功能、使用方法,都被记录和管理于同一个文件或文件系统、程序、注册表、数据库中,应用程序和系统可以根据需要增加、删除或更改关键字及该关键字的功能、使用方法。4.基于权利要求3的语音操作系统,其特征是:该...

【专利技术属性】
技术研发人员:张建华
申请(专利权)人:张建华
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1