文本编辑器语音识别方法及装置制造方法及图纸

技术编号:27845805 阅读:17 留言:0更新日期:2021-03-30 12:51
本申请公开了一种文本编辑器语音识别方法及装置,提供了一种无需手动切换语音识别的输入法便可直接完成文本输入的实现方式。其中,文本编辑器语音识别方法,包括以下步骤:调用文本编辑器提供的接口,获取音频信息;根据所述音频信息,在数据库中确定匹配的文本;输入所述匹配的文本到对应的待编辑文本域;所述待编辑文本域用于提供文本输入。文本编辑器语音识别装置包括:获取模块,用于获取音频信息;匹配模块,用于根据所述音频信息,在数据库中确定匹配的文本;输入模块,用于输入所述匹配的文本到对应的待编辑文本域;所述待编辑文本域用于提供文本输入。域用于提供文本输入。域用于提供文本输入。

【技术实现步骤摘要】
文本编辑器语音识别方法及装置


[0001]本申请涉及手写输入
,尤其涉及一种文本编辑器语音识别方法及装置。

技术介绍

[0002]人们在使用手机或者平板电脑时,很多人喜欢使用语音识别的方式进行文字输入,语音识别也是比较成熟的技术。
[0003]在实现现有技术的过程中,专利技术人发现:
[0004]目前许多文本编辑器并没有语音输入功能。为了在文本编辑器的正文里插入语音识别后的文字,需要额外去找支持语音识别的输入法。从而导致语音识别文字输入连续性差,工作效率低。
[0005]因此,需要提供一种实现文本编辑器语音识别相关技术方案,用于在使用文本编辑器时,无需手动切换语音识别的输入法便可直接完成文本输入。

技术实现思路

[0006]本申请实施例提供一种实现文本编辑器语音识别方案,用于解决输入文本需要手动激活文本框的技术问题。
[0007]在本申请提供的一种文本编辑器语音识别方法,包括以下步骤:
[0008]调用文本编辑器提供的接口,获取音频信息;
[0009]根据所述音频信息,在数据库中确定匹配的文本;
[0010]输入所述匹配的文本到对应的待编辑文本域;
[0011]其中,所述待编辑文本域用于提供文本输入。
[0012]进一步的,所述文本编辑器提供的接口为Linux系统下WPS Office提供的接口。
[0013]进一步的,根据所述音频信息,在数据库中确定匹配的文本,具体包括:
[0014]根据所述音频信息,通过声学模型、语言模型中至少一种算法模型,从数据库中确定匹配的文本。
[0015]进一步的,所述匹配的文本包括文字、数字、字母、符号中至少一种字符。
[0016]进一步的,所述待编辑文本域包括Range域、Cells域、光标索引域中至少一种待编辑文本域。
[0017]一种文本编辑器语音识别装置,包括:
[0018]获取模块,用于获取音频信息;
[0019]匹配模块,用于根据所述音频信息,在数据库中确定匹配的文本;
[0020]输入模块,用于输入所述匹配的文本到对应的待编辑文本域;
[0021]其中,所述待编辑文本域用于提供文本输入。
[0022]进一步的,所述文本编辑器提供的接口为Linux系统下WPS Office提供的接口。
[0023]进一步的,所述匹配模块用于根据所述音频信息,在数据库中确定匹配的文本,具体用于:
[0024]通过声学模型、语言模型中至少一种算法模型,从数据库中确定匹配的文本。
[0025]进一步的,所述匹配的文本包括文字、数字、字母、符号中至少一种字符。
[0026]进一步的,所述待编辑文本域包括Range域、Cells域、光标索引域中至少一种待编辑文本域。
[0027]本申请提供的实施例至少具有以下有益效果:
[0028]操作者在使用Linux系统下的WPS Office软件时,无需手动切换语音识别的输入法便可直接完成文本输入。文字输入连续,工作效率高。
附图说明
[0029]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0030]图1为本申请实施例提供的实现文本编辑器语音识别方法的流程框图。
[0031]图2为本申请实施例提供的实现文本编辑器语音识别装置的结构示意框图。
[0032]附图标记:
[0033]100
ꢀꢀ
文本编辑器语音识别装置
[0034]110
ꢀꢀ
获取模块
[0035]120
ꢀꢀ
匹配模块
[0036]130
ꢀꢀ
输入模块
具体实施方式
[0037]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0038]请参照图1,本申请提供了一种文本编辑器语音识别方法,包括以下步骤:
[0039]S110:调用文本编辑器提供的接口,获取音频信息。
[0040]需要指出的是,所述文本编辑器可以是Linux系统、Windows系统等中至少一种操作系统下的文本编辑器。
[0041]所述文本编辑器可以是Microsoft Office、WPS Office等中至少一种文本编辑软件。
[0042]当所述文本编辑器为Microsoft Office文本编辑软件时,所述文本编辑器提供的接口为VBA接口。
[0043]当所述文本编辑器为WPS Office文本编辑软件时,所述文本编辑器提供的接口为文档操作接口。
[0044]具体的,在本申请提供的一种具体实施例中,所述文本编辑器为Linux系统下WPS Office文本编辑软件,所述接口为Linux系统下WPS Office软件提供的文档操作接口。
[0045]需要特别指出的是,所述文本编辑器提供的接口用于构建语音识别装置。
[0046]所述语音识别装置嵌入在文本编辑器中。
[0047]具体的,在本申请提供的一种具体实施例中,调用Linux系统下WPS Office软件提
供的文档操作接口,在功能面板放入一个语音识别按钮。当语音识别按钮启动后,获取音频信息。
[0048]可以理解的是,本申请所述文本编辑器均用于编辑文本。因此,只要用于编辑文本的装置均可以认为是本申请所述文本编辑器。相应的,本申请所述文本编辑器提供的接口均用于扩展所述文本编辑器的应用程序功能。因此,只要用于扩展文本编辑器应用程序功能的编程语言均可以认为是本申请所述文本编辑器提供的接口。所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0049]需要指出的是,所述音频信息可以是实时输入的语音流数据,或音频文件中的文件流数据。
[0050]其中,所述语音流数据获取通常可通过麦克风、声卡等具有实时输入功能的硬件,将语音进行实时输入生成。
[0051]所述文件流数据的获取通常可通过读取存放已完成录制的音频数据的音频文件。
[0052]S120:根据所述音频信息,在数据库中确定匹配的文本。
[0053]需要指出的是,根据所述音频信息,在数据库中确定匹配的文本,具体包括:
[0054]根据所述音频信息,通过声学模型、语言模型中至少一种算法模型,从数据库中确定匹配的文本。
[0055]其中,文本编辑器语音识别系统可以通过声学模型建立音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本编辑器语音识别方法,其特征在于,包括以下步骤:调用文本编辑器提供的接口,获取音频信息;根据所述音频信息,在数据库中确定匹配的文本;输入所述匹配的文本到对应的待编辑文本域;其中,所述待编辑文本域用于提供文本输入。2.如权利要求1所述的文本编辑器语音识别方法,其特征在于,所述文本编辑器提供的接口为Linux系统下WPS Office提供的接口。3.如权利要求1所述的文本编辑器语音识别方法,其特征在于,根据所述音频信息,在数据库中确定匹配的文本,具体包括:根据所述音频信息,通过声学模型、语言模型中至少一种算法模型,从数据库中确定匹配的文本。4.如权利要求1所述的文本编辑器语音识别方法,其特征在于,所述匹配的文本包括文字、数字、字母、符号中至少一种字符。5.如权利要求1所述的文本编辑器语音识别方法,其特征在于,所述待编辑文本域包括Range域、Cells域、光标索引域中至少一种待编辑文本域。6.一种文本编辑器语...

【专利技术属性】
技术研发人员:刘文昌王建超孙明东朱相宇王映新
申请(专利权)人:北京华宇信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1