文本纠错的方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:30188090 阅读:26 留言:0更新日期:2021-09-29 08:25
本发明专利技术实施例提供一种文本纠错的方法、装置、设备和计算机可读存储介质。该文本纠错方法包括:显示语音识别文本;接收用户眼睛在语音识别文本的聚焦点,确定聚焦点的驻留信息,驻留信息包括驻留时长;当驻留时长满足预设条件时,确定聚焦点对应的待修改文本,并显示待修改文本的候选文本;当聚焦点移动时,确定对应聚焦点移动时刻的候选文本;将待修改文本修改为对应聚焦点移动时刻的候选文本。本发明专利技术实施例能够在无需用户输入的情况下,方便、快捷的纠正文本出现的错误识别,并且能够实现快速、准确的纠正文本错误。准确的纠正文本错误。准确的纠正文本错误。

【技术实现步骤摘要】
文本纠错的方法、装置、设备和计算机可读存储介质


[0001]本专利技术涉及语音识别领域,尤其涉及一种文本纠错的方法、装置、设备和计算机可读存储介质。

技术介绍

[0002]随着社会的不断发展和进步,在很多领域和场景下都会用到语音识别。例如:工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
[0003]由于每个人语速、语调和发音都不一样,在语音识别出现错误的情况下,一种是传统的纠错方式,人工手动输入来纠正,通过手动输入纠正错误文本,尤其是对于长段文本的情况操作太繁琐,不方便用户的使用;另一种是需要模型训练,需要根据历史输入或者历史数据来提高语音识别率或纠错率,但是,在识别结果之前进行处理,还是存在较高的语音识别错误率。因此,无论是传统的纠错方式还是智能的纠错方式,都会出现无法纠错或者纠错不理想的问题,为用户的使用带来不便。

技术实现思路

[0004]本专利技术实施例提供了一种文本纠错的方法、装置、设备和计算机可读存储介质,无需用户输入,能够方便、快捷的纠正文本出现的错误识别,并且能够实现快速、准确的纠正。
[0005]第一方面,本专利技术提供一种文本纠错的方法,方法包括:
[0006]显示语音识别文本;
[0007]接收用户眼睛在语音识别文本的聚焦点,确定聚焦点的驻留信息,所述驻留信息包括驻留时长;
[0008]当驻留时长满足预设条件时,确定聚焦点对应的待修改文本,并显示待修改文本的候选文本;
[0009]当聚焦点移动时,确定对应聚焦点移动时刻的候选文本;
[0010]将待修改文本修改为对应聚焦点移动时刻的候选文本。
[0011]在第一方面的一些可实现方式中,在显示待修改文本的候选文本之后,方法还包括:若聚焦点不移动,则继续显示待修改文本的候选文本。
[0012]在第一方面的一些可实现方式中,显示待修改文本的候选文本,包括:根据预先设置显示方式,循环显示待修改文本的候选文本。
[0013]在第一方面的一些可实现方式中,在显示待修改文本的候选文本之前,方法还包括:设置候选文本的显示优先级,以用于根据显示优先级显示候选文本。
[0014]在第一方面的一些可实现方式中,在显示语音识别文本之前,方法还包括:接收语音信息;
[0015]将语音信息识别为语音识别文本。
[0016]第二方面,本专利技术提供一种文本纠错的装置,该装置包括:显示模块,用于显示语音识别文本;
[0017]接收模块,用于接收用户眼睛在语音识别文本的聚焦点,确定聚焦点的驻留信息,驻留信息包括待修改文本和驻留时长;
[0018]当驻留时长满足预设条件时,显示模块,还用于显示待修改文本的候选文本;
[0019]确定模块,用于当聚焦点移动时,确定对应聚焦点移动时刻的候选文本;
[0020]纠错模块,将待修改文本修改为对应聚焦点移动时刻的候选文本。
[0021]在第二方面的一些可实现方式中,若聚焦点不移动,显示模块,还用于继续显示待修改文本的候选文本。
[0022]在第二方面的一些可实现方式中,显示模块,还用于根据预先设置显示方式,循环显示待修改文本的候选文本。
[0023]第三方面,本专利技术提供一种文本纠错的设备,该设备包括:处理器以及存储有计算机程序指令的存储器;
[0024]处理器执行计算机程序指令时实现第一方面或者第一方面任一可实现方式中所述的文本纠错方法。
[0025]第四方面,本专利技术提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面或者第一方面任一可实现方式中的文本纠错方法。
[0026]本专利技术实施例提供了一种文本纠错方法,显示语音识别文本后,通过接收用户眼睛在语音识别文本的聚焦点,并确定聚焦点的驻留信息,无需用户动手确定需纠错的文本位置,能够减少用户手动操作,然后根据驻留信息中的待修改文本和驻留时长,若判断聚焦点的文本需要修改,则通过显示待修改文本的候选文本,然后根据聚焦点的移动情况确定待修改文本的候选文本,通过本专利技术实施例提供的文本纠错方法,有效解决了文本较多且有纠错需求,需要手动输入的痛点,实现快速、准确的纠正文本错误。
附图说明
[0027]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0028]图1是本专利技术实施例提供的一种文本纠错方法的流程示意图;
[0029]图2是本专利技术实施例提供的另一种文本纠错方法的流程示意图;
[0030]图3是本专利技术实施例提供的一种文本纠错装置的结构示意图;
[0031]图4是本专利技术实施例提供的一种文本纠错设备的结构示意图。
具体实施方式
[0032]下面将详细描述本专利技术的各个方面的特征和示例性实施例,为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本专利技术,并不被配置为限定本专利技术。对于本领域技术人员来说,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更好的理解。
[0033]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实
体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0034]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和 B,单独存在B这三种情况。
[0035]随着社会的不断发展和进步,在很多领域和场景下都会用到语音识别。例如:工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
[0036]由于每个人语速、语调和发音都不一样,在语音识别出现错误的情况下,一种是传统的纠错方式,人工手动输入来纠正,通过手动输入纠正错误文本,尤其是对于长段文本的情况操作太繁琐,不方便用户的使用。
[0037]另一种是需要模型训练,需要根据历史输入或者历史数据来提高语音识别率或纠错率,但是,在识别结果之前进行处理,还是存在较高的语音识别错误率。
[0038]此外,还有对语音识别后的文本进行识错分析,通过确定文本语句所属领域,然后根据预定义的语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本纠错的方法,其特征在于,所述方法包括:显示语音识别文本;接收用户眼睛在所述语音识别文本的聚焦点,确定所述聚焦点的驻留信息,所述驻留信息包括驻留时长;当所述驻留时长满足预设条件时,确定所述聚焦点对应的待修改文本,并显示所述待修改文本的候选文本;当所述聚焦点移动时,确定对应所述聚焦点移动时刻的候选文本;将所述待修改文本修改为对应所述聚焦点移动时刻的候选文本。2.根据权利要求1所述的方法,其特征在于,在所述显示所述待修改文本的候选文本之后,所述方法还包括:若所述聚焦点不移动,则继续显示所述待修改文本的候选文本。3.根据权利要求2所述的方法,其特征在于,所述显示所述待修改文本的候选文本,包括:根据预先设置显示方式,循环显示所述待修改文本的候选文本。4.根据权利要求1所述的方法,其特征在于,在所述显示所述待修改文本的候选文本之前,所述方法还包括:设置所述候选文本的显示优先级,以用于根据所述显示优先级显示所述候选文本。5.根据权利要求1所述的方法,其特征在于,在所述显示语音识别文本之前,所述方法还包括:接收语音信息;将所述语音信息识别为所述语音识别文本。6.一种文本纠错的装置,其特征在于,...

【专利技术属性】
技术研发人员:谭敏
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1