金额数据纠正方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:38017856 阅读:11 留言:0更新日期:2023-06-30 10:44
本发明专利技术公开了一种金额数据纠正方法、装置、设备、存储介质及产品。该金额数据纠正方法包括:获取语音识别文本;从所述语音识别文本中提取得到金额数据文本;对所述金额数据文本中的数字字符和单位字符进行转换,得到纠正后的金额数据。本发明专利技术能够实现金额数据的转换,得到纠正后的金额数据,以便于后续直接应用。以便于后续直接应用。以便于后续直接应用。

【技术实现步骤摘要】
金额数据纠正方法、装置、设备、存储介质及产品


[0001]本专利技术涉及数据处理领域,尤其涉及一种金额数据纠正方法、装置、设备、存储介质及产品。

技术介绍

[0002]近些年来,随着自动语音识别(AutomaticSpeechRecognition,ASR)技术的发展,识别准确率有了很大的提升。但是,在ASR识别结果中,仍然存在一些明显不符合人们使用习惯的情况。例如,在涉及银行等业务的时候,在语音识别中涉及金额数据的识别包括



























等,像这些金额类的词汇,组合起来后往往不会直接识别得到准确的阿拉伯数字,而是既有数字又有汉字,因而无法直接用于后续的工作。
[0003]例如,对于1元5角6分,现有的ASR算法会识别得到1.56元,或仍识别得到1元5角6分;再例如,五百元,会识别得到500元,存在未彻底转化的情况。

技术实现思路

[0004]基于此,本专利技术的主要目的在于提供一种金额数据纠正方法、装置、设备、存储介质及产品,旨在实现金额数据的转换,得到纠正后的金额数据,以便于后续直接应用。
[0005]为实现上述目的,本专利技术提供一种金额数据纠正方法,所述金额数据纠正方法包括以下步骤:
[0006]获取语音识别文本;
[0007]从所述语音识别文本中提取得到金额数据文本;
[0008]对所述金额数据文本中的数字字符和单位字符进行转换,得到纠正后的金额数据。
[0009]优选地,所述对所述金额数据文本中的数字字符和单位字符进行转换,得到纠正后的金额数据的步骤包括:
[0010]从所述金额数据文本中提取数字字符和单位字符;
[0011]对所述数字字符进行形式转换,得到标准数字;
[0012]对所述单位字段进行量级转换,得到标准倍数;
[0013]对所述标准数字和所述标准倍数进行运算,得到纠正后的金额数据。
[0014]优选地,所述对所述单位字段进行量级转换,得到标准倍数的步骤包括:
[0015]检测所述单位字段中是否存在非标准单位;
[0016]若存在,则将检测到的非标准单位替换为标准单位,得到标准单位字段;
[0017]对所述标准单位字段进行量级换算,得到标准倍数。
[0018]优选地,所述对所述标准数字和所述标准倍数进行运算,得到纠正后的金额数据的步骤包括:
[0019]根据所述标准数字和所述标准倍数的顺序,分别将各标准数字与排在其后的标准倍数进行乘法运算,得到乘积值;
[0020]对各乘积值进行加和运算,得到纠正后的金额数据。
[0021]优选地,所述从所述语音识别文本中提取得到金额数据文本的步骤包括:
[0022]基于预设关键词,遍历所述语音识别文本,以确定所述语音识别文本中包括的与所述预设关键词匹配的金额数据文本;或,
[0023]基于预设模版,遍历所述语音识别文本,以确定所述语音识别文本中包括的与所述预设模板匹配的金额数据文本。
[0024]优选地,所述获取语音识别文本的步骤包括:
[0025]获取待识别语音;
[0026]调用预设语音识别算法对所述待识别语音进行识别,得到语音识别文本。
[0027]此外,为实现上述目的,本专利技术还提供一种金额数据纠正装置,所述金额数据纠正装置包括:
[0028]获取模块,用于获取语音识别文本;
[0029]提取模块,用于从所述语音识别文本中提取得到金额数据文本;
[0030]转换模块,用于对所述金额数据文本中的数字字符和单位字符进行转换,得到纠正后的金额数据。
[0031]此外,为实现上述目的,本专利技术还提供一种金额数据纠正设备,所述金额数据纠正设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的金额数据纠正方法的步骤。
[0032]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的金额数据纠正方法的步骤。
[0033]此外,为实现上述目的,本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的金额数据纠正方法的步骤。
[0034]本专利技术提供一种金额数据纠正方法、装置、设备、存储介质及产品,先获取语音识别文本;然后,从语音识别文本中提取得到金额数据文本;进而对金额数据文本中的数字字符和单位字符进行转换,得到纠正后的金额数据。本专利技术通过先定位语音识别文本中的金额部分,得到金额数据文本,进而通过对数字字符和单位字符进行转换,可实现金额数据的转换,得到纠正后的金额数据,以便于后续直接应用。此外,本专利技术无需修改现有的ASR算法,仅需通过本技术方案即可实现对ASR识别得到的语音识别文本中金额数据的转换,可以保持多平台的一致性。
附图说明
[0035]图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;
[0036]图2为本专利技术金额数据纠正方法第一实施例的流程示意图;
[0037]图3为本专利技术金额数据纠正装置第一实施例的功能模块示意图。
[0038]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0039]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0040]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图。
[0041]本专利技术实施例金额数据纠正设备可以是智能手机,也可以是PC(Personal Computer,个人计算机)、平板电脑、便携计算机、服务器等终端设备。
[0042]如图1所示,该金额数据纠正设备可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi

Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non

volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[0043]本领域技术人员可以理解,图1中示出的金额数据纠正设备结构并不构成对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种金额数据纠正方法,其特征在于,所述金额数据纠正方法包括以下步骤:获取语音识别文本;从所述语音识别文本中提取得到金额数据文本;对所述金额数据文本中的数字字符和单位字符进行转换,得到纠正后的金额数据。2.如权利要求1所述的金额数据纠正方法,其特征在于,所述对所述金额数据文本中的数字字符和单位字符进行转换,得到纠正后的金额数据的步骤包括:从所述金额数据文本中提取数字字符和单位字符;对所述数字字符进行形式转换,得到标准数字;对所述单位字段进行量级转换,得到标准倍数;对所述标准数字和所述标准倍数进行运算,得到纠正后的金额数据。3.如权利要求2所述的金额数据纠正方法,其特征在于,所述对所述单位字段进行量级转换,得到标准倍数的步骤包括:检测所述单位字段中是否存在非标准单位;若存在,则将检测到的非标准单位替换为标准单位,得到标准单位字段;对所述标准单位字段进行量级换算,得到标准倍数。4.如权利要求2所述的金额数据纠正方法,其特征在于,所述对所述标准数字和所述标准倍数进行运算,得到纠正后的金额数据的步骤包括:根据所述标准数字和所述标准倍数的顺序,分别将各标准数字与排在其后的标准倍数进行乘法运算,得到乘积值;对各乘积值进行加和运算,得到纠正后的金额数据。5.如权利要求1至4中任一项所述的金额数据纠正方法,其特征在于,所述从所述语音识别文本中提取得到金额数据文本的步骤包括:基...

【专利技术属性】
技术研发人员:张利科周长安夏溧
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1