用于校正文本的方法和系统技术方案

技术编号:9901552 阅读:238 留言:0更新日期:2014-04-10 12:57
本发明专利技术涉及语音处理,提供了一种用于校正文本的方法和系统。该方法包括:确定一个文本中要校正的目标文本单元;接收用户针对所述目标文本单元输入的参考语音片段;根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元;用所述参考文本单元校正所述文本中的所述目标文本单元中的字。通过本发明专利技术,可以使得用户能够容易地通过语音方式校正文本中的错误。

【技术实现步骤摘要】
用于校正文本的方法和系统
本专利技术涉及语音处理,更具体地,涉及一种用于利用语音处理来校正文本的方法和系统。
技术介绍
目前,随着信息技术的快速发展,语音应用正越来越受到工业以及学术界的关注。语音应用使得用户能够采用语音搜索因特网,或在便携式设备上用语音进行记录。虽然目前的语音识别技术的准确率已经大大提高,但受各种因素的影响,所返回结果的准确性仍然远远不够。用户不得不手动地修改识别结果,例如,如果需要改正一个字,用户必须双击这个字,采用文本输入法输入正确的字,这个繁复的过程会降低用户对于使用语音软件的兴趣。一般来说,错误往往发生在词汇表之外的字上或者一些专用字词上。因此,希望提供一种方便用户校正语音识别文本错误的方案。
技术实现思路
考虑到语音识别过程中,出现的大量错误是同音异义字,或者发音相近的字,本专利技术提出了一种基于语音处理的校正文本的方法和系统。根据本专利技术的一个方面,提供了一种用于校正文本的方法,包括,确定一个文本中要校正的目标文本单元;接收用户针对所述目标文本单元输入的参考语音片段;根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元;用所述参考文本单元校正所述文本中的所述目标文本单元中的字。根据本专利技术的另一个方面,还提供了一种用于校正文本的系统,包括:被配置为确定一个文本中要校正的目标文本单元的装置;被配置为接收用户针对所述目标文本单元输入的参考语音片段的装置;被配置为根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元的装置;被配置为用所述参考文本单元校正所述文本中的所述目标文本单元中的字的装置。通过本专利技术,可以使得用户能够容易地校正文本中的错误。附图说明通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。图2显示了根据本专利技术的一个实施例的用于校正文本的方法的流程图。图3显示了根据本专利技术的另一个实施例的用于校正文本的方法的流程图。图4显示了根据本专利技术的另一个实施例的用于校正文本的方法的流程图。图5显示了根据本专利技术的一个实施例的用于校正文本的系统的方框图。具体实施方式下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。所属
的技术人员知道,本专利技术可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本专利技术操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。下面将参照本专利技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本专利技术。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instructionmeans)的制造品(manufacture)。也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本专利技术实施例的功能和使用范围带来任何限制。如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总本文档来自技高网
...
用于校正文本的方法和系统

【技术保护点】
一种用于校正文本的方法,包括:确定一个文本中要校正的目标文本单元;接收用户针对所述目标文本单元输入的参考语音片段;根据所述参考语音识别片段,确定与所述目标文本单元中的字发音相似的参考文本单元;用所述参考文本单元校正所述文本中的所述目标文本单元中的字。

【技术特征摘要】
1.一种用于校正文本的方法,包括:确定一个文本中要校正的目标文本单元;接收用户针对所述目标文本单元输入的参考语音片段,其中所述参考语音片段包括句子或者短语;对所述参考语音片段进行语音识别,以获得参考文本片段;基于音素相似度,确定所述参考文本片段中与所述目标文本单元中的字发音相似的参考文本单元,其中,通过计算参考文本片段中的字的第一音素与目标文本单元中的字的第一音素的相似度与参考文本片段中的字的第二音素与目标文本单元中的字的第二音素的相似度之和,来计算音素相似度;用所述参考文本单元校正所述文本中的所述目标文本单元中的字。2.如权利要求1所述的方法,其中,所述文本是语音数据的识别文本。3.如权利要求1或2所述的方法,其中,所确定的参考文本单元为多个参考文本单元,其中,用所述参考文本单元校正所述文本中的所述目标文本单元中的字进一步包括:接收用户对于所述多个参考文本单元中的一个的选择,用于校正所述目标文本单元中的至少一个字。4.如权利要求1或2所述的方法,其中,所确定的参考文本单元为多个参考文本单元,其中,用所述参考文本单元校正所述文本中的所述目标文本单元中的字进一步包括:根据所述多个参考文本单元的置信度,选择用于校正所述目标文本单元中的字的参考文本单元。5.如权利要求1所述的方法,进一步包括:识别所述文本的文本单元的单元边界。6.如权利要求1所述的方法,其中,确定所述文本中要校正的目标文本单元包括:接收用户对于所述文本中的文本单元的选择,以确定要校正的目标文本单元。7.如权利要求2所述的方法,其中,确定所述文本中要校正的目标文本单元包括:获得所述语音数据的识别文本中的文本单元的置信度;以及根据所述置信度确定要校正的目标文本单元。8.一种用于校正文本的系统,包括:目标...

【专利技术属性】
技术研发人员:张世磊刘文包胜华陈健施琴苏中秦勇
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1