一种用于从语音内容生成文本内容提要的系统和方法技术方案

技术编号:7243784 阅读:300 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及语音通讯过程中记录语音内容的技术。公开了一种用于从语音内容生成文本内容提要的系统和方法,该系统包含:语音接收装置,用于接收语音内容;用户指示接收装置,响应于接收到用户发出的增加关注信号,将所述增加关注信号与一个时间窗口相关联,其中,所述时间窗口与所述语音内容的一部分相关联;重要文本确定装置,用于根据与所述时间窗口相关联的增加关注信号的次数,确定是否将与所述时间窗口相关联的所述语音内容的一部分用于生成文本内容提要。运用本发明专利技术,用户能表达语音内容不同部分的相对重要性,这有利于按照用户的意图对用于生成文本内容提要的语音内容部分进行取舍,以生成个性化的文本内容提要。

【技术实现步骤摘要】

本专利技术涉及语音通讯过程中记录语音内容的技术,尤其涉及从语音内容生成文本内容提要的系统和方法。
技术介绍
在实时语音通讯过程中,例如在电话通讯(例如电话会议)过程中,常常需要记录语音通讯的内容。除了录音,用户还要求能将语音内容转换成可供阅读的文本信息,例如用作备忘录。为此,已经有技术不仅能将语音内容转换成文本信息,还能按照用户的要求,定制实时语音内容的内容提要。一种现有技术的内容提要生成系统,可以根据用户发出的表示对语音内容关注的指示,从语音内容生成文本内容提要。具体来说,用户在收听语音内容的时候,每当对当前播放的语音内容部分感兴趣时,就在语音内容播放设备(例如电话机)上,按下一个预定的指示按钮。系统将播放时间与用户按下指示按钮的时点相近的一段语音内容,用于生成文本内容提要。用户在收听语音内容过程中,可能在不同的时点多次按下指示按钮。相应地,有多段语音内容被系统用于生成文本内容提要。实际上,虽然上述多段语音内容都是根据按下指示按钮而确定的,但是,它们对于用户的重要性可能并不相同。用户并不能仅仅通过按下指示按钮就能表达上述多段语音内容互相之间的相对重要性,系统在选择语音内容以进行生成内容提要的处理时,只能按相同的重要性来对待上述多段语音内容,而不能按照用户的真正意图进行取舍。这样生成的文本内容提要,未必能使用户满意。
技术实现思路
本专利技术的目的是提供一种改进的用于从语音内容生成文本内容提要的系统和方法。一方面,本专利技术的实施例提供一种用于从语音内容生成文本内容提要的系统,包含语音接收装置,用于接收语音内容;用户指示接收装置,响应于接收到用户发出的增加关注信号,将所述增加关注信号与一个时间窗口相关联,其中,所述时间窗口与所述语音内容的一部分相关联;重要文本确定装置,用于根据与所述时间窗口相关联的增加关注信号的次数,确定是否将与所述时间窗口相关联的所述语音内容的一部分用于生成文本内容提要。另一方面,本专利技术的实施例提供一种用于从语音内容生成文本内容提要的方法, 包含接收语音内容;响应于接收到用户发出的增加关注信号,将所述增加关注信号与一个时间窗口相关联,其中,所述时间窗口与所述语音内容的一部分相关联;根据与所述时间窗口相关联的增加关注信号的次数,确定是否将与所述时间窗口相关联的所述语音内容的一部分用于生成文本内容提要。 附图说明所附权利要求中阐述了被认为是本专利技术的特点的创造性特征。但是,通过参照附图阅读下面对示例性实施例的详细说明可更好地理解专利技术本身以及其使用模式、另外的目标、特征以及优点,在附图中图1表示现有技术的一种内容提要生成系统的框图;图2表示按照本专利技术的一种内容提要生成系统的实施例的框图;图3示意性地表示两个电话用户的部分通话内容和用户的操作;图4表示表示按照本专利技术的一个实施例的方法流程图。具体实施例方式下面参照附图来说明本专利技术的实施例。在下面的说明中,阐述了许多具体细节以便更全面地了解本专利技术。但是,对于本
内的技术人员很明显,本专利技术的实现可不具有这些具体细节。此外,应当理解的是,本专利技术并不限于所介绍的特定实施例。相反,可以考虑用下面的特征和元素的任意组合来实施和实践本专利技术。而无论它们是否涉及不同的实施例。因此,下面的方面、特征、实施例和优点仅作说明之用而不应被看作是所附权利要求的要素或限定,除非权利要求中明确提出。图1示意性地表示现有技术的一种内容提要生成系统。如图1所示,一种现有技术的内容提要生成系统100包含语音输入装置101,语音识别装置102,语音输出装置103, 指示按钮104,同步装置105,重要分段评估装置106,文本内容提要生成装置107。该内容提要生成系统100的工作方式如下。语音输入装置101输入声波形式的语音内容。一方面,语音输入装置101将语音内容发送到语音识别装置102,语音识别装置 102识别语音内容,将声波形式的语音内容转换成文本形式。另一方面,语音输入装置101将语音内容发送到语音输出装置103,语音输出装置 103例如通过扬声器播放语音内容。例如在进行电话通话的用户,可以在听到语音内容的任何时候,按下指示按钮 104,表示对所听到或将要听到的语音内容的关注。同步装置105发现用户按下按钮104后,首先找到与按下按钮104的时刻对应的语音内容。此外,同步装置105还从语音识别装置102获得与按下指示按钮104的时刻对应的语音内容对应的文本。重要分段评估装置106,为与按下按钮104时刻的对应的语音内容对应的文本设置一个初始重要分段。例如,将包括上述文本的一个连续的语音段设置为初始重要分段。上述语音段可以是一个词,短语,句子。重要分段评估装置106按照一定准则处理初始重要分段(例如对初始重要分段进行压缩或扩展),产生适合的重要分段,将其发送到文本内容提要生成装置107。文本内容提要生成装置107根据来自重要分段评估装置106的适合的重要分段和来自语音识别装置102的作为语音识别结果的文本,生成内容提要。利用系统100,用户可在语音输入装置101输入语音内容的过程中发出表示关注或内容重要的指示信号,位于指示信号的时间点以及之前和之后的语音内容,都有可能体现在文本内容提要生成装置107生成的内容提要中。文本内容提要生成装置107生成的内容提要往往有长度限制,在有很多指示信号的时间点时,应当将用户认为更重要的内容优先体现在内容提要中。然而,在各个指示信号的时间点表示的关注或内容重要性没有差异的情况下,系统100根据用户通过指示按钮发出的指示信号,难以对用于生成内容提要的语音内容作出适合用户愿望的取舍。现在参看图2。图2表示按照本专利技术的实施例的用于从语音内容生成文本内容提要的系统200,系统200包含语音输入装置201,语音识别装置202,语音输出装置203,用户指示接收装置204,同步装置205,重要文本确定装置206,文本内容提要生成装置207。系统200的工作方式如下。语音输入装置201输入声波形式的语音内容,语音识别装置202识别语音内容,将声波形式的语音内容转换成文本形式,语音输出装置203例如通过扬声器播放语音内容。语音输入装置201输入的语音内容可以直接发送到同步装置205,或者通过输出装置203发送到同步装置205。例如在进行电话通话的用户,可以在听到语音内容的任何时候,按下表示增加关注的按钮(例如图2所示的“ + ”键),并且可以连续“ + ”键,表示增加对相应语音内容部分的关注度。用户指示接收装置204响应于接收到用户发出的增加关注信号,将所述增加关注信号与一个时间窗口相关联,其中,所述时间窗口与所述语音内容的一部分相关联。同步装置205除了具有图1所示的同步装置105的功能外,还可根据用户指示接收装置204接收的增加关注信号,生成对应的时间窗口并将所生成的时间窗口与语音内容的一部分相关联。重要文本确定装置206的功能是,根据与所述时间窗口相关联的增加关注信号的次数,确定是否将与所述时间窗口相关联的所述语音内容的一部分用于生成文本内容提要。文本内容提要生成装置207根据重要文本确定装置206的确定结果和来自语音识别装置202的作为语音识别结果的文本,生成内容提要。如上所述,系统200包含的上述各装置中,语音输入装置201、语音识别装置202、本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:操保华周欣金涬何乐王庆波
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术