本发明专利技术公开了一种基于语音识别的阅读辅助系统,包含终端语音采集模块,语音识别模块,搜索及内容处理模块等。本发明专利技术通过终端获取用户阅读的内容的语音,在终端或系统进行内容的识别后进行内容的搜索和处理,按照内容相关性进行排序,并将搜索和处理的结果返回给终端,终端对系统传递的数据进行解析和处理并叠加显示在用户的终端显示界面。通过终端识别用户阅读语音的内容并基于用户语音内容包含的进行搜索和处理获取用户需要的内容辅助信息,提供了基于一种基于语音识别的阅读辅助的业务体验。
【技术实现步骤摘要】
本专利技术涉及移动终端,语音识别等
,特别是指一种基于语音识别的阅读辅助系统。
技术介绍
随着终端技术、软件技术的发展,特别是智能终端、语音识别技术和云计算技术的发展,为一种基于语音识别的阅读辅助系统提供了可行性。用户在各种环境下阅读时,可能对阅读过程中的内容需要进一步的了解,传统方式是在电脑上手工输入对应的文字获取搜索结果,对阅读流程产生了干扰,用户需离开当前的阅读过程进行搜索等操作,而通过终端识别用户朗读的语音并识别用户阅读对象上的内容,并进行内容的识别后以识别结果发起搜索,搜索系统内的定制内容和互联网上的各种内容,并以搜索结果相关性进行处理和排序,并将获取的结果叠加在用户终端界面上显示或播放,用户随即可以查看或听到用户关心的内容的各种有关信息,达到了辅助用户进行阅读的作用。有鉴于此,本专利技术的目的在于提出一种简单易行,通过终端扫描和识别的一种基于语音识别的阅读辅助系统。
技术实现思路
从上面所述可以看出,本专利技术提供的一种基于语音识别的阅读辅助系统,通过用户朗读感兴趣的内容部分并获取用户语音后识别其包含的文字内容,基于这些内容进行相关性搜索并在终端界面上提供搜索结果,实现了一种使用简单的基于终端阅读辅助系统。进一步的,通过所提供的一种基于语音识别的阅读辅助系统为一种用户阅读辅助业务的发展提供有力保障,满足用户各方要求,提升用户友好体验。为实现上述目的,本专利技术的一个方面提供了一种基于语音识别的阅读辅助系统,该方法包括: 用户朗读感兴趣的内容部分,终端获取用户的语音并将语音记录转换为压缩的音频数据文件作为识别数据源,进行语音内的文字识别,获取其包含的文本。终端获取用户阅读的内容的语音,在终端或系统进行内容的识别后进行内容的搜索和处理,按照内容相关性进行排序,并将搜索和处理的结果返回给终端,终端对系统传递的数据进行解析和处理并叠加显示在用户的终端显示界面。本专利技术提供的一种基于语音识别的阅读辅助系统的一个实施例中,该方法还包括: 终端获取用户感兴趣并朗读的内容部分的语音后,通过终端本地语音识别方式或基于系统开放的语音识别服务方式识别获取语音对应的文本内容,并获得返回的识别结果。系统通过服务方式开发语音识别服务接口,终端侧通过系统端提供的语音识别服务访问接口发起语音识别服务的请求,系统端获取对应的识别请求以及原始语音数据后即可执行对应的识别服务。本专利技术提供的一种基于语音识别的阅读辅助系统的一个实施例中,该方法还包括: 终端获取识别语音包含的文本,并以此文本作为关键词发起对搜索引擎的搜索,获取搜索引擎的搜索结果并进一步获取其包含的内容,在终端应用界面上进行显示或播放对应的内容。本专利技术提供的一种基于语音识别的阅读辅助系统的一个实施例中,该方法还包括: 终端获取到搜索引擎返回的搜索结果,以窗口叠加方式显示在用户的阅读界面上,用户随即可以查阅或点击播放到对应内容的各种有关信息。搜索引擎包含了系统内外部的搜索引擎,系统内部的搜索引擎搜索系统内的各种数据,包含文件,数据库,系统外部的搜索引擎为开放在互联网上的各种搜索引擎,终端按照对应引擎的语法发起关键词的搜索获取对应的内容,并按照匹配度进行排序处理,获取最大精确匹配的各种搜索结果。 具体来说具有以下优点: 使用方便: 用户通过朗读报纸等包含网址信息的对象,即可完成对应语音内容的识别并基于这些内容的相关信息,使用简单快捷。实时阅读辅助信息: 用户朗读感兴趣的内容部分,对应内容部分的相关内容即可即时叠加在用户终端界面上显示或播放,实现实时的阅读辅助的显示效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中: 图1为本专利技术系统模块结构的示意图。图2为本专利技术语音识别流程示意图。图3为本专利技术业务流程示意图。具体实施例方式下面参照附图对本专利技术进行更全面的描述,其中说明本专利技术的示例性实施例。为实现上述目的,提出了一种基于语音识别的阅读辅助系统。以下通过结合附图,对本专利技术的实施方式进行描述。实现一种基于语音识别的阅读辅助系统的关键点如下: 语音识别: 终端获取用户朗读的语音后,通过终端自身的语音识别能力模块或系统以服务形式开放的语音识别服务进行识别,获取语音中包含的文字内容。内容搜索: 在获取用户语音包含的内容的文本后,终端发起对各个搜索引擎的搜索,包含系统内容数据库以及各个互联网开放搜索引擎的搜索,获取各个搜索引擎的搜索结果,并按照相关性进行结果的处理,获取相关性最高的搜索结果集合。叠加更新: 终端获取搜索结果后,将搜索结果以层叠方式在用户的应用界面显示或播放,用户随即可以查看或听到结果信息,实现即读即得的业务效果。主要功能模块 如图1所示,一种基于语音识别的阅读辅助系统的结构主要包括: 终端侧和系统侧:终端侧可独立完成全部的功能,根据终端的能力,可选后台系统提供服务,为不具备语音识别能力的终端进行服务,包含语音识别服务以及内容处理等功能。模块组成: 终端硬件100: 终端侧语音硬件部分,承载各种语音功能,包含语音的播放,语音的获取等功能。日志模块101: 记录用户在终端侧的业务操作等活动数据并以日志方式保存在终端。逻辑模块102: 终端侧的业务逻辑流程的控制和执行,调用其他逻辑功能模块并与其进行交互完成各种业务逻辑功能。语音获取模块103: 负责调用终端硬件如麦克风获取用户语音数据流,获取原始的用户语音数据并压缩成系统的语音格式提供给其他功能逻辑模块,如识别模块。识别模块104: 终端侧的语音识别模块,根据终端软件和硬件能力在终端可选安装的识别功能模块,负责识别语音数据的内容并提供识别结果到其他功能模块。服务请求模块105: 终端侧在需要系统功能支持的情况下,如本地不支持语音识别,通过系统开放的服务,服务请求模块发起对系统服务的请求,完成各种功能。内容处理及显示模块106: 终端对获取的识别内容进行解析和处理,包含对语音识别的内容和搜索的内容结果的处理和显示,对语音识别结果,内容处理模块完成挑选和截取语音范围内的所包含的完整的语句等功能,对搜索结果,内容处理模块完成对搜索结果的相关性排序以及内容显示的格式处理,并在处理完毕后,叠加在用户的应用界面上显示或进行语音播放。管理配置模块107: 终端用户进行业务配置和数据管理,用户通过管理模块对业务的数据和业务的配置进行设置。接口模块 108: 终端侧与系统进行交互的模块,通过接口与系统进行各种交互和消息的传递和接收,按照接口参数发起请求和接收系统的各种消息。传输通道109: 提供数据传输的实际的物理通道,可以是无线宽带网和移动数据网络,包含各个移动通信的数据信道,WIFI,固定宽带等。系统接口模块110: 系统侧与终端进行交互的模块,与终端进行通信,提供各种接口供终端进行系统的访问,按照协商的协议进行数据传输,将数据发送给终端和接收终端的请求数据。日志模块111: 将系统的各种操作的信息记录到系统日志,并提供给用户进行查询。数据库112: 系统端提供数据存储以及各种基于数据库的各种功能,如数据触发器、函数等逻辑功能的数据系统。业务逻辑模块113: 负责系统本文档来自技高网...
【技术保护点】
一种基于语音识别的阅读辅助系统,其特征在于,终端获取用户阅读的内容的语音,在终端或系统进行内容的识别后进行内容的搜索和处理,按照内容相关性进行排序,并将搜索和处理的结果返回给终端,终端对系统传递的数据进行解析和处理并叠加显示在用户的终端显示界面。
【技术特征摘要】
1.一种基于语音识别的阅读辅助系统,其特征在于,终端获取用户阅读的内容的语音,在终端或系统进行内容的识别后进行内容的搜索和处理,按照内容相关性进行排序,并将搜索和处理的结果返回给终端,终端对系统传递的数据进行解析和处理并叠加显示在用户的终端显示界面。2.如权利要求1所述,终端获取用户阅读的内容的语音,其特征在于,用户朗读感兴趣的内容部分,终端获取用户的语音并将语音记录转换为压缩的音频数据文件作为识别数据源,进行语音文字识别,获取其包含的文本。3.如权利要求1所述,终端获取用户的语音后,在终端或系统进行内容的识别后进行内容的搜索和处理,其特征在于,获取用户感兴趣并朗读的内容部分的语音后,通过终端本地语音识别方式或基于系统开放的语音识别服务方式识别获取语音对应的文本内容,并获得返回的识别结果。4.如权利要求3所述,在终端或系统进行语音的识别,其特征在于,系统通过服务方式开发语音识别服务接口,终端侧通过系统端提供的语音识别服务访问接口发起语音识别服...
【专利技术属性】
技术研发人员:顾健,
申请(专利权)人:上海博路信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。