本发明专利技术公开了一种音频的输出方法和系统,所述方法包括以下步骤:获取客户端采集持续的语音信息,将语音信息进行分段切割,对分段切割后的语音信息进行解码,再将语音信息转化为第一文本信息并存储;对第一文本信息进行过滤,再进行关键词的提取,对关键词按照出现的次数进行标记,当同一个关键词标记的次数超过预设阈值且关键词未在标准词库中,则将关键词导入标准词库;利用机器学习的方法,对提取后的关键词搜索后进行匹配,将匹配后含有关键词的文字组成第二文本信息并排列;按照优先级的顺序将第二文本信息转化为相对应的标准音频并输出。本发明专利技术实施例能够对音频信息进行识别,并快速、精确的输出处理后的音频信息,改善语言表达的效果。
An audio output method and system
【技术实现步骤摘要】
一种音频的输出方法和系统
本专利技术涉及语音识别领域,具体涉及一种音频的输出方法和系统。
技术介绍
音频是促进人与人、人与发声体之间有效交互的必要手段,现有的知识资讯、互动娱乐、情感表达等多数是以音频为媒介来进行信息传输的,这些都无一例外的体现了音频具有沟通高效性、易于接受等特点。随着信息化时代的发展,音频需要搭载的信息越来越多,此时,需要通过某种方式将此段音频交互出去。但是,对于部分人群来说,将说出去的话清楚、准确的传递出去,还是有些困难的,例如,部分人的英语水平有限,可能发音不标准、重复词也较多,说出去的英语可能达不到内心的要求。还比如,对于部分人群来说,由于说话中的出现有错别字、语速过快等问题,可能对于听众来说,这种说话方式难以让人理解,甚至产生误解,从而造成语音信息的遗漏或者关键点的丢失甚至是无用信息的重复。现有的音频提示方式是通过提词器等文本方式来促进交互,但其方式缺少交互的流畅性,达不到语言表达的节奏性效果,得不到期望的交互反馈,从某种程度上来说,甚至会失去有效信息的传递。因此,如何提供一种输出效率更高的音频输出方式,提升用户间的交互体验,成为语音输出方面亟需解决的问题。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种音频的输出方法和系统,能够自动对发出的音频信息进行智能识别,并快速、精确地输出处理后的音频提示信息,提高语言表达的节奏效果。为解决上述技术问题,本专利技术采用的技术方案是:第一方面,本专利技术实施例提供了一种音频的输出方法,包括以下步骤:获取客户端采集的持续的语音信息,将所述语音信息进行分段切割,对分段切割后的所述语音信息进行解码,再将切割后的所述语音信息转化为第一文本信息并存储;对所述第一文本信息进行过滤,然后进行关键词的提取,对所述关键词按照出现的次数进行标记,当同一个所述关键词标记的次数超过预设阈值且所述关键词未在标准词库中,则将所述关键词导入标准词库;利用机器学习的方法,对提取后的所述关键词在所述标准词库中搜索后进行匹配,将匹配后含有所述关键词的文字组成第二文本信息,对所述第二文本信息进行关联度的优先级排列;按照优先级的顺序将所述第二文本信息转化为相对应的标准音频并输出。进一步地,所述语音信息的分段切割包括以下步骤:对所述语音信息按照时间戳的序列通过脉冲编码调制变为语音编码数据,对连续两段固定时间长度的所述语音编码数据进行相似度检测,将所述语音编码数据的重复拼接区域进行最适端点标记,切割筛选所述语音编码数据的重复数据。进一步地,所述第一文本信息的过滤至少包括:对语气词的识别和重复词的筛选。进一步地,所述标准词库中设置有优选存储区,所述优选存储区用于存储优先级最高的备选联想内容,所述备选联想内容对应于出现次数超过预设阈值的所述关键词。进一步地,对所述关键词的匹配前还包括通过模糊算法对所述关键词的处理,对所述关键词搜索包括搜索所述关键词的同近义词、同音义词、低比例错字;所述优先级排列的方法至少包括贝叶斯决策方法。进一步地,所述标准音频的输出对应于不同客户端的应用场所,当为单侧客户端时,输出为可供选择的至少三条按照关联度高低排列的所述标准音频;当为双侧客户端时,输出为关联度最高的所述标准音频。另一方面,本专利技术实施例还提供了一种音频的输出系统,包括:采集输入模块,用于获取客户端采集的持续的语音信息,将所述语音信息进行分段切割,对分段切割后的所述语音信息进行解码,再将切割后的所述语音信息转化为第一文本信息并存储;关键词处理模块,用于对所述第一文本信息进行过滤,然后进行关键词的提取,对所述关键词按照出现的次数进行标记,当同一个所述关键词标记的次数超过预设阈值且所述关键词未在标准词库中,则将所述关键词导入标准词库;搜索关联模块,用于通过机器学习的方法,对提取后的所述关键词在所述标准词库中搜索后进行匹配,将匹配后含有所述关键词的文字组成第二文本信息,对所述第二文本信息进行关联度的优先级排列;音频输出模块,用于按照优先级的顺序将所述第二文本信息转化为相对应的标准音频并输出。进一步地,所述采集输入模块包括语音切割单元,所述语音切割单元用于将所述语音信息按照时间戳的序列通过脉冲编码调制变为语音编码数据,对连续两段固定时间长度的所述语音编码数据进行相似度检测,将所述语音编码数据的重复拼接区域进行最适端点标记,切割筛选所述语音编码数据的重复数据。进一步地,所述关键词处理模块包括优先存储单元,用于在所述标准词库中设置优选存储区,所述优选存储区用于存储优先级最高的备选联想内容,所述备选联想内容对应于出现次数超过预设阈值的所述关键词。进一步地,所述搜索关联模块包括有智能搜索单元和优先排序单元,所述智能搜索单元对所述关键词的搜索包括搜索所述关键词的同近义词、同音义词、低比例错字,所述优先排序单元进行的所述优先级排列至少包括贝叶斯决策方法。本专利技术实施例提供的技术方案带来的有益效果是:本专利技术实施例公开的一种音频的输出方法和系统,通过对用户的语音信息先进行采集,并对采集后的语音信息按照时间戳的序列进行分段切割和转化为第一文本信息后,对所述第一文本信息进行过滤和关键词的提取,利用所述关键词在标准词库中进行搜索出关联度高备选联想内容,同时,利用机器学习的方法,对高频的关键词进行强化学习,使得所述标准词库能够不断存储对应优先级高的备选联想内容,通过贝叶斯决策方法将匹配后含有所述关键词的文字组成第二文本信息,对所述第二文本信息进行关联度的优先级排列,再按照优先级的顺序对所述第二文本信息转化为相对应的标准音频,从而更加应用场景的不同,最终输入和用户最初发出的语音信息相似的标准音频。本专利技术实施例能够避免用户在通过终端交流过程中的发音不准、发音错误的情形,还能够通过机器学习的方法,通过关键词的提取,智能联想出音频发出者的想要表达的语音,通过对交流方式的机器学习,提升用户沟通时的交互体验。且本专利技术实施例对音频的输出方法实现方式简便、快速且可塑性高,应用场景广泛。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供了音频的输出方法的一种流程示意图;图2是本专利技术实施例提供了音频的输出方法中关于词库搜索的流程示意图;图3是本专利技术实施例提供了音频的输出系统的一种结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例本文档来自技高网...
【技术保护点】
1.一种音频的输出方法,其特征在于,包括以下步骤:/n获取客户端采集的持续的语音信息,将所述语音信息进行分段切割,对分段切割后的所述语音信息进行解码,再将切割后的所述语音信息转化为第一文本信息并存储;/n对所述第一文本信息进行过滤,然后进行关键词的提取,对所述关键词按照出现的次数进行标记,当同一个所述关键词标记的次数超过预设阈值且所述关键词未在标准词库中,则将所述关键词导入标准词库;/n利用机器学习的方法,对提取后的所述关键词在所述标准词库中搜索后进行匹配,将匹配后含有所述关键词的文字组成第二文本信息,对所述第二文本信息进行关联度的优先级排列;/n按照优先级的顺序将所述第二文本信息转化为相对应的标准音频并输出。/n
【技术特征摘要】
1.一种音频的输出方法,其特征在于,包括以下步骤:
获取客户端采集的持续的语音信息,将所述语音信息进行分段切割,对分段切割后的所述语音信息进行解码,再将切割后的所述语音信息转化为第一文本信息并存储;
对所述第一文本信息进行过滤,然后进行关键词的提取,对所述关键词按照出现的次数进行标记,当同一个所述关键词标记的次数超过预设阈值且所述关键词未在标准词库中,则将所述关键词导入标准词库;
利用机器学习的方法,对提取后的所述关键词在所述标准词库中搜索后进行匹配,将匹配后含有所述关键词的文字组成第二文本信息,对所述第二文本信息进行关联度的优先级排列;
按照优先级的顺序将所述第二文本信息转化为相对应的标准音频并输出。
2.根据权利要求1所述的音频的输出方法,其特征在于,所述语音信息的分段切割包括以下步骤:对所述语音信息按照时间戳的序列通过脉冲编码调制变为语音编码数据,对连续两段固定时间长度的所述语音编码数据进行相似度检测,将所述语音编码数据的重复拼接区域进行最适端点标记,切割筛选所述语音编码数据的重复数据。
3.根据权利要求1所述的音频的输出方法,其特征在于,所述第一文本信息的过滤至少包括:对语气词的识别和重复词的筛选。
4.根据权利要求1所述的音频的输出方法,其特征在于,所述标准词库中设置有优选存储区,所述优选存储区用于存储优先级最高的备选联想内容,所述备选联想内容对应于出现次数超过预设阈值的所述关键词。
5.根据权利要求1所述的音频的输出方法,其特征在于,对所述关键词的匹配前还包括通过模糊算法对所述关键词的处理,对所述关键词搜索包括搜索所述关键词的同近义词、同音义词、低比例错字;所述优先级排列的方法至少包括贝叶斯决策方法。
6.根据权利要求1所述的音频的输出方法,其特征在于,所述标准音频的输出对应于不同客户端的应用场所,当为单侧客户端时,输...
【专利技术属性】
技术研发人员:蔡继发,宋飞豹,倪合强,姚寿柏,
申请(专利权)人:苏宁云计算有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。