一种音频的输出方法和系统技术方案

技术编号：23498421 阅读：33 留言：0更新日期：2020-03-13 13:18

本发明专利技术公开了一种音频的输出方法和系统，所述方法包括以下步骤：获取客户端采集持续的语音信息，将语音信息进行分段切割，对分段切割后的语音信息进行解码，再将语音信息转化为第一文本信息并存储；对第一文本信息进行过滤，再进行关键词的提取，对关键词按照出现的次数进行标记，当同一个关键词标记的次数超过预设阈值且关键词未在标准词库中，则将关键词导入标准词库；利用机器学习的方法，对提取后的关键词搜索后进行匹配，将匹配后含有关键词的文字组成第二文本信息并排列；按照优先级的顺序将第二文本信息转化为相对应的标准音频并输出。本发明专利技术实施例能够对音频信息进行识别，并快速、精确的输出处理后的音频信息，改善语言表达的效果。

An audio output method and system

全部详细技术资料下载

【技术实现步骤摘要】
一种音频的输出方法和系统
本专利技术涉及语音识别领域，具体涉及一种音频的输出方法和系统。
技术介绍
音频是促进人与人、人与发声体之间有效交互的必要手段，现有的知识资讯、互动娱乐、情感表达等多数是以音频为媒介来进行信息传输的，这些都无一例外的体现了音频具有沟通高效性、易于接受等特点。随着信息化时代的发展，音频需要搭载的信息越来越多，此时，需要通过某种方式将此段音频交互出去。但是，对于部分人群来说，将说出去的话清楚、准确的传递出去，还是有些困难的，例如，部分人的英语水平有限，可能发音不标准、重复词也较多，说出去的英语可能达不到内心的要求。还比如，对于部分人群来说，由于说话中的出现有错别字、语速过快等问题，可能对于听众来说，这种说话方式难以让人理解，甚至产生误解，从而造成语音信息的遗漏或者关键点的丢失甚至是无用信息的重复。现有的音频提示方式是通过提词器等文本方式来促进交互，但其方式缺少交互的流畅性，达不到语言表达的节奏性效果，得不到期望的交互反馈，从某种程度上来说，甚至会失去有效信息的传递。因此，如何提供一种输出效率更高的音频输出方式，提升用户间的交互体验，成为语音输出方面亟需解决的问题。
技术实现思路
为了解决现有技术的问题，本专利技术实施例提供了一种音频的输出方法和系统，能够自动对发出的音频信息进行智能识别，并快速、精确地输出处理后的音频提示信息，提高语言表达的节奏效果。为解决上述技术问题，本专利技术采用的技术方案是：第一方面，本专利技术实施例提供了一种音频的输出方法，包括以...

【技术保护点】
1.一种音频的输出方法，其特征在于，包括以下步骤：/n获取客户端采集的持续的语音信息，将所述语音信息进行分段切割，对分段切割后的所述语音信息进行解码，再将切割后的所述语音信息转化为第一文本信息并存储；/n对所述第一文本信息进行过滤，然后进行关键词的提取，对所述关键词按照出现的次数进行标记，当同一个所述关键词标记的次数超过预设阈值且所述关键词未在标准词库中，则将所述关键词导入标准词库；/n利用机器学习的方法，对提取后的所述关键词在所述标准词库中搜索后进行匹配，将匹配后含有所述关键词的文字组成第二文本信息，对所述第二文本信息进行关联度的优先级排列；/n按照优先级的顺序将所述第二文本信息转化为相对应的标准音频并输出。/n

【技术特征摘要】
1.一种音频的输出方法，其特征在于，包括以下步骤：
获取客户端采集的持续的语音信息，将所述语音信息进行分段切割，对分段切割后的所述语音信息进行解码，再将切割后的所述语音信息转化为第一文本信息并存储；
对所述第一文本信息进行过滤，然后进行关键词的提取，对所述关键词按照出现的次数进行标记，当同一个所述关键词标记的次数超过预设阈值且所述关键词未在标准词库中，则将所述关键词导入标准词库；
利用机器学习的方法，对提取后的所述关键词在所述标准词库中搜索后进行匹配，将匹配后含有所述关键词的文字组成第二文本信息，对所述第二文本信息进行关联度的优先级排列；
按照优先级的顺序将所述第二文本信息转化为相对应的标准音频并输出。

2.根据权利要求1所述的音频的输出方法，其特征在于，所述语音信息的分段切割包括以下步骤：对所述语音信息按照时间戳的序列通过脉冲编码调制变为语音编码数据，对连续两段固定时间长度的所述语音编码数据进行相似度检测，将所述语音编码数据的重复拼接区域进行最适端点标记，切割筛选所述语音编码数据的重复数据。

3.根据权利要求1所述的音频的输出方法，其特征在于，所述第一文本信息的过滤至少包括：对语气词的识别和重复词的筛选。

4.根据权利要求1所述的音频的输出方法，其特征在于，所述标准词库中设置有优选存储区，所述优选存储区用于存储优先级最高的备选联想内容，所述备选联想内容对应于出现次数超过预设阈值的所述关键词。

5.根据权利要求1所述的音频的输出方法，其特征在于，对所述关键词的匹配前还包括通过模糊算法对所述关键词的处理，对所述关键词搜索包括搜索所述关键词的同近义词、同音义词、低比例错字；所述优先级排列的方法至少包括贝叶斯决策方法。

6.根据权利要求1所述的音频的输出方法，其特征在于，所述标准音频的输出对应于不同客户端的应用场所，当为单侧客户端时，输...

【专利技术属性】
技术研发人员：蔡继发，宋飞豹，倪合强，姚寿柏，
申请(专利权)人：苏宁云计算有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人