一种语音播放方法和装置制造方法及图纸

技术编号：14809102 阅读：107 留言：0更新日期：2017-03-15 01:57

一种语音播放方法和装置，所述方法包括：获取包含至少一个说话者的原始音频流；根据预设训练算法，对所述原始音频流进行训练；将所述训练后的音频流加载在流媒体文件中，以进行播放。以此，可以播放出精确度较高、失真度较小的音频数据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音识别
，尤其涉及一种语音播放方法和装置。
技术介绍
声纹识别是一种利用人的声音实现的识别技术，由于人在讲话时使用的发声器官存在一定的差异性，任何两个人声音的声纹图谱都有差异，所以声纹可以作为表征个体差异的生物特征，也即可以通过建立声纹特征模型来表征不同的个体，进而利用该声纹特征模型进行识别不同的个体等。目前声纹特征模型的应用存在一个两难的选择，主要体现在训练语料的长度选取上，一般而言，声纹训练语料越长，建立的特征模型越精确，识别准确率越高，但是实用性不强；声纹训练语料较短，能保证较好的实用性，但识别准确率不高。而在实际应用中，比如手机屏幕声纹解锁的应用等，既要求有较高的识别准确率，以满足安全性，又要求训练语料不能太长，以保证较好的实用性。现有的声纹特征模型建立方法是通过在声纹注册阶段，由用户手动多次训练，每次训练均为短语料，最终将他们组合成较长的训练语料来生成特征模型。然而，由用户手动多次录入一定时长的训练语料，会给用户较差的体验，不具备较高的实用性；组合起来的训练语料长度仍然有限，不能生成较精确的特征模型，识别准确率无法进一步提升；语速语调的变化、情绪波动等也都会影响模型建立的精确度。所以，如何在保证较高的实用性前提下，提高声纹特征模型精确度，进而提高识别准确率是急需解决的问题。
技术实现思路
基于此，为了解决上述问题，提供了一种语音播放方法和装置。一种语音播放方法，所述方法包括：获取包含至少一个说话者的原始音频流；根据预设训练算法，对所述原始音频流进行训练；<...

【技术保护点】
一种语音播放方法，其特征在于，所述方法包括：获取包含至少一个说话者的原始音频流；根据预设训练算法，对所述原始音频流进行训练；将所述训练后的音频流加载在流媒体文件中，以进行播放。

【技术特征摘要】
1.一种语音播放方法，其特征在于，所述方法包括：
获取包含至少一个说话者的原始音频流；
根据预设训练算法，对所述原始音频流进行训练；
将所述训练后的音频流加载在流媒体文件中，以进行播放。
2.如权利要求1所述的方法，其特征在于，所述方法还包括：
建立训练样本库。
3.如权利要求1或2所述的方法，其特征在于，所述根据预设训练算法，对所述原始音频流进行训练包括：
对原始音频流进行分割，得到模拟音频流和真实音频流；
对模拟音频流和真实音频流进行冲激，根据冲激音频流。
4.如权利要求3中所述的方法，其特征在于，所述将所述训练后的音频流加载在流媒体文件中，以进行播放包括：
判断所述冲激音频流在所述训练样本库中是否找到匹配的样本对象；
若匹配，则将该冲激音频流作为训练后的音频流加载在流媒体文件中，以进行播放。
5.如权利要求1所述的方法，其特征在于，所述方法还包括：
测试所述流媒体文件是否失真。
6.一种语音播放装置，其特...

【专利技术属性】
技术研发人员：曾戟，
申请(专利权)人：曾戟，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人