基于隐马尔科夫模型的统计语音合成方法及装置制造方法及图纸

技术编号：12304155 阅读：113 留言：0更新日期：2015-11-11 13:26

一种基于隐马尔科夫模型的统计语音合成方法及装置，通过生成关联多模态的自然语言问题，根据自然语言问题生成相应图片并加入干扰元素，根据问题文本，使用基于HMM的语音合成方法的多模态验证码合成语音并加入噪声，本发明专利技术将验证码的模式从单模态提升到互相之间有语义关联的多模态，进一步增进现有验证码对于人类和计算机的区分性，提升互联网验证系统的人机区分度，加强安全性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的是一种中文多模态验证码。尤其是基于隐马尔科夫模型的统计语音合成的多模态验证码以及通过自然语言语义连接不同模态（图片和声音）的信息。
技术介绍
验证码的全称是全自动区分计算机和人类的公开图灵测试，是一种用来区分用户是否是人类的测试。其实现机制是由计算机程序自动生成一个问题由用户来解答，这个问题的能由人类解答，但是计算机不能解答。因此用户能够回答出问题，就被认为是人类。验证码的特点还包括可以由计算机程序全自动生成，其答案可以由计算机评判正误。验证码的作用在于有效防止利用技术手段进行大量自动化的操作，保护服务器的计算资源和安全：例如防止网站的批量注册，防止大规模网上发帖、发广告和垃圾信息，防止密码被暴力破解，防止网站被恶意攻击等等。所以在互联网安全领域，验证码的应用十分广泛。近年来由于在线支付的发展，涉及到金钱交易的登录系统越来越多，也增大了破解登录系统验证码的诱惑。许多个人和商业公司，用不同的方法在尝试破解验证码，这就给网站的安全和用户的隐私带来了隐患。目前，验证码主要有识别图像中的文字、识别语音中的文字和回答验证问题等几种形式。大部分的网站采用图片验证码，即通过程序随机生成一个字符串，可以是英文、中文或者数字，将该字符串生成为图片交由用户识别。用户将肉眼识别的结果提交到服务器，如果提交的字符串和原始生成的字符串一致，就通过了此次验证码测试。语音验证码同理，只不过给用户识别的媒介是字符串发音的音频。通常来说，为了防止机器识别，图片验证码需要对字符串文本做出变形，并加入噪点；语音验证码需要加入背景音、...

【技术保护点】
一种基于隐马尔科夫模型的统计语音合成方法，其特征在于，通过生成关联多模态的自然语言问题，根据自然语言问题生成相应图片并加入干扰元素，根据问题文本，使用基于HMM的语音合成方法的多模态验证码合成语音并加入噪声，使得破解验证码的难度由单模态的验证码破解概率提升到几个单模态的验证码破解概率的叠加，在不降低用户体验的基础上提高了验证码的人机区分度。

【技术特征摘要】

【专利技术属性】
技术研发人员：俞凯，王向然，陈博，徐佳琛，
申请(专利权)人：上海交通大学，苏州思必驰信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人