苏州奇梦者科技有限公司专利技术

苏州奇梦者科技有限公司共有47项专利

  • 本申请提供了一种声纹唤醒方法及系统,通过将说话人确认以及唤醒词确认这两大核心功能进行端到端集成,无需切出唤醒词再送入声纹模型,可以避免唤醒词切分不准确所造成的声纹提取的不准确。本方法中声纹确认以及唤醒词确认能够同时进行,从而避免了两段式...
  • 本发明公开了一种提高唤醒率的方法、系统、设备及存储介质,上述的提高唤醒率的系统包括超声波和语音提供模块、超声感知模块、超声定位模块、声源定位模块、目标声源方位确定模块、语音增强模块和语音唤醒模块;本发明通过接收超声波信号后分析超声波的多...
  • 本发明公开了一种提高唤醒率的方法、系统、设备及存储介质,上述的提高唤醒率的系统包括超声波和语音提供模块、超声感知模块、超声定位模块、声源定位模块、目标声源方位确定模块、语音增强模块和语音唤醒模块;本发明通过接收超声波信号后分析超声波的多...
  • 本申请提供了一种端到端语音转换模型及其训练方法、推理方法,该模型以条件变分编码器为基础,训练时将声学模型与声码器共同训练,避免训练与推理的不匹配。使用大规模预训练Hubert模型来提取内容信息表征,既可初步剥离内容表征中的说话人信息,也...
  • 本申请提供了一种端到端语音转换模型及其训练方法、推理方法,该模型以条件变分编码器为基础,训练时将声学模型与声码器共同训练,避免训练与推理的不匹配。使用大规模预训练Hubert模型来提取内容信息表征,既可初步剥离内容表征中的说话人信息,也...
  • 本发明公开了一种灵活离、在线声纹日志系统,包括在线分支,或在线分支和离线分支,在线分支的输出包括每个说话人对应的时间边界和每个说话人对应的声纹,通过离线分支能够获取精确至帧级别的说话人边界。本发明提供的灵活离、在线声纹日志系统,满足声纹...
  • 本发明公开了一种超声定位辅助的声场跟随系统及方法,所述系统包括:送音模块,所述送音模块由一组扬声器阵列组成,用于发射超宽带声学信号;收音模块,所述收音模块由一组麦克风阵列组成,用于接收超宽带声学信号;超声定位模块,所述超声定位模块利用收...
  • 本申请提供了一种远端会议装置的近端控制方法、远程会议系统及相关装置,其中方法包括:近端会议装置根据用户的控制操作,通过音频水印生成算法,将对应的控制指令以音频水印的方式嵌入到语音数据流中,通过上行通道传输给远端会议装置。远端会议装置从下...
  • 本发明公开了一种屏幕无接触触控方法及其系统,所述系统由以下单元组成:发射单元:所述发射单元用于发射预先设计的超声波信号;采集单元M1、M2:所述采集单元M1、M2用于接收超声波信号,均由至少两个超声接收器组成;计算单元:所述计算单元用于...
  • 本发明提供了一种触控定位系统及方法,其可有效实现触控笔的准确定位,提高定位精度;包括发射端和接收端,所述发射端中设置有信号发射模块,所述接收端中设置有信号接收模块,所述接收端中还设置有与所述信号接收模块连接的定位模块;其中,所述信号发射...
  • 本发明公开了多模型语音命令词的识别方法、系统、设备及储存介质,该识别方法包括如下步骤:基于需要支持的语音命令词划分后构建相应数量的模型以及各个模型支持的命令词;根据划分的结果得出系统运行时需要并行的模型最大数量,根据模型的最大数量创建线...
  • 本发明公开了一种设备状态控制方法、装置、设备和介质,上述装置包括发射模块、采集模块、超声感知模块、语音接收模块、语音检测模块、人脸识别模块和设备状态调整模块;本发明以超声感知为主导,首先通过超声感知判断物体是否活动即可对设备的状态进行自...
  • 本发明公开了一种防语音误识的方法及其系统,所述系统包括:声音发射模块、声音采集模块、活动监测模块、语音交互模块、语音活动检测模块和语音唤醒子模块。本发明利用超声信号监测机器周围环境中的物体活动,若周围环境中没有物体活动,则不会进行语音唤...
  • 本发明提供了一种定向数据传输的方法和系统及装置,其可灵活快速地在不同设备之间进行切换和数据传输,方便实现不同设备之间的互联互动;包括以下步骤:步骤一、发送设备在起始位置和移动停止位置分别发送超声信号;步骤二、处于同一空间内的若干接收设备...
  • 本申请提供了一种远距离超声通信方法及消费电子设备,方法包括:发射端采用扫频信号作为脉冲信号,将二进制数据加载到脉冲信号中,生成基带信号并调制为超声信号;接收端通过麦克风采集信号,进行解调和匹配滤波,经过双通道信道均衡、相位补偿和码元判断...
  • 本发明提供了一种线上互动教学方法、系统,其克服了现有的线上教学系统交互操作较为复杂的问题,简化了学生端的操作,更适合低龄学生使用,还原了线下教学的互动逻辑,具有更好的教学效果,线上互动教学方法包括以下步骤:教师端发出互动请求;响应于教师...
  • 本申请提供了一种语音唤醒方法及设备,其中方法包括:接收音频序列;对音频序列进行音频事件检测;将带有语音的音频片段输入第一级唤醒模型;当第一级唤醒模型检测到唤醒词时,将音频片段输入第二级唤醒模型;当第二级唤醒模型检测到唤醒词时,将音频片段...
  • 本申请提供了一种超声通信解码方法、编码方法和相关装置,其中解码方法包括:对接收到的超声信号进行分帧,提取每一帧的频谱能量特征;把每一帧的频谱能量特征送入包头检测模型进行分类,如果连续T帧的分类结果都是包头,则认为数据包开始,否则继续检测...
  • 本申请提供了一种端到端语音拼接合成方法,采用完全端到端的声学模型建模拼接单元的声学分布,模型直接以音素序列作为输入,无需专家知识设计声学模型,极大减轻了声学建模的复杂度。此外,端到端声学模型比传统声学模型具有更强的序列建模能力,能够输出...
  • 本申请提供了一种超声手势识别方法及系统,其中方法包括:生成并发出多频超声波信号;通过麦克风阵列采集多通道手势超声信号,所述麦克风阵列至少包括两个平行于手势挥动方向的麦克风;从多通道手势超声信号中提取各个通道的频谱能量特征,计算通道间频谱...