广州九四智能科技有限公司专利技术

广州九四智能科技有限公司共有10项专利

  • 本发明公开了一种本发明的数字人视频交互方法及系统,数字人能有效对用户的话语进行回应,在语音通话过程中,用户接受数字人的视频邀请后,AI能平滑切换至视频,视频通话过程中,能实现数字人自然倾听用户说话的效果,在通话过程中,如果用户一直不回应...
  • 本发明提供一种基于融合语义信息的语音合成的方法,包括如下步骤:数据准备,收集语音数据以及对应文本,对数据进行预处理提取音素序列、时长、能量、基频数据;模型构建,构建融合语义信息的语音合成模型;模型训练,输入真实音频对应的音素序列、时长、...
  • 本发明提供一种基于融合语义信息的语音合成的方法,包括如下步骤:搜集对应的语音数据,生成真实语音的能量、音高、音素持续时长、字停顿等级标签以及梅尔频谱数据,然后进行模型的构建与训练,再进行模型的测试与评估。本发明在模型中增加了停顿预测器,...
  • 本申请实施例属于自然语言处理技术领域,一种语义提取方法,包括分别对历史问答语句和当前问答语句进行标记,以获取历史标记向量和当前标记向量;分别将历史标记向量和当前标记向量输入到预先训练的编码网络,以获取历史语句编码和当前语句编码;将历史语...
  • 本申请实施例属于语义识别技术领域,涉及一种电话通话中信息提取方法,包括对电话通话进行语音识别,并且对语音识别的结果提取词嵌入向量;将词嵌入向量输入到预先训练的识别网络,以输出与词嵌入向量相应的概率矩阵;将概率矩阵输入到CRF层,以识别词...
  • 本申请实施例属于语音识别技术领域,涉及人声分离提取方法,包括一种人声分离提取方法,包括将带有环境噪声的录音转化为原始幅度谱;将所述原始幅度谱输入到预先训练的抗噪神经网络,以确定与所述原始幅度谱相应的p‑PSM值,所述p‑PSM值大于等于...
  • 本发明公开了一种少量录音样本情况下语音合成方法,包括如下步骤:A)运用目标录音人员所录制的少量训练语句得到背景说话人模型;B)通过自适应算法将所得到的当前说话人语句和原始录制的完整的说话人语句,分别建立说话人模型;C)通过调整所述说话人...
  • 本发明公开了一种智能电话客服的语义分析方法,包括如下步骤:A)对客户的语音信息进行语音识别,生成文本内容;B)对所述文本内容进行分词;C)对分词后的每一项计算一个权重;D)根据权重的大小选择文本内容中的关键词;E)智能电话客服系统根据所...
  • 本发明公开了一种噪声环境下层级式语音降噪识别方法及系统,方法包括如下步骤:设置通话常用的文本,并进行文本的录入;使用设置好的文本建立文本数据库;根据文本进行纯净语音和各类噪声的录制;将纯净语音与各类噪声进行线性组合,建立语音数据库;对带...
  • 本发明公开了一种高保真的智能客服语音合成方法,包括:进行语音的录制;建立初始语料库;对录制好的语音进行强制对齐;进行语音切割得到三音子模型;利用三音子模型形成目标语料库;对于切割好的三音子基元计算似然;建立三音子决策树;根据所需合成文本...
1