成都开心音符科技有限公司专利技术

成都开心音符科技有限公司共有11项专利

  • 本申请提供一种音频和视频生成方法、电子设备和计算机可读存储介质,该方法包括:获取目标文本信息;将目标文本信息输入预先训练完成的音视频生成自回归模型,获得目标视频令牌数量以及目标音频令牌数量;对目标视频令牌数量进行解码获得目标文本信息对应...
  • 本申请涉及音频处理技术领域,具体提供和声识别及其模型训练方法、程序产品、设备及存储介质。该和声识别模型训练方法基于节拍数据对待训练音频数据进行分割,对分割获得的多个音频分割片段进行特征提取,并将提取获得的待训练音频特征数据输入到待训练和...
  • 本申请涉及音频处理技术领域,具体提供旋律识别及其模型训练方法、程序产品、设备及存储介质。该旋律识别模型训练方法通过对待训练音频数据进行特征提取,将提取到的待训练特征数据输入到待训练旋律识别模型中,获得模型识别结果;并根据模型识别结果以及...
  • 本申请提供了一种声音转换方法、装置、电子设备及计算机可读存储介质,该方法包括:预处理原始音频;提取预处理后的原始音频中的关键特征;通过自回归模型根据关键特征和参考音频,将关键特征转换为参考特征,参考特征为带有参考音频音色和韵律的声学特征...
  • 本发明公开了一种针对歌唱人声旋律转录的方法及装置,涉及人声旋律转录技术领域,所述音频预处理是从本地文件或者超文本传输协议请求中读取音频数据,并使用公开工具转码为单通道音频数据,然后分离人声和伴奏,最后对人声音频分段;通过前置分离人声音轨...
  • 本发明公开了一种
  • 本发明公开了一种基于歌词和旋律的端到端音乐音频生成的方法,涉及多媒体内容处理技术领域
  • 本发明公开了一种音乐旋律生成方法,所述方法包括:已有歌曲音频进行转换成音高序列
  • 本申请涉及音频处理技术领域,尤其涉及一种基于多任务学习的音乐结构分析方法及装置,其方法包括获取音频数据并预处理,得到目标音频数据;提取目标音频特征;调用目标神经网络模型,通过输入目标音频特征,输出音频段落的边界概率值以及标签概率值;基于...
  • 本申请涉及音频处理技术领域,尤其涉及一种歌曲串烧拼接方法和装置,其方法包括获取N个音频文件,确定每一所述音频文件的特征信息,并依据所述特征信息将所述音频文件进行分类,得到分类后的音频文件集,在同一所述音频文件集中提取每一所述音频文件的副...
  • 本申请涉及音频处理技术领域,尤其涉及一种歌曲人声检测方法及装置,其方法包括获取待提取人声的音频数据,并对所述音频数据进行预处理;依据预设的特征提取策略提取预处理后的所述音频数据的音频特征;依据所述音频特征以及预设的人声识别模型,确定所述...
1