音频处理方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:34371962 阅读:65 留言:0更新日期:2022-07-31 11:36
本公开的实施例公开了音频处理方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:响应于接收到用户端发送的音频,对音频进行格式转换处理,以生成转换音频;将转换音频输入至预先训练的音频信息提取模型中,得到音频信息序列;根据音频信息序列包括的各个音频帧数,将音频信息序列中的各个音频信息进行分组处理,得到分组音频信息序列集;将分组音频信息序列集与标准音频信息序列集进行匹配处理,得到标准分组音频信息序列集;根据分组音频信息序列集和标准分组音频信息序列集,生成音频检测文本。该实施方式减少了教学时间的浪费。了教学时间的浪费。了教学时间的浪费。

Audio processing method, device, electronic device and computer readable medium

【技术实现步骤摘要】
音频处理方法、装置、电子设备和计算机可读介质


[0001]本公开的实施例涉及计算机
,具体涉及音频处理方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]随着现代乐器的发展,如何确定用户弹奏的内容的准确性成为一项重要的研究课题。目前,在确定用户弹奏的内容的准确性时,通常采用的方式为:通过老师对用户弹奏的内容进行分析,确定弹奏的内容的准确性。
[0003]然而,当采用上述方式确定用户弹奏的内容的准确性时,经常会存在如下技术问题:
[0004]第一,通过老师确定用户弹奏的内容是否正确时,老师容易遗漏弹奏出错的内容,因此需要反复播放用户弹奏的内容,以找到每个弹奏出错的内容,造成教学时间的浪费;
[0005]第二,通过老师确定用户弹奏的内容是否正确时,老师无法确定用户弹奏的每个音的节奏的快慢,导致用户需要对全曲内容进行反复练习,造成练习时间的浪费。

技术实现思路

[0006]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0007]本公开的一些实施例提出了音频处理方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0008]第一方面,本公开的一些实施例提供了一种音频处理方法,该方法包括:响应于接收到用户端发送的音频,对上述音频进行格式转换处理,以生成转换音频;将上述转换音频输入至预先训练的音频信息提取模型中,得到音频信息序列,其中,上述音频信息序列中的音频信息包括音频帧数;根据上述音频信息序列包括的各个音频帧数,将上述音频信息序列中的各个音频信息进行分组处理,得到分组音频信息序列集,其中,上述分组音频信息序列集中的各个分组音频信息序列根据所包括的各个音频帧数排列;将上述分组音频信息序列集与标准音频信息序列集进行匹配处理,得到标准分组音频信息序列集,其中,上述标准分组音频信息序列集包括的标准分组音频信息序列的数量等于上述分组音频信息序列集包括的分组音频信息序列的数量;根据上述分组音频信息序列集和上述标准分组音频信息序列集,生成音频检测文本。
[0009]第二方面,本公开的一些实施例提供了一种音频处理装置,装置包括:转换处理单元,被配置成响应于接收到用户端发送的音频,对上述音频进行格式转换处理,以生成转换音频;输入单元,被配置成将上述转换音频输入至预先训练的音频信息提取模型中,得到音频信息序列,其中,上述音频信息序列中的音频信息包括音频帧数;分组处理单元,被配置成根据上述音频信息序列包括的各个音频帧数,将上述音频信息序列中的各个音频信息进
行分组处理,得到分组音频信息序列集,其中,上述分组音频信息序列集中的各个分组音频信息序列根据所包括的各个音频帧数排列;匹配处理单元,被配置成将上述分组音频信息序列集与标准音频信息序列集进行匹配处理,得到标准分组音频信息序列集,其中,上述标准分组音频信息序列集包括的标准分组音频信息序列的数量等于上述分组音频信息序列集包括的分组音频信息序列的数量;生成单元,被配置成根据上述分组音频信息序列集和上述标准分组音频信息序列集,生成音频检测文本。
[0010]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0011]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0012]本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的音频处理方法,减少了教学时间的浪费。具体来说,造成教学时间的浪费的原因在于:通过老师确定用户弹奏的内容是否正确时,老师容易遗漏弹奏出错的内容,因此需要反复播放用户弹奏的内容,以找到每个弹奏出错的内容,造成教学时间的浪费。基于此,本公开的一些实施例的音频处理方法,首先,响应于接收到用户端发送的音频,对上述音频进行格式转换处理,以生成转换音频。由此,可以将音频格式转换为可以适用音频信息提取模型的音频格式。其次,将上述转换音频输入至预先训练的音频信息提取模型中,得到音频信息序列。由此,可以将各个音频信息进行分组,便于与标准音频信息序列集进行匹配。然后,根据上述音频信息序列包括的各个音频帧数,将上述音频信息序列中的各个音频信息进行分组处理,得到分组音频信息序列集;将上述分组音频信息序列集与标准音频信息序列集进行匹配处理,得到标准分组音频信息序列集。由此,将用户弹奏的每个分组音频信息序列与标准音频信息序列集进行匹配,便于确定每个分组音频信息序列是否与对应的标准音频信息序列相匹配,从而减少了教学时间的浪费。最后,根据上述分组音频信息序列集和上述标准分组音频信息序列集,生成音频检测文本。由此,可以将用户弹奏的情况显示在音频检测文本,完成了对用户弹奏的内容的正确性的确定。从而,减少了教学时间的浪费。
附图说明
[0013]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0014]图1是本公开的一些实施例的音频处理方法的一个应用场景的示意图;
[0015]图2是根据本公开的音频处理方法的一些实施例的流程图;
[0016]图3是根据本公开的音频处理装置的一些实施例的结构示意图;
[0017]图4是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0018]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这
里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0019]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0020]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0021]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0022]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0023]下面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,包括:响应于接收到用户端发送的音频,对所述音频进行格式转换处理,以生成转换音频;将所述转换音频输入至预先训练的音频信息提取模型中,得到音频信息序列,其中,所述音频信息序列中的音频信息包括音频帧数;根据所述音频信息序列包括的各个音频帧数,将所述音频信息序列中的各个音频信息进行分组处理,得到分组音频信息序列集,其中,所述分组音频信息序列集中的各个分组音频信息序列根据所包括的各个音频帧数排列;将所述分组音频信息序列集与标准音频信息序列集进行匹配处理,得到标准分组音频信息序列集,其中,所述标准分组音频信息序列集包括的标准分组音频信息序列的数量等于所述分组音频信息序列集包括的分组音频信息序列的数量;根据所述分组音频信息序列集和所述标准分组音频信息序列集,生成音频检测文本。2.根据权利要求1所述的方法,其中,所述将所述分组音频信息序列集与标准音频信息序列集进行匹配处理,得到标准分组音频信息序列集,包括:将所述分组音频信息序列集与所述标准音频信息序列集进行匹配处理,生成匹配音频信息序列集;响应于所述匹配音频信息序列集中的最后一个匹配音频信息序列与所述标准音频信息序列集中的最后一个标准音频信息序列相对应,将所述匹配音频信息序列集确定为标准分组音频信息序列集;响应于所述匹配音频信息序列集中的最后一个匹配音频信息序列与所述标准音频信息序列集中除最后一个标准音频信息序列之外的任一标准音频信息序列相对应,将所述分组音频信息序列集与所述匹配音频信息序列集进行匹配处理,以生成再次匹配音频信息序列集作为标准分组音频信息序列集。3.根据权利要求1所述的方法,其中,所述根据所述分组音频信息序列集和所述标准分组音频信息序列集,生成音频检测文本,包括:获取所述用户端发送的标准音频选择信息;响应于所述标准音频选择信息为第一选择信息,将所述分组音频信息序列集包括的分组音频信息序列的数量与所述标准音频信息序列集包括的标准音频信息序列的数量的比值确定为弹奏完整值;响应于所述标准音频选择信息为第二选择信息,根据所述标准音频选择信息,对所述标准音频信息序列集进行截取处理,以生成截取标准音频信息序列集;将所述分组音频信息序列集对应的标准分组音频信息序列集中的标准分组音频信息序列的数量与所述截取标准音频信息序...

【专利技术属性】
技术研发人员:郑正徐豪骏李山亭王敬群
申请(专利权)人:上海妙克信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1