本公开涉及一种音频降噪方法、装置、计算机可读介质和电子设备。该方法包括:对待降噪媒体文件进行内容解析,获得至少一个场景标签以及所述场景标签对应的时段信息;至少根据所述时段信息,将所述待降噪媒体文件划分出待降噪的第一媒体片段;根据所述第一媒体片段对应的所述场景标签,确定所述第一媒体片段对应的目标降噪信息;根据所述目标降噪信息对所述第一媒体片段进行音频降噪处理。如此,可以对待降噪媒体文件进行更细粒度的音频降噪处理,使其与具体媒体片段内容对应的场景相适应。这样,可以满足用户在不同场景下的感官需求,提升了用户体验。升了用户体验。升了用户体验。
【技术实现步骤摘要】
音频降噪方法、装置、计算机可读介质和电子设备
[0001]本公开涉及媒体
,具体地,涉及一种音频降噪方法、装置、计算机可读介质和电子设备。
技术介绍
[0002]音频降噪处理是媒体文件处理中的一个重要环节。例如,在视频拍摄的过程中,专业的视频拍摄设备往往通过外接麦克风和防风噪设备来降低收音的噪声,以保证说话者声音清晰。然而随着科学技术的发展,人们往往选择手机等终端设备进行视频拍摄,这种情况下,通过降噪算法进行音频降噪处理必不可少。目前,通常采用一种通用的降噪算法进行音频降噪处理,降噪效果较差,用户体验不佳。
技术实现思路
[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面,本公开提供一种音频降噪方法,所述方法包括:
[0005]对待降噪媒体文件进行内容解析,获得至少一个场景标签以及所述场景标签对应的时段信息;其中,所述待降噪媒体文件中在所述时段信息指示的媒体片段内的内容与所述场景标签指示的场景相匹配;
[0006]至少根据所述时段信息,将所述待降噪媒体文件划分出待降噪的第一媒体片段;
[0007]根据所述第一媒体片段对应的所述场景标签,确定所述第一媒体片段对应的目标降噪信息;
[0008]根据所述目标降噪信息对所述第一媒体片段进行音频降噪处理。
[0009]第二方面,本公开提供一种音频降噪装置,所述装置包括:
[0010]解析模块,用于对待降噪媒体文件进行内容解析,获得至少一个场景标签以及所述场景标签对应的时段信息;其中,所述待降噪媒体文件中在所述时段信息指示的媒体片段内的内容与所述场景标签指示的场景相匹配;
[0011]划分模块,用于至少根据时段信息,将所述待降噪媒体文件划分待降噪的第一媒体片段;
[0012]确定模块,用于根据所述第一媒体片段对应的所述场景标签,确定所述第一媒体片段对应的目标降噪信息;
[0013]处理模块,用于根据所述目标降噪信息对所述第一媒体片段进行音频降噪处理。
[0014]第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面所述方法的步骤。
[0015]第四方面,本公开提供一种电子设备,包括:
[0016]存储装置,其上存储有计算机程序;
[0017]处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面所述方法的步骤。
[0018]采用上述技术方案,通过确定待降噪媒体文件对应的场景标签及场景标签对应的时段信息,并基于该时段信息将待降噪媒体文件划分出待降噪的第一媒体片段,这样,在对待降噪媒体文件进行音频降噪处理时,可以根据第一媒体片段对应的场景标签自动确定合适的目标降噪信息,并根据该目标降噪信息对第一媒体片段进行音频降噪处理。如此,可以对待降噪媒体文件进行更细粒度的音频降噪处理,使其与具体媒体片段内容对应的场景相适应。随着媒体内容对应的场景的变化,其目标降噪信息也随之变化,这样,可以满足用户在不同场景下的感官需求,提升了用户体验。
附图说明
[0019]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
[0020]图1是根据一示例性实施例示出的一种音频降噪方法的流程图。
[0021]图2是根据一示例性实施例示出的一种音频降噪装置的框图。
[0022]图3是根据一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
[0023]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0024]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0025]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0026]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0027]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0028]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0029]如
技术介绍
所述,随着科学技术的发展,人们往往选择手机等终端设备进行视频拍摄,这种情况下,通过算法进行音频降噪处理必不可少。相关技术中,通常采用一种通用的降噪算法进行音频降噪处理。然而,在媒体文件存在不同场景内容的情况下,采用一种通
用的降噪算法进行音频降噪处理,降噪效果往往不好,用户体验较差。
[0030]有鉴于此,本公开提供一种音频降噪方法、装置、计算机可读介质和电子设备,可以对待降噪媒体文件进行更细粒度的音频降噪处理,使其与具体媒体片段内容对应的场景相适应。随着媒体内容对应的场景的变化,其目标降噪信息也随之变化,这样,可以满足用户在不同场景下的感官需求,提升了用户体验。
[0031]图1是根据一示例性实施例示出的一种音频降噪方法的流程图,该方法可以应用于终端,如智能手机、平板电脑、个人计算机(PC)、笔记本电脑等设备,也可以应用于服务器。如图1所示,该方法可以包括以下步骤。
[0032]在S101中,对待降噪媒体文件进行内容解析,获得至少一个场景标签以及场景标签对应的时段信息。
[0033]该待降噪媒体文件即为需要进行音频降噪处理的媒体文件,可以是预先存储的媒体文件,例如视频文件或者音频文件,也可以是实时媒体文件,例如利用摄像头实时拍摄的视频文件。本公开对待降噪媒体文件的种类、格式、获取方式等不作具体限定。
[0034]该场景标签是对待降噪媒体文件进行内容解析后所得的场景识别结果,因此,待降噪媒体文件的场景标签能够反映待降噪媒体文件的场景,且场景标签对应的时段信息能本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种音频降噪方法,其特征在于,所述方法包括:对待降噪媒体文件进行内容解析,获得至少一个场景标签以及所述场景标签对应的时段信息;其中,所述待降噪媒体文件中在所述时段信息指示的媒体片段内的内容与所述场景标签指示的场景相匹配;至少根据所述时段信息,将所述待降噪媒体文件划分出待降噪的第一媒体片段;根据所述第一媒体片段对应的所述场景标签,确定所述第一媒体片段对应的目标降噪信息;根据所述目标降噪信息对所述第一媒体片段进行音频降噪处理。2.根据权利要求1所述的方法,其特征在于,所述对待降噪媒体文件进行内容解析,获得至少一个场景标签以及所述场景标签对应的时段信息,包括:对所述待降噪媒体文件的图像和/或音频进行内容解析,获得至少一个场景标签以及所述场景标签对应的时段信息。3.根据权利要求1所述的方法,其特征在于,所述至少根据所述时段信息,将待降噪媒体文件划分出待降噪的第一媒体片段,包括:根据所述时段信息,从所述待降噪媒体文件划分出初始媒体片段,所述初始媒体片段为匹配到场景标签的媒体片段;根据所述初始媒体片段对应的所述场景标签的置信度,从所述初始媒体片段中确定出待降噪的所述第一媒体片段。4.根据权利要求3所述的方法,其特征在于,所述根据所述初始媒体片段对应的所述场景标签的置信度,从所述初始媒体片段中确定出待降噪的所述第一媒体片段,包括:在所述初始媒体片段对应的场景标签为一个的情况下,若所述场景标签的置信度不小于预设的置信度阈值,则将所述初始媒体片段确定为所述第一媒体片段。5.根据权利要求3所述的方法,其特征在于,所述根据所述初始媒体片段对应的所述场景标签的置信度,从所述初始媒体片段中确定出待降噪的所述第一媒体片段,包括:在所述初始媒体片段对应的场景标签为多个的情况下,若除最大置信度对应的场景标签之外的其他场景标签的置信度与所述最大置信度之差的绝对值均大于预设的置信度差值阈值,则将所述初始媒体片段确定为所述第一媒体片段。6.根据权利要求3所述的方法,其特征在于,所述根据所述初始媒体片段对应的所述场景标签的置信度,从所述初始媒体片段中确定出待降噪的所述第一媒体片段,包括:在所述初始媒体片段对应的场景标签为多个的情况下,若多个所述场景标签的置信度中的最大置信度不小于预设的置信度阈值,则将所述初始媒体片段确定为所述第一媒体片段。7.根据权利要求5或6所述的方法,其特征在于,在所述初始媒体片段对应的场景标签为多个的情况下,所述根据所述第一媒体片段对应的所述场景标签,确定所述第一媒体片段对应的目标降噪信...
【专利技术属性】
技术研发人员:史俊杰,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。