生成声音剪辑的视觉表示制造技术

技术编号:35589821 阅读:21 留言:0更新日期:2022-11-16 15:06
本公开提供“生成声音剪辑的视觉表示”。本公开总体上涉及用于生成唯一地识别各种声音的视觉符号的系统和方法。用于生成视觉符号的示例性方法可以涉及识别声音并将量化值分配给所述声音的各种属性。在示例性实现方式中,使用数值模板将量化值分配给每个属性。一组此类量化值构成可以被指定为所述声音的视觉符号的图形表示。在示例性应用中,对应于所述视觉符号的所述量化值可以与对应于其他声音的其他视觉符号的量化值一起存储在存储器中。然后,所述存储器可以用于各种目的,诸如例如执行对与期望声音类似的声音的搜索。行对与期望声音类似的声音的搜索。行对与期望声音类似的声音的搜索。

【技术实现步骤摘要】
生成声音剪辑的视觉表示


[0001]本公开涉及用于生成唯一地识别各种声音的视觉符号的系统和方法。

技术介绍

[0002]一个人通常难以向以前没有听过某种声音的另一个人准确地描述该声音。通常,另一个人可能会试图基于他/她过去暴露于其他声音来解释对声音的描述。因此,例如,如果声音被描述为“轰隆隆”,则第一人可能听到这个词并基于他/她过去在雷暴期间听到雷击的经验来解释所述描述,第二人可能会基于他/她过去在演唱会场所处的经验来解释同一个词,并且第三人可能会基于他/她过去在施工现场听到炸药爆炸的经验来解释同一个词。
[0003]因此,期望提供一种可以更一致且可靠的方式表征声音的方式。还期望以可以由计算机操作以执行各种类型的动作的格式提供这种表征。

技术实现思路

[0004]依据总体概述,本公开涉及用于生成唯一地识别各种声音的视觉符号的系统和方法。用于生成视觉符号的示例性方法可以涉及识别声音并将量化值分配给所述声音的各种属性。在示例性实现方式中,使用数值模板将量化值分配给每个属性。一组此类量化值构成可以被指定为所述声音的视觉符号的图形表示。在示例性应用中,对应于所述视觉符号的所述量化值可以与对应于其他声音的其他视觉符号的量化值一起存储在存储器中。然后,所述存储器可以用于各种目的,诸如例如执行对与期望声音类似的声音的搜索。
附图说明
[0005]下面参考附图给出具体实施方式。使用相同的附图标记可以指示类似或相同的项。各种实施例可以利用除了附图中示出的那些之外的元件和/或部件,并且一些元件和/或部件可能不存在于各种实施例中。附图中的元件和/或部件不一定按比例绘制。在整个本公开中,根据上下文,单数和复数术语可以可互换地使用。
[0006]图1示出了根据本公开的其中对象产生可以转换成视觉符号的声音的示例性场景。
[0007]图2示出了根据本公开的实施例的可以用于表征声音的第一示例性模板。
[0008]图3示出了根据本公开的实施例的可以用于表征声音的第二示例性模板。
[0009]图4示出了根据本公开的实施例的可以用于产生平均视觉符号的第三示例性模板。
[0010]图5示出了根据本公开的实施例的用于生成声音的视觉符号的方法的流程图。
[0011]图6示出了根据本公开的实施例的用于在存储器中搜索声音的视觉符号的方法的流程图。
具体实施方式
[0012]下文将参考附图更全面地描述本公开,其中示出了本公开的示例性实施例。然而,本公开可以以许多不同形式来体现,并且不应被解释为受限于本文阐述的示例性实施例。相关领域技术人员将理解,在不脱离本公开的精神和范围的情况下可对各种实施例作出形式和细节上的各种变化。因此,本公开的广度和范围不应受到上述示例性实施例中的任何一个限制,而是应仅根据所附权利要求和其等效物限定。以下描述是为了说明目的而呈现,并且不意图是详尽性的或受限于所公开的精确形式。应当理解,替代实现方式可以任何期望的组合来使用,以形成本公开的另外的混合实现方式。例如,相对于特定装置或部件描述的功能中的任一者可以由另一个装置或部件执行。此外,尽管已描述了特定的装置特性,但本公开的实施例可涉及许多其他装置特性。另外,尽管已用特定于结构特征和/或方法动作的语言描述了实施例,但是应理解,本公开不一定受限于所描述的特定特征或动作。而是,将特定特征和动作公开为实现实施例的说明性形式。
[0013]本文使用的某些词语和短语应被解释为指代本领域普通技术人员通常以各种形式和等效形式理解的各种对象和动作。例如,如本文所使用的短语“心理刺激”可适用于声音中存在的各种属性中的任何属性。如本文所使用的词语“声音”是指各种类型的声音中的任何声音,诸如例如声音剪辑、声音片断、声音段、由第一对象与第二对象接触发出的声音、由移动对象发出的声音、通过扬声器产生的声音、来自歌曲的片断、音乐片断和/或声音信号的数字表示(例如,如由模数转换器装置产生)。如本文所使用的短语“在示例性实现方式中”必须被理解为短语“在根据本公开的示例性实现方式中”的缩写版本。应理解,如本文所使用的词语“示例”意图在本质上是非排他性的和非限制性的。
[0014]图1示出了根据本公开的其中对象产生可以转换成视觉符号的声音的示例性场景。在该示例性场景中,产生声音的对象是车辆115。在其他场景中,根据本公开,各种其他对象可以产生可以由一个或多个个体解释以生成各种视觉符号的各种类型的声音。
[0015]与车辆115相关联的声音可以是各种类型的声音中的任何声音,诸如例如当车门关闭时产生的声音、行李厢盖关闭时产生的声音、发动机舱盖关闭时产生的声音、车门打开时的响铃声音、发动机加速的声音或通过信息娱乐系统产生的语音通知。此类声音中的每一个可以是声音剪辑、声音突发脉冲、声音片断或声音段。在示例性应用中,此类声音的持续时间小于三分钟。然而,在其他应用中,本文公开的过程同样可适用于在更长的持续时间内延续的声音,包括例如歌曲或音乐编曲。
[0016]在图1所示的示例性场景中,当个体110关闭车辆115的车门时产生声音。在一种情况下,车辆115可以是豪华轿车,其包括结合有用于抑制声音的各种类型的声学材料的车门。因此,由关闭车门产生的声音具有第一组声音属性。在另一种情况下,车辆115可以是包括具有较少声学材料的重型金属车门的多用途卡车。在这种情况下,由关闭车门产生的声音具有与第一组属性不同的第二组声音属性。
[0017]个体110可以是例如识别属性差异并且本能地将第一组属性与豪华车辆相关联并且将第二组属性与多用途卡车相关联的车辆爱好者。个体110可能试图通过一些描述性词语(诸如例如豪华车辆的车门的“低沉的撞击声”或“轻柔的关闭”,和卡车的车门的“金属铛铛声”或“重击声”)向某个其他人(未示出)描述这些差异。另一个人可能试图基于他/她过去暴露于各种类型的声音(诸如例如建筑物的门被关闭或银行金库的门被关闭)来解释所
述描述。这种解释在一些情况下可能是不充分的,而在一些其他情况下可能是不准确的。此外,使用此类定性描述来指示计算机执行某些操作(诸如例如搜索与豪华轿车的车门产生的声音类似的声音)或执行由豪华轿车的车门产生的声音与由建筑物的门产生的声音之间的比较分析可能是具有挑战性的。因此,期望提供一种根据本公开通过量化声音的各种声音属性来表征声音的方式。如本文所使用的短语“心理刺激”涵盖这些各种声音属性。
[0018]图2示出了根据本公开的实施例的可以用于通过量化各种声音属性来表征声音的第一示例性模板200。模板200是可以包括两个或更多个标度的数值模板,诸如例如标度205、标度210、标度215、标度220、标度225和标度230。每个标度在数值范围内扩展。在图2所示的示例性实现方式中,每个标度从0扩展到10。在另一个示例性实现方式中,每个标度可以从1扩展到100。在又一个示例性实现方式中,每个标度可以包括正值以及负值,诸如例如从

10到+10。
[0019]模板200中包括的标度的数量可以对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,其包括:识别第一声音;将第一量化值分配给所述第一声音中存在的第一心理刺激;将第二量化值分配给所述第一声音中的第二心理刺激;产生包括所述第一量化值和所述第二量化值的第一图形表示;以及将所述第一图形表示指定为所述第一声音的第一视觉符号。2.如权利要求1所述的方法,其中所述第一心理刺激被感知为自然声音组分、人为声音组分、和谐声音组分、不协调声音组分、充满热情的声音组分或柔和声音组分中的至少一者。3.如权利要求1所述的方法,其中所述第一量化值是从所分配的数值范围中选择的第一数值,所述第二量化值是从所述所分配的数值范围中选择的第二数值,并且所述第一图形表示包括将所述第一数值与所述第二数值连接的第一线段或第一曲线段中的一者。4.如权利要求3所述的方法,其还包括:显示包括第一标度和第二标度的数值模板;在所述第一标度上分配所述第一数值;以及在所述第二标度上分配所述第二数值。5.如权利要求3所述的方法,其还包括:识别第二声音;将第三量化值分配给所述第二声音中的所述第一心理刺激;将第四量化值分配给所述第二声音中的所述第二心理刺激;产生包括所述第三量化值和所述第四量化值的第二图形表示;以及将所述第二图形表示指定为所述第二声音的第二视觉符号。6.如权利要求5所述的方法,其中所述第三量化值是所述所分配的数值范围中的第三数值,所述第四量化值是所述所分配的数值范围中的第四数值,并且所述第二图形表示包括将所述第三数值与所述第四数值连接的第二线段或第二曲线段中的一者,并且其中所述方法还包括:将所述第一视觉符号和所述第二视觉符号存储在存储器中;以及基于包括所述第一视觉符号或所述第二视觉符号的查询来检索所述第一图形表示或所述第二图形表示中的一者。7.如权利要求1所述的方法,其中将所述第一量化值分配给所述第一声音中的所述第一心理刺激包括量化所述第一声音的第一感知声音质量,并且将所述第二量化值分配给所述第一声音中的所述第二心理刺激包括量化所述第一声音的第二感知声音质量。8.如权利要求1所述的方法,其中将所述第一量化值分配给所述第一心理刺激是基于确定由听到所述第一声音的一组个体提供的第一组量化值的平均值,并且其中将所述第二量化值分配给所述第二心理刺激是基于确定由听到所述第一声音的所述一组个体提供的第二组量化值的平均值。9.一种方法,其包括:将第一量化值分配给与车辆相关联的第一声音中的第一心理刺激;将第二...

【专利技术属性】
技术研发人员:J
申请(专利权)人:福特全球技术公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1