当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理设备和方法以及计算机可读存储介质技术

技术编号:27064111 阅读:41 留言:0更新日期:2021-01-15 14:45
本公开提供了一种信息处理设备和方法以及计算机可读存储介质,该信息处理设备包括:处理电路,被配置为:从声音中选择出与发出声音期间的场景特征相关的声音元素;建立对应关系,该对应关系包括场景特征与声音元素之间、以及各个声音元素之间的第一对应关系,并且将场景特征和声音元素以及对应关系相关联地存储在对应关系库中;以及基于再现场景特征和对应关系库,生成待再现的声音。

【技术实现步骤摘要】
信息处理设备和方法以及计算机可读存储介质
本申请涉及信息处理领域,具体地涉及能够生成自定义的个性化声音的信息处理设备和方法以及相应的计算机可读存储介质。
技术介绍
在现有的音频制作技术中,只能利用系统固有的语音内容来制作音频文件,容易使用户感觉枯燥乏味。例如,在游戏平台场景下,只能利用游戏中预录制的解说音频文件实现来游戏解说,容易使玩家感觉单调乏味。
技术实现思路
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图确定本公开的关键或重要部分,也不是意图限定本公开的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。根据本申请的一个方面,提供了一种信息处理设备,包括:处理电路,被配置为:从声音中选择出与发出声音期间的场景特征相关的声音元素;建立对应关系,该对应关系包括场景特征与声音元素之间以及各个声音元素之间的第一对应关系,并且将场景特征和声音元素以及对应关系相关联地存储在对应关系库中;以及基于再现场景特征和对应关系库,生成待再现的声音。根据本申请的另一个方面,提供了一种信息处理方法,包括:从声音中选择出与发出声音期间的场景特征相关的声音元素;建立对应关系,该对应关系包括场景特征与声音元素之间以及各个声音元素之间的第一对应关系,并且将场景特征和声音元素以及对应关系相关联地存储在对应关系库中;以及基于再现场景特征和对应关系库,生成待再现的声音。根据本申请的另一个方面,提供了一种信息处理装置,包括:操纵设备,用于用户操纵信息处理装置;处理器;以及存储器,所述存储器包括由处理器可读的指令,并且所述指令在由处理器读取时使信息处理装置执行以下处理:从声音中选择出与发出声音期间的场景特征相关的声音元素;建立对应关系,该对应关系包括场景特征与声音元素之间以及各个声音元素之间的第一对应关系,并且将场景特征和声音元素以及对应关系相关联地存储在对应关系库中;以及基于再现场景特征和对应关系库,生成待再现的声音。根据本公开的其它方面,还提供了用于实现上述信息处理方法的计算机程序代码和计算机程序产品以及其上记录有该用于实现上述信息处理方法的计算机程序代码的计算机可读存储介质。通过以下结合附图对本公开的优选实施例的详细说明,本公开的这些以及其他优点将更加明显。附图说明为了进一步阐述本公开的以上和其它优点和特征,下面结合附图对本公开的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本公开的典型示例,而不应看作是对本公开的范围的限定。在附图中:图1示出了根据本公开实施例的信息处理设备的功能模块框图;图2是示出根据本公开实施例的信息处理方法的流程示例的流程图;图3是其中可以实现根据本公开实施例的方法和/或设备的通用个人计算机的示例性结构的框图;以及图4意性地示出了根据本公开实施例的信息处理装置的结构框图。具体实施方式在下文中将结合附图对本公开的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开的方案密切相关的设备结构和/或处理步骤,而省略了与本公开关系不大的其他细节。图1示出了根据本公开实施例的信息处理设备100的功能模块框图,如图1所示,信息处理设备100包括:声音元素选择单元101、对应关系建立单元103以及生成单元105。其中,声音元素选择单元101、对应关系建立单元103以及生成单元105可以由一个或多个处理电路实现,该处理电路例如可以实现为芯片、处理器。并且,应该理解,图1中所示的各个功能单元仅是根据其所实现的具体功能而划分的逻辑模块,而不是用于限制具体的实现方式。为了方便描述,下文中以游戏娱乐平台的应用场景为例来描述根据本公开实施例的信息处理设备100。然而,根据本公开实施例的信息处理设备100不仅可以应用于游戏娱乐平台,还可以应用于电视直播体育比赛、纪录片或其他带有旁白的音视频产品等中。声音元素选择单元101可以被配置为从声音中选择出与发出声音期间的场景特征相关的声音元素。作为示例,声音包括讲话者的语音(例如,游戏玩家的语音)。作为示例,声音还可以包括鼓掌、欢呼、助威、音乐等中的至少之一。作为示例,声音元素选择单元101可以对游戏系统启动中及游戏过程中实时采集到的外部的声音进行声音处理,从而识别出游戏玩家的语音,例如,识别出游戏玩家在游戏过程中的评论。声音元素选择单元101还可以通过声音处理识别诸如鼓掌、欢呼、助威、音乐等声音信息。作为示例,场景特征包括游戏内容、游戏人物名称(例如球员名称)、游戏中的动作、游戏或比赛性质、实时游戏场景、游戏场景描述中至少之一。可见,场景特征可以包括与声音所处的场景相关的各种特性或属性。作为示例,声音元素包括用于描述场景特征的信息和/或用于表达情感的信息,所述用于表达情感的信息包括声音的语调和/或声音的节奏。作为示例,声音元素选择单元101根据预定规则对所述声音进行比对分析,以选择出声音中的、与发出声音期间的场景特征相关的声音元素。其中,所述预定规则至少用于规定声音元素和场景特征之间的对应性、以及各个声音元素之间的对应性。例如,可以参考游戏的原有语音解说信息的至少一部分设计预定规则。例如,可以通过对声音进行剪裁并转换成文字,然后通过语义分析来设计预定规则。例如,如果判断出名字“梅西”是一个新球员的名字,则可以把声音元素“梅西”记录下来,并标记其对应的场景特征为“球员名称”,同时也可根据上下文记录更多声音元素和场景特征,比如对于语音“梅西的射门太牛了”还会记录:声音元素“射门”对应的场景特征为“游戏动作”,由于判断梅西通常多与射门相关,因此,还记录声音元素“梅西”与“射门”的对应性(在该示例中,“梅西”为主体,“射门”为动作,因此,“梅西”与“射门”的对应性为主体+动作)。将所记录的上述信息作为预定规则。作为示例,还可以结合语法模型(例如,“主语+谓语”、“主语+谓语+宾语”、“主语+定语”、“主语+状语”等等)规定声音元素之间的对应性。作为示例,声音元素选择单元101将声音中的与发出声音期间的场景特征不相关的声音元素过滤掉。作为示例,声音元素选择单元101可以被部署在游戏设备本地,也可以利用云平台资源实现。由以上描述可本文档来自技高网...

【技术保护点】
1.一种信息处理设备,包括:/n处理电路,被配置为:/n从声音中选择出与发出所述声音期间的场景特征相关的声音元素;/n建立对应关系,所述对应关系包括所述场景特征与所述声音元素之间以及各个声音元素之间的第一对应关系,并且将所述场景特征和所述声音元素以及所述对应关系相关联地存储在对应关系库中;以及/n基于再现场景特征和所述对应关系库,生成待再现的声音。/n

【技术特征摘要】
1.一种信息处理设备,包括:
处理电路,被配置为:
从声音中选择出与发出所述声音期间的场景特征相关的声音元素;
建立对应关系,所述对应关系包括所述场景特征与所述声音元素之间以及各个声音元素之间的第一对应关系,并且将所述场景特征和所述声音元素以及所述对应关系相关联地存储在对应关系库中;以及
基于再现场景特征和所述对应关系库,生成待再现的声音。


2.根据权利要求1所述的信息处理设备,其中,
所述对应关系还包括所述声音与所述场景特征和所述声音元素之间的第二对应关系;以及
所述处理电路被配置为:
将所述声音与所述场景特征和所述声音元素以及所述第二对应关系相关联地存储在所述对应关系库中,以及
根据所述对应关系从所述对应关系库中查找与所述再现场景特征相关的声音或声音元素,并且利用所查找到的声音或声音元素生成所述待再现的声音。


3.根据权利要求2所述的信息处理设备,其中,所述处理电路被配置为:
在所述再现场景特征与所述对应关系库中的场景特征完全匹配的情况下,查找与所述再现场景特征完全匹配的场景特征相关的声音,并且利用所查找到的声音生成所述待再现的声音。


4.根据权利要求3所述的信息处理设备,其中,
所述声音为讲话者的语音,以及
所述处理电路被配置为:
将所查找到的声音以文本或音频的形式加入到原始讲话者的声音信息库中,并且基于所述声音信息库生成所述待再现的声音,以供按照所述原始讲话者的发音声线来渲染所述待再现的声音;或者
利用文本或音频的形式的所查找到的声音生成所述待再现的声音,以供按照说出所查找到的声音的讲话者的发音声线来渲染所述待再现的声音。


5.根据权利要求2所述的信息处理设备,其中,所述处理电路被配置为:
在所述再现场景特征与所述对应关系库中的场景特征均不完全匹配的情况下,查找与所述再现场景特征的各部分分别匹配的场景特征相关的声音元素,并通过组合所查找到的声音元素来生成所述待再现的声音。


6.根据权利要求5所述的信息处理设备,其中,
所述声音为讲话者的语音,以及
所述处理电路被配置为:
将所查找到的声音元素以文本或音频的形式加入到原始讲话者的...

【专利技术属性】
技术研发人员:刘毅
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1