一种虚拟形象生成方法、装置、设备以及存储介质制造方法及图纸

技术编号:30432715 阅读:14 留言:0更新日期:2021-10-24 17:28
本公开提供了一种虚拟形象生成方法、装置、设备以及存储介质,涉及计算机视觉、增强现实、自然语言处理等人工智能技术领域。具体实现方案为:接收语音指令,语音指令包括用户对待生成的虚拟形象的描述;提取语音指令的语义信息;获得语义信息对应的虚拟形象。实现通过语音交互完成虚拟形象的生成,能够降低虚拟形象生成过程中的交互成本。象生成过程中的交互成本。象生成过程中的交互成本。

【技术实现步骤摘要】
一种虚拟形象生成方法、装置、设备以及存储介质


[0001]本公开涉及人工智能
,尤其涉及计算机视觉、增强现实、自然语言处理等


技术介绍

[0002]虚拟形象在社交、直播、游戏等人物建模场景具有广泛应用。在未来的增强现实系统中,虚拟形象将是人机交互的主要承载方式。

技术实现思路

[0003]本公开提供了一种虚拟形象生成方法、装置、设备以及存储介质。
[0004]第一方面,本公开提供了一种虚拟形象生成方法,包括:
[0005]接收语音指令,所述语音指令包括用户对待生成的虚拟形象的描述;
[0006]提取所述语音指令的语义信息;
[0007]获得所述语义信息对应的虚拟形象。
[0008]第二方面,本公开提供了一种虚拟形象生成装置,包括:
[0009]接收模块,用于接收语音指令,所述语音指令包括用户对待生成的虚拟形象的描述;
[0010]提取模块,用于提取所述语音指令的语义信息;
[0011]获得模块,用于获得所述语义信息对应的虚拟形象。
[0012]第三方面,本公开提供了一种电子设备,包括:
[0013]至少一个处理器;以及
[0014]与所述至少一个处理器通信连接的存储器;其中,
[0015]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
[0016]第四方面,本公开一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
[0017]第五方面,本公开提供了提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面所述的方法。
[0018]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0020]图1是本公开实施例提供的虚拟形象生成方法的流程图;
[0021]图2是本公开实施例中预先建立语义和形象的对应关系的流程图;
[0022]图3是本公开实施例中基于预设语义数据库获得与文字匹配的语义信息的流程
图;
[0023]图4是应用本公开实施例提供的虚拟形象生成方法的应用示意图;
[0024]图5是本公开实施例提供的虚拟形象生成装置的一种结构示意图;
[0025]图6是本公开实施例提供的虚拟形象生成装置的另一种结构示意图;
[0026]图7是本公开实施例提供的虚拟形象生成装置的又一种结构示意图;
[0027]图8是用来实现本公开实施例的虚拟形象生成方法的电子设备的框图。
具体实施方式
[0028]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0029]本公开实施例提供了一种虚拟形象生成方法,如图1所示,可以包括:
[0030]S101,接收语音指令,语音指令包括用户对待生成的虚拟形象的描述;
[0031]S102,提取语音指令的语义信息;
[0032]S103,获得语义信息对应的虚拟形象。
[0033]本公开实施例中,接收语音指令后,可以提取语音指令的语义信息,通过语义信息,最终获得语义信息对应的虚拟形象。用户只需要发送语音指令,即可以获得需要生成的虚拟形象,实现通过语音交互完成虚拟形象的生成,能够降低虚拟形象生成过程中的交互成本。
[0034]同时,能够解放用户双手,对于不方便用户手动操作的场景也可以获得虚拟形象,扩展了虚拟形象生成的应用场景。
[0035]本公开实施例提供的虚拟形象生成方法可以应用于电子设备,或者,也可以应用于包括多个服务器的系统。
[0036]参照图1,本公开实施例提供的虚拟形象生成方法可以包括:
[0037]S101,接收语音指令。
[0038]语音指令包括用户对待生成的虚拟形象的描述。
[0039]虚拟形象一般为人物形象,语音指令可以包括用户对人物的描述,可以包括对人物外形的描述,例如,大眼睛、高鼻梁、白皮肤、红嘴唇、美丽、性感、冷酷;也可以包括对人物动作的描述,例如,对人物的表情的描述;或者,也可以同时包括对人物外形和人物动作的描述。
[0040]用户可以通过客户端发送语音指令。
[0041]S102,提取语音指令的语义信息。
[0042]对语音指令进行语义理解,得到对应的语义信息。
[0043]可以先将语音指令转换为文字,然后对文字通过自然语言理解(Natural Language Processing,NLP),得到对应的语义信息。
[0044]可以将语音指令转换为文字;基于预设语义数据库,获得与文字匹配的语义信息。
[0045]具体地,可以预先建立预设语义数据库,预设语义数据库可以包括多个预设词汇,预设词汇可以包括描述虚拟形象的词汇。
[0046]可以先通过NLP对文字进行解析,然后将解析后的内容与预设语义数据库包括的多个描述词汇进行匹配。
[0047]其中,解析后的内容可以是按照词性、语句先后顺序等自然语言理解规则得到的多个词汇。
[0048]将解析后的内容与预设语义数据库包括的多个描述词汇进行匹配可以包括:依次将得到每个分词与预设语义数据库中保存的描述词汇进行比对,针对一个分词来讲,将该分词依次与多个描述词汇进行比对,若描述词汇中存在该分词,则理解为该分词为与预设语义数据库匹配的分词,如此,所有与预设语义数据库匹配的分词即可组成文字匹配的语义信息。
[0049]因为一般情况下通过名词和形容词对想要的虚拟形象进行描述,一种情况下,可以基于各个分词的词性选择出名词和形容词,将解析后的内容中名词和形容词与预设语义数据库中保存在的描述词汇进行比对,具体的比对参照上述针对每个分词的比对方式。这种情况下选择部分分词进行比对,能够提高获得语义信息的效率。
[0050]例如,语音指令转换得到的文字为“我要一个健壮双马尾长得像XX的女生”,“XX”可以是明星的名字等,通过解析得到的解析后的内容为“我|要|一个|健壮|双马尾|长得|像|XX|的|女生”,假设预设语义数据库中有“大眼睛”、“高鼻梁”和“双马尾”三个词汇,则解析后的内容中各个分词与预设语义数据库中各个描述词汇进行比对,预设语义数据库中存在解析后内容中各个分词中的一个“双马尾”,则“双马尾”即为获得的语义信息。假设预设语义数据库中有“健壮”、“高鼻梁”、“双马尾”和“XX”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚拟形象生成方法,包括:接收语音指令,所述语音指令包括用户对待生成的虚拟形象的描述;提取所述语音指令的语义信息;获得所述语义信息对应的虚拟形象。2.根据权利要求1所述的方法,其中,所述提取所述语音指令的语义信息,包括:将所述语音指令转换为文字;基于预设语义数据库,获得与所述文字匹配的语义信息。3.根据权利要求2所述的方法,所述方法还包括:若基于预设语义数据库,未获得与所述文字匹配的语义信息,则返回提示信息。4.根据权利要求2所述的方法,其中,所述获得所述语义信息对应的虚拟形象,包括:基于形象数据库获得所述语义信息对应的虚拟形象,所述形象数据库包括多个预设语义词汇分别与一虚拟形象的对应关系。5.根据权利要求1所述的方法,所述方法还包括:分别获取多个预设语义词汇,并针对各个预设语义词汇创建所述预设语义词汇对应的虚拟形象;所述预设语义词汇表示对形象的描述;建立各个所述预设语义词汇与所述预设语义词汇对应的所述虚拟形象的对应关系。6.根据权利要求4所述的方法,其中,所述预设语义数据库包括多个描述词汇,所述描述词汇包括多个关键词汇和各个关键词汇分别对应的同义词;所述形象数据库包括各个关键词汇分别对应的虚拟形象;所述基于预设语义数据库,获得与所述文字匹配的语义信息,包括:通过自然语义理解NLP对所述文字进行解析,得到多个分词;将各个分词分别与预设语义数据库包括的多个描述词汇进行比对;针对各个分词,若所述分词为所述预设语义数据库中关键词汇对应的同义词,则确定所述同义词对应的关键词汇,并将所述关键词汇作为分词对应的语义信息;所述基于形象数据库获得所述语义信息对应的虚拟形象,包括:利用所述关键词汇,从所述形象数据库中获得所述关键词汇对应的虚拟形象。7.根据权利要求4所述的方法,其中,所述形象数据库中保存语义信息对应的调整数据,所述调整数据用于对默认形象进行调整以得到所述语义信息对应的虚拟形象;所述基于形象数据库获得所述语义信息对应的虚拟形象,可以包括:获取所述语义信息对应的调整数据,所述调整数据为基于默认形象进行调整的数据;利用所述调整数据对所述默认形象中的骨骼节点进行调整,得到所述语义信息对应的虚拟形象。8.根据权利要求4所述的方法,其中,所述语义信息包括多个组件分别对应的子语义信息;所述基于形象数据库获得所述语义信息对应的虚拟形象,包括:针对各个组件,利用所述组件对应的子语义信息,从所述形象数据库中获得所述子语义信息对应的子虚拟形象;基于各个子虚拟对象得到所述虚拟形象。9.一种虚拟形象生成装置,包括:
接收模块,用于接收语音指令,所述语音指令包括用户对待生成的虚拟形象的描述;提取模块,用于提取所述语音指令的语义信息;获得模块,用于获得所述语义信息对应的虚拟形象。10.根据权利要求9所述的装置,其中,所述提取模块,具体用于将...

【专利技术属性】
技术研发人员:彭昊天
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1