表情包生成方法和装置制造方法及图纸

技术编号：40353428 阅读：7 留言：0更新日期：2024-02-09 14:38

本申请公开了一种表情包生成方法和装置，该方法包括：获取用户设备的输入信息，其中该输入信息包括文字信息或语音信息；基于表情包生成模型根据该输入信息生成至少一个表情包，其中从获取该输入信息到生成该至少一个表情包所需时长不超过30秒；以及在用户设备的界面中显示该至少一个表情包，以供该用户设备从该至少一个表情包中确定目标表情包；其中，该表情包生成模型包括神经网络和用于从该输入信息中提取情感特征的第一分类器，该神经网络用于基于该输入信息和该情感特征生成该至少一个表情包。因此，能够有效提高表情包的生成效率和灵活性，从而提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及信息处理，更具体地，涉及一种表情包生成方法和装置。

技术介绍

1、随着人工智能(ai)技术的迅速发展，作为人机交互的一种方式，ai技术广泛应用于通信、娱乐等领域。

2、在现有的表情包生成方式中，一方面，因为涉及图像处理技术，耗时长，导致表情包制作效率较低。另一方面，表情包通常是由专业人士制作后再提供给用户使用，用户设备中的表情包通常是固定的，用户可能无法选到自己想要的表情包，降低了用户体验。

技术实现思路

1、本申请实施例提供了一种基于表情包生成方法和装置，能够有效地提高表情包的生成效率，并且根据用户需求灵活生成表情包，从而提高用户体验。

2、第一方面，提供了一种表情包生成方法，该方法包括：获取用户设备的输入信息，其中该输入信息包括文字信息或语音信息；基于表情包生成模型根据该输入信息生成至少一个表情包，其中从获取该输入信息到生成该至少一个表情包所需时长小于时间阈值t，t≤30秒；以及在用户设备的界面中显示该至少一个表情包，以供该用户设备从该至少一个表情包中确定目标表情包；其中，该表情包生成模型包括第一分类器和神经网络，该第一分类器用于从该输入信息(如关键词或语音信息)中提取情感特征，和该神经网络用于基于该输入信息和该情感特征生成该至少一个表情包。

3、结合第一方面，在第一方面的一种可能的实现方式中，该表情包生成模型还可以包括第二分类器，该第二分类器可以用于从该语音信息中提取用户信息，如基于语音信息的音色、音调、音强和音长等语音特征提取用户信息。

4、可选地，该用户信息可以包括年龄段和/或性格特征，相应地，该至少一个表情包可以包括与该用户信息匹配的表情包。

5、例如，该用户年龄段可以包括多个阶段，如两个阶段，分别是青少年和中老年；或者如四个阶段，分别是童年、青年、中年和老年；或者如三个阶段，分别是青少年、中年和老年，等等。相应地，该青少年匹配的表情包可以包括卡通类型表情包，或者该中老年匹配的表情包可以包括自然风光表情包。或者，与该用户信息匹配的表情包可以包括真人类型表情包，真人类型表情包中的真人年龄阶段与用户信息的年龄段匹配。

6、又例如，该性格特征可以包括外向型(如幽默搞笑类型或热情开朗类型等)，且与该外向型匹配的表情包包括动态表情包，或者性格特征包括内向型(如谨慎内敛类型或沉稳类型等)，且与该内向型匹配的表情包包括静态表情包。

7、结合第一方面和上述任一种可能的实现方式中，针对同一情感特征生成的该至少一个表情包可以为多个表情包，各个表情包具有不同的表情包类型，以及该表情包类型包括卡通类型、真人类型、宠物类型、自然风光类型和/或影视截图类型。

8、结合第一方面和上述任一种可能的实现方式中，该神经网络可以为gpt神经网络，包括依次连接的嵌入层、n个解码模块和输出层。其中该n个解码模块中每个解码模块包括依次连接的掩码注意力层、第一归一化层、前向反馈层和第二归一化层，该n为大于1的整数；以及该第一分类器输出的该情感特征作为该gpt神经网络的n个解码模块中第i个解码模块的输入的一部分，其中，i为正整数且i≤n。

9、可选地，该第二分类器输出的用户信息作为该gpt神经网络的n个解码模块中第j个解码模块的输入的一部分，其中，j为正整数且j≤n；或者该第二分类器包括第一子分类器和第二子分类器，该第一子分类器输出的年龄段特征作为该gpt神经网络的n个解码模块中第j个解码模块的输入的一部分，该第二子分类器输出的性格特征作为该gpt神经网络的n个解码模块中第k个解码模块的输入的一部分，其中，j为正整数且j≤n；k为正整数且k≤n。

10、可选地，该n≥2，i≤n/2，i≤j和i≤k；或者n≥2，i≤n/2，i≤j。

11、可选地，该n≥2，i＝1，j≤n/2和k≤n/2；或者该n≥2，i＝1和j≤n/2。

12、结合第一方面和上述任一种可能的实现方式中，该表情包生成方法可以应用于辅助聊天，如在用户设备的聊天界面中显示该至少一个表情包。

13、结合第一方面和上述任一种可能的实现方式中，在一种可能的实现方式中，情感特征可以包括“快乐”、“愤怒”、“悲哀”和“恐惧”、“厌恶”、“幸福”、“悲伤”、“疑问”、“惊讶”、“生气”、“痛苦”、“羡慕”、“赞美”、“认同”、“祝福”和/或“感恩”等。相应地，与情感特征匹配的表情包可以用于表达用户的情感特征(或心情特征)，可选地，表情包可以包括输入信息。

14、第二方面，提供了一种表情包生成装置，该装置包括处理单元和存储单元；该处理单元，用于获取用户设备的输入信息，其中该输入信息包括文字信息或语音信息；基于该存储单元存储的表情包生成模型根据该输入信息生成至少一个表情包，其中从获取该输入信息到生成该至少一个表情包所需时长小于时间阈值t，t≤30秒；以及在用户设备的界面中显示该至少一个表情包，以供该用户设备从该至少一个表情包中确定目标表情包；其中，该存储单元存储的该表情包生成模型包括第一分类器和神经网络，该第一分类器用于从该输入信息中提取情感特征，和该神经网络用于基于该输入信息和该情感特征生成该至少一个表情包。

15、可选地，该存储单元存储的该表情包生成模型还可以包括第二分类器，该第二分类器可以用于从该语音信息中提取用户信息，如基于语音信息的音色、音调、音强和音长等语音特征提取用户信息。

16、可选地，该用户信息可以包括年龄段和/或性格特征，相应地，该至少一个表情包可以包括与该用户信息匹配的表情包。

17、结合第二方面和上述任一种可能的实现方式中，针对同一情感特征生成的该至少一个表情包可以为多个表情包，各个表情包具有不同的表情包类型，以及该表情包类型包括卡通类型、真人类型、宠物类型、自然风光类型和/或影视截图类型。

18、结合第二方面和上述任一种可能的实现方式中，该神经网络可以为gpt神经网络，包括依次连接的嵌入层、n个解码模块和输出层。其中该n个解码模块中每个解码模块包括依次连接的掩码注意力层、第一归一化层、前向反馈层和第二归一化层，该n为大于1的整数；以及该第一分类器输出的该情感特征作为该gpt神经网络的n个解码模块中第i个解码模块的输入的一部分，其中，i为正整数且i≤n。

19、可选地，该第二分类器输出的用户信息作为该gpt神经网络的n个解码模块中第j个解码模块的输入的一部分，其中，j为正整数且j≤n；或者该第二分类器包括第一子分类器和第二子分类器，该第一子分类器输出的年龄段特征作为该gpt神经网络的n个解码模块中第j个解码模块的输入的一部分，该第二子分类器输出的性格特征作为该gpt神经网络的n个解码模块中第k个解码模块的输入的一部分，其中，j为正整数且j≤n；k为正整数且k≤n。

20、可选地，该n≥2，i≤n/2，i≤j和i≤k；或者n≥2，i≤n/2，i≤j。

21、可选地，该n≥2，i＝1，j≤n/2和k≤n/2；或者该n≥2，本文档来自技高网...

【技术保护点】

1.一种表情包生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其中，所述表情包生成模型还包括第二分类器，所述第二分类器用于从所述语音信息中提取用户信息，其中所述用户信息包括年龄段和/或性格特征，所述至少一个表情包包括与所述用户信息匹配的表情包。

3.根据权利要求2所述的方法，其中，

4.根据权利要求1所述的方法，其中，针对同一情感特征生成的所述至少一个表情包为多个表情包，各个表情包具有不同的表情包类型，以及所述表情包类型包括卡通类型、真人类型、宠物类型、自然风光类型和/或影视截图类型。

5.根据权利要求1-4任一项所述的方法，其中，

6.根据权利要求5所述的方法，其中，

7.根据权利要求6所述的方法，其中，

8.根据权利要求1-7任一项所述的方法，其中，所述表情包生成方法应用于辅助聊天。

9.一种表情包生成装置，其特征在于，包括：处理单元和存储单元，

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被执行时，实现

...

【技术特征摘要】

1.一种表情包生成方法，其特征在于，包括：

3.根据权利要求2所述的方法，其中，

4.根据权利要求1所述的方法，其中，针对同一情感特征生成的所述至少一个表情包为多个表情包，各个表情包具有不同的表情包类型，以及所述表情包类型包括卡通类型、真人类型、宠物类型、自然风光类...

【专利技术属性】
技术研发人员：彭瑞达，
申请(专利权)人：北京家瑞科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人