北京生数科技有限公司专利技术

北京生数科技有限公司共有12项专利

  • 本公开实施例公开了基于文本生成图像的方法和装置、电子设备和存储介质,其中,方法包括:获取待生成图像的初始信息,初始信息包括图像类别信息;将初始信息输入到预先训练的文本生成模型,得到至少一个文本描述信息,文本描述信息包括图像类别信息和图像...
  • 本发明实施例公开了一种图像生成的方法和装置。本发明实施例通过获取初始图像和模板图像,其中,所述初始图像包括至少一张人脸;根据所述初始图像确定人脸特征,并根据所述模板图像确定全图特征;将所述人脸特征和所述全图特征,输入到预先训练的扩散模型...
  • 本公开实施例公开了一种图像生成方法和装置、设备、介质和程序,通过获取用户输入的图像生成任务,输出需求提示消息,并获取用户基于该需求提示消息输入的需求回复消息,然后,基于该需求回复消息确定图像生成需求,进而,基于该图像生成需求确定图像展示...
  • 本申请实施例涉及音视频处理领域,提供一种视频生成方法、相关装置及存储介质,该方法包括:获得音频分片和至少两个视频分片;根据至少两个视频分片得到目标分片;利用音频分片驱动目标分片,得到经驱动的目标分片;其中,视频分片中的目标对象对应至少一...
  • 本申请实施例涉及人工智能技术领域,并提供一种应用于合成虚拟形象的视频处理方法、装置及存储介质,该方法包括:获取针对目标对象在第一场景下录制的基础根视频;获取目标对象在第一场景下的第一动作视频,获取驱动生成虚拟形象的音频文件所对应的文本内...
  • 本申请实施例涉及图像处理技术领域,并提供一种视频换脸的处理方法、装置及存储介质,该方法包括:获取第一视频素材和第二视频素材;将相似度高于预设相似度的素材属性信息的第一帧图片和第二帧图片输入至预设模型,得到替换视频;该替换视频存在拼接缺陷...
  • 本申请实施例涉及人工智能技术领域,并提供一种应用于合成虚拟形象的视频处理方法、装置及存储介质,该方法包括:获取目标对象在第一场景下的第一动作视频和录制的基础根视频;获取目标对象的历史虚拟形象驱动文本,从历史虚拟形象驱动文本中提取关键词;...
  • 本申请实施例涉及人工智能技术领域,并提供一种应用于合成虚拟形象的视频处理方法、相关装置及存储介质,该方法包括:获取针对目标对象在第一场景下录制的基础根视频;获取该目标对象在该第一场景下的第一动作视频;获取用户为该第一动作视频设置的第一时...
  • 本申请实施例涉及人工智能技术领域,并提供一种音频处理方法、装置及存储介质,该方法包括:获取目标对象在第一场景下录制的根视频;获取驱动生成虚拟形象的音频文件;对该音频文件中分贝小于预设阈值且播放时长大干预设时长的异常分片对应的音频数据进行...
  • 本申请实施例涉及人工智能技术领域,并提供一种视频处理方法、装置及存储介质,该方法包括:获取针对目标对象在第一场景下录制的唇形保持完全闭合状态的第一根视频和唇形保持第一幅度的张开状态的第二根视频;获取驱动生成虚拟形象的音频文件;采用驱动生...
  • 本申请实施例涉及深度合成技术领域,提供视频处理方法、装置及存储介质。该视频处理方法包括:获取待处理视频,所述待处理视频包括目标用户的多张第一人脸图像,所述待处理视频为利用预设音频驱动初始视频得到;对所述待处理视频中的至少一张所述第一人脸...
  • 本申请实施例涉及计算机视觉领域,提供一种视频处理方法、相关装置及存储介质,该方法包括:获取候选图像序列,所述候选图像序列通过预设对抗生成模型中的生成器基于目标语音片段以及目标对象的面部图像得到;基于所述候选图像序列获取目标损失,所述目标...
1