【技术实现步骤摘要】
一种通过修改扩散模型轨迹进行图像补全的方法和系统
[0001]本专利技术涉及图像补全领域,尤其涉及一种通过修改扩散模型轨迹进行图像补全的方法和系统。
技术介绍
[0002]图像补全是计算机视觉中一个重要的研究方向,给定一个部分区域被遮盖的图像(遮罩图像),图像补全要求根据图像未被遮盖区域的信息,来预测并填补被遮盖的区域,使得修复后的图像看起来非常自然,没有明显地拼接和认为修改的痕迹。图像补全的方法主要分为两类:一类是纹理合成方法,其核心是从图像未被遮盖区域采样相似像素块填充待补全区域;另一类是基于神经网络的生成模型,根据图像未被遮盖区域的特征,生成语义一致的补全图像。
[0003]近年来,扩散生成模型被提出并在学术界和工业界备受关注。扩散生成模型是在非平衡态热力学的启发下被提出的,非平衡热力学也称为不可逆过程的热力学,主要研究对象包括热传导、物质的扩散等,其中一个主要问题就是演化动力学问题,它要解决微观可逆与宏观不可逆的矛盾。应用到生成模型领域,可以认为数据都是各种变量在外力作用下达到的一种平衡状态,当这种外力消失时,变量会进行自由的扩散,就像粒子的布朗运动一样。通过模拟这个扩散的过程,通过迭代的方法,有规律地、缓慢地摧毁原始数据的分布,使得原始数据分布趋向于一个更加自然的、简单的、容易计算的分布,理论上任何复杂的原始分布都可以通过这一过程被转化为这种简单的分布。拿图像举例,通过不断对每个像素的值做扩散操作,最终这个图像就变成了一张高斯噪声图。微观上,只要每步扩散的程度足够小,扰动足够小,那么它就是可逆的,任 ...
【技术保护点】
【技术特征摘要】
1.一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,包括以下步骤:步骤1,通过可训练的神经网络将部分遮盖后的样本图像映射到原始图像空间;步骤2,对原始图像进行采样,得到采样图像x
t
,采样公式为:其中,t~Uniform({1,
…
,T}),T为预设的总扩散步数,x
t
表示第t步的采样图像,c表示部分遮盖后的样本图像,x0表示原始图像,k
t
表示控制扩散轨迹偏移模式的系数,f(
·
)表示可训练的神经网络,∈表示采样时添加的符合标准高斯分布的噪声,表示前t步的噪声累积;步骤3,根据采样图像计算图像补全网络的损失,损失函数为:其中,g
θ
(
·
)表示图像补全网络,其输入为x
t
和t;步骤4,根据图像补全网络的损失,更新图像补全网络参数和步骤1中可训练的神经网络参数;步骤5,利用训练好的神经网络和图像补全网络,逆向生成遮盖图像的补全结果。2.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,步骤2中,前t步的噪声累积的计算公式为:α
t
=1
‑
β
t
其中,β
t
是预设的第t步扩散参数,α
t
是第t步噪声参数。3.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,所述的扩散轨迹偏移模式包括:数据归一化模式:表示将重设不同条件的数据的前向过程的起点,而终点不变的偏移模式;先验偏移模式:表示将不同条件的数据的前向过程的终点设为x
T
=f(c),而起点不变的偏移模式。4.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,所述的图像补全网络采用UNet架构。5.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,所述的步骤5中,逆向生成遮盖图像的补全结果的公式为:s
t
=k
t
·
f(c)其中,β
t
是预设的第t步扩散参数,α
t
是第t步噪声参数,g
θ
(
·
)是图像补全网络,s
t
是第t
步的均值...
【专利技术属性】
技术研发人员:姜伟昊,黄俊杰,李烈锋,钱冠梁,王志辉,陈梓铭,
申请(专利权)人:杭州东上智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。