【技术实现步骤摘要】
一种基于在线训练的超分辨率直播系统
[0001]本专利技术属于直播流媒体
,具体涉及一种基于在线训练的超分辨率直播系统。
技术介绍
[0002]直播流媒体正在成为人们生活中越来越重要的部分。截止2020年,中国的在线直播行业用户量已经达到了将近6亿。据估计到2022年,互联网中将有13%的流量来自直播流媒体[3]。直播流媒体,就是推流端将音视频流在较短的延时内分发到用户播放端的系统。近年来虽然流媒体直播技术不断更新迭代,新的协议和分发架构层出不穷,但是仍然遵循着一定的基本框架。直播流媒体主要有六个基础环节,即:捕捉,编码,封装,转码,分发,播放。一般对应三个终端:推流端、服务器端、用户端。每个终端之间会有相应的数据传输。推流端首先完成视频的捕捉、编码和封装,之后通过低延时传输协议将视频流推送到服务器。服务器端完成视频的转码,最后经由CDN分发到用户手中。用户则通过播放器实现直播观看。重要的直播场景非常多,在目前配备GPU硬件计算能力的PC端、移动终端和智能汽车等场景,视频直播系统的应用有了进一步拓展。
[0003]由于直播流媒体有低延时的特性,传输网络协议就成了系统中重要的技术基础。如今市面上主流的直播协议有WebRTC、RTMP、HLS等。WebRTC是由Google团队收购并维护的一项视频传输协议,被视为直播流媒体的未来标准。与其他协议相比,WebRTC有着极低的延迟,通常用于需要即时互动的场景。但由于推出时间较短,在国内市场目前还没有被大规模使用。RTMP是Adobe公司为了实现播放器和服务器之间 ...
【技术保护点】
【技术特征摘要】
1.一种基于在线训练的超分辨率直播系统,其特征在于,包括推流端和服务器端两个部分;其中:(1)服务器端包括空域超分F
‑
EDSR和TCSR两个网络,并进行级联;前者用于对视频实时处理,后者用于对F
‑
EDSR的输出进行帧挑选处理;(1.1)F
‑
EDSR空域超分F
‑
EDSR作为一级网络,是基于图像超分网络EDSR;网络头部使用一个二维卷积层,具有更大的5*5卷积核,以及更少的通道;网络主体由深度残差模块构成,并以二维卷积层结束;每个残差模块由两个卷积层和一个激活层构成;残差模块去掉批量归一化层使得网络主体参数更少,感受动态更大;网络尾部是上采样模块和卷积模块,使得图像能以设定尺寸输出;(1.2)TCSRTCSR网络作为二级网络,以多个连续的帧为作为输入,中间帧作为融合输出的目标;包括一个OFRnet运算模块、仿射变换、融合模块、重构模块;多个连续帧表示为I
t
‑
k
,
…
I
t
‑1,I
t
,I
t+1
,
…
,I
t+k
,中间帧为I
t
,其中k表示中间帧和相邻帧的最大间隔数;使用的视频帧输入后,每对相邻帧I
t+i
和目标帧I
t
经过OFRnet的运算,都能得到I
t+i
关于I
t
的光流图,记为O
t+i
;利用O
t+i
对I
t+i
进行仿射变换得到经过运动补偿的帧I
t+i,t
,该帧是与I
t
高度相似的对齐帧;此时多个对齐帧{I
t+i,t
}和目标帧I
t
进入一个融合模块,该融合模块运用注意力机制将多帧融合,输出多通道特征图块,该融合模块运用注意力机制将多帧融合,输出多通道特征图最后经由一个重构模块加上图像残差,输出超分辨率目标帧(2)推流端推流端主要包括训练和监测两个模块;训练模块将当前的实时最佳模型传送给监测模块,监测模块负责记录当前模型随视频流变化的PSNR;一旦通过PSNR监测到场景转变,监测模块向训练模块发出训练请求;如果训练模块处于停止状态,则开始模型训练;(2.1)监测模块监测算法选择使用局部加权回归算法,该算法利用某时刻的邻近值进行平滑处理;由于与时刻x
i
距离不同的点有不同的权重,算法公式如下所示:其中,使用Epanechnikov二次kernel:其中,使用Epanechnikov二次kernel:式中,λ是kernel的参数,称为窗口宽度;局部加权中只考虑附近k个值的影响,也就是:λ=|x
i
‑
x
[k]
|,其中,x
[k]
是距离x
i
为k的时刻点;(2.2)训练模块训练模块根据监测模块的结果进行训练;训练过程中,设定一个提升PSNR阈值TH
s
以及
一个预测提升PSNR阈值TH
p
;前者依据经验作为固定参数,后者通过冷启动的训练...
【专利技术属性】
技术研发人员:徐跃东,刘旭东,戴连贵,邢万勇,张云霞,徐广宁,
申请(专利权)人:广东利通科技投资有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。