基于视口预测距离控制的全景视频流制造技术

技术编号：39645774 阅读：20 留言：0更新日期：2023-12-09 11:13

本发明专利技术公开了一种基于视口预测距离控制的全景视频流

全部详细技术资料下载

【技术实现步骤摘要】
基于视口预测距离控制的全景视频流QoE优化方法

[0001]本专利技术涉及流媒体视频
，尤其是一种基于视口预测距离控制的全景视频流
QoE
优化方法
。

技术介绍

[0002]近年来，以虚拟现实技术
(Virtual Reality
，简称
VR)
为基础的
360
°
视频流业务
(
也称全景视频
)
应运而生并快速发展
。
这类视频能够反映真实三维场景，提供宽广的观看视角并允许观看者自由控制视口，以带来身临其境的沉浸式体验
。
目前，各大流媒体供应商已纷纷上线了
360
°
视频流业务
。
其对于推动未来视频流媒体服务的发展，以及智慧城市
、
智慧医疗
、
在线教育等重大民生工程的建设具有举足轻重的社会经济意义
。
[0003]由于
360
°
视频的全景场景，其视频帧的分辨率通常为
4K
甚至更高
。
然而，在互联网上传输如高分辨率的视频绝非易事，尤其是在带宽波动剧烈的移动网络中
。
此外，在同一时刻，观众只能观看全景场景的部分内容，即视口中的内容，所以如果以高画质传输整个全景画面，势必会造成大量带宽浪费，严重限制观看体验质量
(Quality of Experience, QoE)
的改善...

【技术保护点】

【技术特征摘要】
1.
基于视口预测距离控制的全景视频流
QoE
优化方法，其特征在于，包括如下步骤：步骤1，构建视口预测距离控制模型，并对所构建的视口预测距离控制模型进行训练；步骤2，视口预测距离控制模型输入端接收视频客户端发送的输入环境状态，输出端输出动作实现决策，其中输入状态包括吞吐量向量
、
缓冲区向量，输出动作包括视频下载暂停时间
、
码率阈值
、
播放速率；步骤3，视口预测距离控制模型将输出动作发送到视频客户端，视频客户端根据视频下载暂停时间决定下一个视频片段的请求时间点，及根据码率阈值与未来视口预测结果确定每个空间瓦片的比特率；步骤4，视频客户端向视频服务器发送视频片段下载请求，视频服务器根据步骤3的结果返回所请求片段的空间瓦片；视频客户端将所有瓦片拼接为全景视频，并以视口预测距离控制模型输出的播放速率进行播放
。2.
根据权利要求1所述的基于视口预测距离控制的全景视频流
QoE
优化方法，其特征在于，所述视口预测距离控制模型包括卷积神经网络
、
全连接网络，输入端由两个独立的卷积神经网络分别接收两个输入状态，通过卷积神经网络进行卷积处理后，在全连接网络实现汇合，最后经过全连接网络的映射后传递给网络输出层，实现动作决策
。3.
根据权利要求1所述的基于视口预测距离控制的全景视频流
QoE
优化方法，其特征在于，所述步骤1中视口预测距离控制模型采用基于连续值动作控制的深度强化学习算法进行模型训练
。4.
根据权利要求3所述的基于视口预测距离控制的全景视频流
QoE
优化方法，其特征在于，所述模型训练的优化目标函数为：；其中，
w
k
表示
QoE
性能；
σ
k
表示视频下载暂停时间；
μ
k
表示码率阈值；
ρ
k
表示视频播放速率；
k
表示视频片段序号，
k=1,2,
…
,K
；
QoE
性能
w
k
被定义为所述模型训练的训练奖励，具体公式为：；其中，
w
k,0
表示视频质量；
w
k,1
表示空间维度视频质量平滑度；
w
k,2
表示时间维度视频质量平滑度；
w
k,3
表示视频播放卡顿时长；；其中，
r
k,i
是瓦片
i
的比特率，
ξ
k,i
是
0/1
标志，
ξ
k,i
=1
表示瓦片
i
在用户视口内被实际观看，
ξ
k,i
=0
表示瓦片
i
未被观看；
；其中，
τ
k
是下载片段
k
所花费的时间，
ρ
k
是播放速率，
b
k
是请求视频片段
k
时刻的缓冲区占用率
。5.
根据权利要求3所述的基于视口预测距离控制的全景视频流
QoE
优化方法，其特征在于，所述模型训练的训练环境具体为：将视口预测距离控制模型部署于基于吞吐量跟踪数据与视口变化跟踪数据的模拟器中，模拟器随后根据所决策的视频比特率与当前可用吞吐量计算视频片段的下载时长，然后将片段的物理持续时间累积到当前缓冲区占用率中，以模拟视频片段的下载完成；同时，对于视频播放，系统维持一个播放缓冲区，缓冲区数据的消耗量受视频播放速率的影响；在整个...

【专利技术属性】
技术研发人员：张广辉，高熙然，肖梦白，元辉，于东晓，成秀珍，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人