当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于使用并行处理来求解线性方程组的设备、系统和方法技术方案

技术编号:8161513 阅读:225 留言:0更新日期:2013-01-07 19:31
一种用于用向量乘矩阵的方法、装置和系统,例如,视频插入(其它应用是可预期的)。该矩阵可以表示大型稀疏线性方程组。该大型稀疏线性方程组可以用于估计视频文件的帧之间的运动以转换帧频。向量可以是该线性方程组的解的第一估计值。可以按照与所述元素在所述向量中的排列顺序不同的顺序用所述向量的元素乘所述矩阵。可以并行地乘向量中的多个元素。线性方程组的解的第二向量估计值可以是乘法的积。例如当第一和第二向量估计值的差小于预定的量时,可以设置线性方程组的解。其它的实施例被描述和主张权利。

【技术实现步骤摘要】

本专利技术涉及用于求解线性方程组的迭代方法,其可以用于例如估计视频文件的帧之间的动作以转换帧频。
技术介绍
视频输入文件可以具有一特定的帧频。用于输出(例如播放)该文件的设备可以具有ー个不同的帧频。例如ー个50Hz的视频文件可以被输入到ー个以IOOHz的帧频播放视频的电视。当输入文件的帧频与输出文件的帧频不同时,需要使得帧频一致。 已经开发了帧频转换算法来改变帧的显示速率。帧频转换算法可以例如,増加或减少每个时间周期内的帧数目,以相应地加快或减慢输入帧频,而不改变视频显示的总时间或所觉察到的显示速度。ー些基本算法可以简单地复制或消除帧。其它的可以使用例如运动补偿算法在帧间插入动作。视频中的运动估计可以被模型化,例如,通过(偏)微分方程(PDE)。可以对PDE应用一个离散方法(例如有限差分)来找到其数值解。离散化可以生成一个线性方程组,例如ー个大型稀疏线性方程组(LSSLE)。每个LSSLE可以描述一对帧中的每个帧之间的改变或运动。帧频转换算法可以使用LSSLE的数值解,例如,用于生成帧频转换。LSSLE在科学和工程的许多领域是已知的,例如电子工程、流体动力学、计算机视觉/图形、光流估计、超分辨率和图像降噪。求解该LSSLE可能需要密集计算。例如,求解LSSLE以对ー组帧的帧频进行转换可能花费比这些帧的播放时间更久的时间。当播放器在等待转换后的帧时,可能在播放速率上有延迟。为了补偿这个延迟,一个帧频转换算法通过生成更少的帧和/或生成具有降级的运动估计的帧,会降低视频质量。这会导致更多的“跳跃”视频。附图说明本申请公开的主题在说明书的结尾部分被特别地指出和清楚地声明。然而,本专利技术的实施例,涉及组织结构和操作方法,以及它的目标、特征和益处,可以通过參考下面的详细说明并与附图一起阅读来更好地理解,其中图I是根据本专利技术的一个实施例的系统的示意图;图2是根据本专利技术的一个实施例的处理器流水线的示意图;图3是根据本专利技术的一个实施例的项重排的示意图,其中,将具有初始顺序的向量X重排为具有新的顺序的向量X’ ;图4A和4B显示根据本专利技术的一个实施例的,分别表示具有初始顺序的向量X和具有新的顺序的向量X’的矩阵;以及图5是根据本专利技术的一个实施例的方法的流程图。可以理解,为了描述地简单和清楚,图中示出的元件不必精确绘制或按比例绘制。例如,为了清楚,一些元件的尺寸可以相对于其它元件进行放大,或者将多个物理部件包括在一个功能块或元件中。此外,基于合适的考虑,參考标记可以在附图之间重复使用,以指示对应的或类似的元件。另外,在附图中描述的ー些块可以被组合为单个功能。具体实施例方式在下面的详细描述中,阐明了许多具体细节以便透彻理解本专利技术的实施例。然而本领域技术人员应该理解,本专利技术的实施例可以在没有这些具体细节的情况下被实施。在其它例子中,公知的方法、过程、部件和电路未详细说明,以免使得该描述模糊不清。如果没有具体说明,那么明显从下面的讨论可以理解,在整个说明书中使用的术 语(例如“处理”、“计算”、“決定”等)是指计算机、计算系统或类似的电子计算设备的动作和/或处理过程,其控制和/或转换表示为计算系统的寄存器和/或存储器中的物理量(例如电子,量子)的数据,将它们转换为其它类似地表示为计算系统的存储器、寄存器或其它此类信息存储、传输或显示设备中的物理量的数据。另外,在本说明书全文中可以使用术语“多个”来描述两个或更多的部件、设备、要素、參数等。本专利技术的实施例可以在各种应用中使用。尽管本专利技术在这方面不受限制,本文公开的电路和技术可以用于许多装置,例如个人电脑(PC)、图像或视频重放设备、数字视频光盘(DVD)播放器、无线设备或无线台、视频或数字游戏设备或系统、图像采集系统、处理系统、可视化或显示系统、数字显示系统、通信系统等。本专利技术的实施例可以用于例如以第一帧频输入视频并以第二帧频输出视频的系统。播放时间或察觉到的播放时间可以保持相同,但每个时间单元内显示的帧的数目可以改变。本专利技术的实施例可以从第一帧频转换到第二帧频。帧频转换可以包括插入中间帧,例如,通过求解LSSLE。例如,本专利技术的实施例可以运转在例如一个计算机系统上,以执行打包指令,如图I所示。參考图1,其示意性地描述了根据本专利技术的一个实施例的计算机系统100。计算机系统100是可以结合本专利技术实施例使用的一种计算机系统的例子。未示出的不同配置的其它类型的计算机系统也可以结合本专利技术的实施例使用。计算机系统100可以包括一个或多个总线101和/或点对点互连,或其它内部通信硬件和软件,来传输信息;计算机系统100还包括耦合到总线101或点对点互连的、用于处理信息的处理器109。处理器109可以具有单核、多核或对称多处理结构。处理器109可以是例如中央处理单元(CPU)或具有任何合适体系结构的多个处理器。在一个实施例中,该体系结构可以包括流SMD扩展(SSE)(例如,SSE4. 2或其它SSE4指令集,如在2007年4月公布的“ Intel SSE4Programming Reference”中所描述的),其是ー个单指令多数据(SIMD)指令集扩展。该SSE体系结构可以在多个(例如4个)数据点上并行地执行打包指令。在另ー实施例中,SSE体系结构的imel 高级矢量扩展(AVX)(例如,在 2008 年 3 月公布的“Intel· Advanced Vector Extension Programming Reference”中所描述的),可以用于在其它数目(例如8或16个)的数据点上并行执行打包指令。处理器109可以具有复杂指令集计算机体系结构或精简指令集计算机体系结构。处理器109可以包括执行单元130、寄存器堆150、高速缓存层次结构160、解码器165和内部总线170。该寄存器堆150可以包括包含了多个结构寄存器的单个寄存器堆或包括多个寄存器堆,该多个寄存器堆中的每个包括多个结构寄存器。其它寄存器也可以使用。计算机系统100可以在耦合到总线101的主存储器104中包括随机存取存储器(RAM)、动态RAM (DRAM)或其它动态存储元件,用于存储处理器109执行的信息和指令。主存储器104可以用于在处理器109执行指令期间存储临时变量或其它中间信息。计算机系统100可以包括耦合到总线101的只读存储器(R0M)106或其它静态存储元件,来存储用于处理器109的静态信息和指令。 数据存储设备107,例如磁盘或光盘及对应的盘驱动器,可以耦合到总线101。计算机系统100可以通过总线101耦合到用于向计算机系统100的用户显示信息的显示设备121。显示设备121可以包括帧缓冲器、专用图形绘制设备、阴极射线管(CRT)或平板显示器,但本专利技术并不限于此。字母数字输入设备122,例如包括字母数字和其它键的键盘,可以被耦合到总线101用于向处理器109传送信息和命令选择。还可以包括光标控制器123,其包括鼠标、轨迹球、笔、触摸屏或光标方向键,用于向处理器109传送方向信息和命令选择,并用于控制显示设备121上的光标移动。该计算机系统100可以被耦合到录音和重放设备125。录音可以使用例如耦合到麦克风的音频数字转换器来实现,声音重放可以使用例如耦合到数模(D/A)转换器的用于重放数字本文档来自技高网...

【技术保护点】
一种用于消除数据依赖性的方法,包括:调用线性方程算法以推导坐标元素的第一向量的解估计值,所述线性方程算法用于根据所述坐标元素的第一有序的序列来连续地推导所述解;识别坐标元素的所述第一向量中的多个初始邻接的坐标元素;将所述多个初始邻接的坐标元素中的每一个分配给第二有序的序列的坐标元素的第二向量;以及并行地计算来自所述第二向量的相邻的元素对。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:A·米亚斯科夫斯基S·格伦
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利