内核系数量化制造技术

技术编号：28450650 阅读：22 留言：0更新日期：2021-05-15 21:13

本发明专利技术公开了内核系数量化，具体公开了在执行矩阵运算时优化存储器使用的装置、系统和技术。在至少一个实施例中，优化矩阵以限制存储器和存储要求，同时最小化矩阵成员之和的精度损失。度损失。度损失。

全部详细技术资料下载

【技术实现步骤摘要】
内核系数量化

[0001]本申请总地涉及在数据表示方案之间的大数据集的转换中优化处理资源并最小化信息损失。例如，至少一个实施例涉及用于将存储为实数表示的值的矩阵转换为定点表示的处理器或计算机系统，而矩阵内的值之和的损失最小。

技术介绍

[0002]从实数到定点表示的矩阵转换是在多种领域和应用中发生的常见操作。这些过滤器内核可以具有任意尺寸，并且可以具有或可以不具有对称性。在许多情况下，内核系数之和是特别重要的属性，尤其是在该和为整数的情况下。除了获得所需用法的所需过滤器参数外，这是一个增加的约束。
[0003]附图标记
[0004]图1示出了实数矩阵的表示；
[0005]图2示出了具有水平和垂直对称性的实数矩阵的表示；
[0006]图3示出了具有水平对称性、垂直对称性和对角线对称性的实数矩阵的表示；
[0007]图4示出了一个或更多个实施例的流程图。
[0008]图5示出了一个或更多个实施例的流程图。
[0009]图6示出了根据至少一个实施例的数据中心系统；以及
[0010]图7示出了根据至少一个实施例的计算机系统。
具体实施方式
[0011]在一组内核系数中，数值可以以多种不同的格式表示，每种格式具有单独的存储约束。例如，对于给定的大数字，对一种存储格式(例如，实数格式)的选择具有可以在存储器中表示该数字的范围。但是，在许多应用程序中，执行其他运算时可能需要特定的数字格式，或者可能导致更有效地使用计算机资源。例如，可以将最初存储为实数的

【技术保护点】

【技术特征摘要】
1.一种用于优化矩阵转换的方法，包括：接收实数矩阵，其中每个实数由尾数和指数表示；识别要对所述矩阵执行的数学运算；基于所述矩阵与所述数学运算，确定计算资源需求；确定所需的计算资源需求超过阈值；将所述矩阵转换为转换后的矩阵，其中所述转换后的矩阵使所述矩阵之和与所述转换后的矩阵之和之间的误差最小；基于所述数学运算与所述转换后的矩阵生成结果；以及提供所述结果。2.根据权利要求1所述的方法，其中所述矩阵是滤波器内核。3.根据权利要求1所述的方法，其中所述矩阵具有水平对称性、垂直对称性或对角线对称性中的至少一种，并且其中至少部分地基于所述矩阵的对称性来转换所述矩阵。4.根据权利要求1所述的方法，其中将所述矩阵转换为转换后的矩阵包括：裁剪一个或更多个系数以减少所述一个或更多个系数的存储位的数目，并且其中裁剪后的存储位用于确定所述误差。5.根据权利要求4所述的方法，其中裁剪所述一个或更多个系数包括：减少一个或更多个系数的尾数的存储位的数目。6.根据权利要求1所述的方法，还包括：基于所述转换后的矩阵与所述数学运算，确定第二计算资源需求；以及确定所需的第二计算资源需求未超过所述阈值。7.根据权利要求1所述的方法，其中所述转换后的矩阵包括被表示为定点数的条目。8.根据权利要求1所述的方法，其中基于所述矩阵的大小、所述矩阵的最大存储限制以及对所述矩阵执行所述运算的最大计算时间中的至少一个来确定所需的计算资源需求超过阈值。9.根据权利要求1所述的方法，还包括：接收第二实数矩阵；确定要对所述矩阵与所述第二矩阵执行所述数学运算；以及将所述第二矩阵转换为第二转换后的矩阵，其中所述第二转换后的矩阵使所述第二矩阵之和与所述第二转换后的矩阵之和之间的误差最小；其中生成所述结果还基于所述第二转换后的矩阵。10.一种系统，包括：一个或更多个处理器，所述一个或更多个处理器包括数学处理器；数学处理存储器，能够操作为执行一个或更多个数学运算；以及存储器，所述存储器包含指令，所述指令在由所述一个或更多个处理器执行时使得所述系统：接收实数矩阵，其中每个实数由尾数和指数表示；识别由所述数学处理器使用所述数学处理存储器对所述矩阵要执行的数学运算；至少基于所述矩阵与所述数学运算确定计算资源需求；基于所述数学处理存储器和所述数学处理器中的至少一个，确定所需的计算...

【专利技术属性】
技术研发人员：M，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人