数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:28374423 阅读:14 留言:0更新日期:2021-05-08 00:01
本公开涉及一种数据处理方法、装置、计算机设备和存储介质。其所公开的板卡包括:存储器件、接口装置和控制器件以及包括数据处理装置的人工智能芯片;其中,人工智能芯片与存储器件、控制器件以及接口装置分别连接;存储器件,用于存储数据;接口装置,用于实现人工智能芯片与外部设备之间的数据传输;控制器件,用于对人工智能芯片的状态进行监控。本公开实施例所提供的数据处理方法、装置、计算机设备和存储介质,可以提高量化的精度的同时,节约winograd卷积的运算时间,减少能耗。

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质
本公开涉及计算机
,特别是涉及一种数据处理方法、装置、计算机设备和存储介质。
技术介绍
在人工智能
,神经网络算法是最近非常流行的一种机器学习算法,在各种领域中都取得了非常好的效果,比如图像识别,语音识别,自然语言处理等。随着神经网络算法的发展,算法的复杂度也越来越高,为了提高识别度,模型的规模也在逐渐增大。用GPU和CPU处理起这些大规模的模型,要花费大量的计算时间,并且耗电量很大。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够节约计算时间、减少能耗,提高计算精度的数据处理方法、装置、计算机设备和存储介质。根据本公开的一方面,提供了一种数据处理方法,包括:根据采用多对截断阈值对待量化数据进行量化处理得到的量化数据的绝对值的均值,从多对截断阈值中确定出一对截断阈值,其中,所述待量化数据为winograd卷积处理过程中的一组数据,所述多对截断阈值中的每对截断阈值包括第一截断阈值和第二截断阈值,其中,所述第二截断阈值为所述待量化数据中的最小值;根据确定出的所述一对截断阈值对所述待量化数据进行量化处理,得到量化后的数据;根据所述量化后的数据继续执行winograd卷积处理,得到量化后的winograd卷积结果;对所述量化后的winograd卷积结果执行反量化处理,得到winograd卷积结果。根据本公开的另一方面,提供了一种数据处理装置,所述装置包括:第一确定模块,根据采用多对截断阈值对待量化数据进行量化处理得到的量化数据的绝对值的均值,从多对截断阈值中确定出一对截断阈值,其中,所述待量化数据为winograd卷积处理过程中的一组数据,所述多对截断阈值中的每对截断阈值包括第一截断阈值和第二截断阈值,其中,所述第二截断阈值为所述待量化数据中的最小值;第一量化模块,根据确定出的所述一对截断阈值对所述待量化数据进行量化处理,得到量化后的数据;卷积处理模块,根据所述量化后的数据继续执行winograd卷积处理,得到量化后的winograd卷积结果;反量化处理模块,对所述量化后的winograd卷积结果执行反量化处理,得到winograd卷积结果。根据本公开的另一方面,提供了一种人工智能芯片,所述芯片包括如前述任意一项所述的数据处理装置。根据本公开的另一方面,提供了一种电子设备,所述电子设备包括如前述的人工智能芯片。根据本公开的另一方面,提供了一种板卡,所述板卡包括:存储器件、接口装置和控制器件以及如前述的人工智能芯片;其中,所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;所述存储器件,用于存储数据;所述接口装置,用于实现所述人工智能芯片与外部设备之间的数据传输;所述控制器件,用于对所述人工智能芯片的状态进行监控。根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述中任意一项所述的方法。根据本公开的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现前述中任意一项所述的方法。根据本公开的数据处理方法、装置、计算机设备和存储介质,根据采用多对截断阈值对待量化数据进行量化处理得到的量化数据的绝对值的均值,从多对截断阈值中确定出一对截断阈值,其中,待量化数据为winograd卷积处理过程中的一组数据,多对截断阈值中的每对截断阈值包括第一截断阈值和第二截断阈值,其中,第二截断阈值为待量化数据中的最小值;根据确定出的一对截断阈值对待量化数据进行量化处理,得到量化后的数据;根据量化后的数据继续执行winograd卷积处理,得到量化后的winograd卷积结果;对量化后的winograd卷积结果执行反量化处理,得到winograd卷积结果,可以提高量化的精度的同时,节约winograd卷积的运算时间,减少能耗。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。附图说明包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。图1示出根据本公开实施例的数据处理方法的流程图。图2示出根据本公开实施例的数据处理方法中截断阈值确定的示意图。图3示出根据本公开实施例的数据处理装置的框图。图4示出根据本公开实施例的板卡的结构框图。图5示出根据本公开实施例的一种电子设备800的框图。图6示出根据本公开实施例的一种电子设备1900的框图。具体实施方式下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。应当理解,本公开的权利要求、说明书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。本公开的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本公开说明书中所使用的术语仅仅是出于描述特定实施例的目的,而并不意在限定本公开。如在本公开说明书和权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本公开说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。winograd卷积是一种基于多项式插值算法的卷积加速实现方式。它通过对卷积操作的两个输入:神经元、权值进行一定规模切分后分别进行线性变换(winograd正变换),再将变换后的神经元和权值进行对位乘法,最后对对位乘法结果再次进行线性变换(winograd逆变换)得到与原卷积操作等价的卷积结果。winograd变换的表达式如下所示:对于一维的神经元和权值:S=AT((Gg)⊙(BTd))对于二维的神经元和权值:S=AT((GgGT)⊙(BTdB))A其中,g表示权值,G表示权值对应的左乘正变换矩阵,GT本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n根据采用多对截断阈值对待量化数据进行量化处理得到的量化数据的绝对值的均值,从多对截断阈值中确定出一对截断阈值,其中,所述待量化数据为winograd卷积处理过程中的一组数据,所述多对截断阈值中的每对截断阈值包括第一截断阈值和第二截断阈值,其中,所述第二截断阈值为所述待量化数据中的最小值;/n根据确定出的所述一对截断阈值对所述待量化数据进行量化处理,得到量化后的数据;/n根据所述量化后的数据继续执行winograd卷积处理,得到量化后的winograd卷积结果;/n对所述量化后的winograd卷积结果执行反量化处理,得到winograd卷积结果。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
根据采用多对截断阈值对待量化数据进行量化处理得到的量化数据的绝对值的均值,从多对截断阈值中确定出一对截断阈值,其中,所述待量化数据为winograd卷积处理过程中的一组数据,所述多对截断阈值中的每对截断阈值包括第一截断阈值和第二截断阈值,其中,所述第二截断阈值为所述待量化数据中的最小值;
根据确定出的所述一对截断阈值对所述待量化数据进行量化处理,得到量化后的数据;
根据所述量化后的数据继续执行winograd卷积处理,得到量化后的winograd卷积结果;
对所述量化后的winograd卷积结果执行反量化处理,得到winograd卷积结果。


2.根据权利要求1所述的方法,其特征在于,根据采用多对截断阈值对待量化数据进行量化处理得到的量化数据的绝对值的均值,从多对截断阈值中确定出一对截断阈值,包括:
在当前轮次的搜索中,采用多对截断阈值对所述待量化数据进行量化,得到量化后的多组数据;
根据每组数据的绝对值的均值与所述待量化数据的绝对值的均值之间的差异,从所述多对截断阈值中确定一对待选截断阈值;
在当前轮次搜索满足继续搜索条件时,根据所述待选截断阈值确定新的多对截断阈值,并根据新的多对截断阈值进行下一轮搜索,直至当前轮次搜索不满足继续搜索条件;
在当前轮次搜索不满足继续搜索条件时,将所述待选截断阈值确定为从多对截断阈值中确定出的一对截断阈值。


3.根据权利要求2所述的方法,其特征在于,所述继续搜索条件包括以下至少一种:
已经进行的搜索次数小于预定的搜索总次数;
当前搜索中每组数据的绝对值的均值与所述待量化数据的绝对值的均值之间的差异大于或等于差异阈值。


4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
确定所述待量化数据中数据的最大绝对值;
基于所述最大绝对值和截断对数,确定多个第一截断阈值;
根据所述多个第一截断阈值和所述第二截断阈值,得到所述多对截断阈值。


5.根据权利要求1所述的方法,其特征在于,所述winograd卷积处理过程,包括:
将待运算数据的winograd正变换拆解为求和运算,并进行计算得到所述待运算数据中每个数据的winograd正变换结果;
执行所述待运算数据中对应数据的winograd正变换结果之间的对位乘操作,得到对位乘结果;
将对所述对位乘结果的winograd逆变换拆解为求和运算,得到所述winograd卷积结果,
其中,所述待量化数据为所述待运算数据、所述待运算数据的winograd正变换结果和所述对位乘结果中的任一种。


6.根据权利要求5所述的方法,其特征在于,根据确定出的所述一对截断阈值对所述待量化数据进行量化处理,得到量化后的数据,包括以下任一操作:
在将待运算数据的winograd正变换拆解为求和运算之前,将所述待运算数据作为待量化数据进行量化处理;
在进行对位乘操作之前,将待运算数据中每个数据的winograd正变换结果作为待量化数据进行量化处理;
在进行winograd逆变换拆解为求和运算之前,将所述对位乘结果作为待量化数据进行量化处理。


7.根据权利要求5所述的方法,其特征在于,所述将待运算数据的winograd正变换拆解为求和运算,并进行计算得到所述待运算数据中每个数据的winograd正...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1