一种数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:28980700 阅读:10 留言:0更新日期:2021-06-23 09:27
本申请实施例公开了一种数据处理方法、装置、设备及计算机可读存储介质。其中方法包括:获取第t个时间步的输入数据对应的K个投影向量,以及M个处理单元在第t‑1个时间步的状态信息,根据M个处理单元在第t‑1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元,获取目标激活单元的第一拼接数据,并根据第一拼接数据,计算目标激活单元在第t个时间步的隐藏状态。可见,通过相似度对处理单元进行筛选,可以使得各个处理单元处理与自身信息相关程度较高的数据(即使得各个处理单元处理与自身特性相关的数据),进而提高人工智能模型的处理结果的准确度。

【技术实现步骤摘要】
一种数据处理方法、装置、设备及存储介质
本专利技术涉及计算机
,具体涉及一种数据处理方法、装置、设备及计算机可读存储介质。
技术介绍
网格长短期记忆(GridLSTM)是一种由多个长短期记忆(LSTM)网络单元构成的网络结构。在数据处理过程中,网格长短期记忆网络采用多个循环神经网络单元进行协作,相较于采用单一循环神经网络对数据进行处理更加高效,且在不同环境下(处理不同类型数据)的泛化性更好。在实际应用中,网格长短期记忆网络中的各个LSTM又分别负责不同的功能,由于各个LSTM共享输入信息,输入信息的无差异性导致各个LSTM不能从多个角度提取出输入信息的数据特征,单一的数据特征导致后续识别结果的准确率较低。
技术实现思路
本专利技术实施例提供了一种数据处理方法、装置、设备及存储介质,能够提高人工智能模型的处理结果的准确度。一方面,本申请实施例提供了一种数据处理方法,包括:获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。一方面,本申请实施例提供了一种数据处理装置,该数据处理装置包括:获取单元,用于获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;处理单元,用于根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;所述获取单元,还用于获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;所述处理单元,还用于根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。在一个实施例中,所述处理单元用于,根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,具体用于:将所述目标激活单元在第t-1个时间步的状态信息和所述第一拼接数据输入所述目标激活单元,得到中间状态数据;获取所述目标激活单元的第二拼接数据,并根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,所述第二拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的。在一个实施例中,所述处理单元用于,获取目标激活单元的第一拼接数据,具体用于:根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。在一个实施例中,所述处理单元用于,根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据,具体用于:调整所述K个投影向量中除P个投影向量以外的K-P个投影向量;调整所述M-1个处理单元中除所述Q个处理单元外的M-1-Q个处理单元在第t-1个时间步的隐藏状态;对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第一拼接数据。在一个实施例中,所述处理单元用于,获取所述目标激活单元的第二拼接数据,具体用于:对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第二拼接数据。在一个实施例中,所述处理单元用于,根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,具体用于:对所述目标激活单元在第t-1个时间步的隐藏状态和所述中间状态数据进行拼接,得到第三拼接数据;采用分类函数对所述第二拼接数据和所述第三拼接数据进行计算,得到所述第三拼接数据对应的权重向量;根据所述第三拼接数据对应的权重向量对所述第三拼接数据进行加权求和处理,得到所述目标激活单元在第t个时间步的隐藏状态。在一个实施例中,所述M个处理单元为长短期记忆单元,所述状态信息还包括所述M个处理单元在第t-1个时间步的单元状态;所述中间状态数据包括所述目标激活单元在第t个时间步的单元状态;所述处理单元还用于:将所述目标激活单元在第t个时间步的单元状态和所述目标激活单元在第t个时间步的隐藏状态,组合为所述目标激活单元在第t个时间步的状态信息。在一个实施例中,所述处理单元还用于:将所述M个处理单元中除所述N个激活单元外的M-N个处理单元在第t-1个时间步的状态信息,确定为所述M-N个处理单元在第t个时间步的状态信息。在一个实施例中,所述第t个时间步的输入数据是输入数据序列中的一个输入数据,所述人工智能模型还包括识别单元,所述处理单元还用于:将所述输入数据序列中的各个输入数据对应的隐藏状态组合为隐藏状态集合;将所述隐藏状态集合输入所述识别单元,得到所述输入数据序列对应的识别结果。在一个实施例中,所述处理单元用于,根据所述M本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;/n根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;/n获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;/n根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;
获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。


2.如权利要求1所述的方法,其特征在于,所述根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,包括:
将所述目标激活单元在第t-1个时间步的状态信息和所述第一拼接数据输入所述目标激活单元,得到中间状态数据;
获取所述目标激活单元的第二拼接数据,并根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,所述第二拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的。


3.如权利要求2所述的方法,其特征在于,所述获取目标激活单元的第一拼接数据,包括:
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;
根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。


4.如权利要求3所述的方法,其特征在于,所述根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据,包括:
调整所述K个投影向量中除P个投影向量以外的K-P个投影向量;
调整所述M-1个处理单元中除所述Q个处理单元外的M-1-Q个处理单元在第t-1个时间步的隐藏状态;
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第一拼接数据。


5.如权利要求4所述的方法,其特征在于,所述获取所述目标激活单元的第二拼接数据,包括:
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第二拼接数据。


6.如权利要求2所述的方法,其特征在于,所述根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态...

【专利技术属性】
技术研发人员:王子愉姜文浩张子瑄唐伟严骏驰刘威
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1