【技术实现步骤摘要】
一种稀疏模型中字典的表示方法和设备
本专利技术涉及信号处理领域,尤其涉及一种稀疏模型中字典的表示方法和设备。
技术介绍
在信号技术发展中,传统信号处理方法面临着大量的数据储存和数据传输的问题,对于处理大量数据存储和数据传输的问题,随着压缩感知理论的提出以远低于传统奈奎斯特采样率的方式对信号进行处理,其中,压缩感知是在一个合适的过完备基元集上获取和重构信号的理论。这里输入信号只需若干个基元就可以被准确重构,所以重构信号在过完备基元集上可以求得稀疏编码,通过求得稀疏编码,由信号集合生成过完备字典的过程为稀疏建模。所述稀疏模型包括所述稀疏编码和所述由信号集合生成的过完备字典。由于稀疏模型中重构信号出现的重构误差大,为了减小重构误差,在字典学习上现有技术大体分为两大类:第一,人工选择样本集合作为冗余的大字典,其中,人工选择大量高质量的信号样本作为字典,从而保证稀疏编码具有较好的分类能力,但是由于人工选择的方式不能保证减少重构误差,而且过大的字典会导致过高的计算复杂度和存储负担,并且由于无法选择有效的样本子集从而选择大量的样本作为字典,进而增加计算和存储的负担;第二,采用连续的方法求解相对紧凑的字典,其中,连续方法的目标是降低重构误差,通过求解得到误差矩阵,然后采用矩阵分解方法求解特征向量作为字典基元来减少误差,进而将重构误差作为目标函数中的一项,采用随机梯度下降等方法,求解可以降低误差的字典基元。但是,由于连续字典中的基元不属于样本集合,所以可解释性差也不具有语义;在连续字典上得到的稀疏编码不具有明确的类别信息。
技术实现思路
本专利技术的实施例提供一种稀疏模型中字典 ...
【技术保护点】
一种稀疏模型中字典的表示方法,其特征在于,包括:根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;输出通过统计所述样本子集得到的所述新的信号。
【技术特征摘要】
1.一种稀疏模型中字典的表示方法,其特征在于,包括:根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个所述信号样本的样本子集进行统计组成新的信号;输出所述新的信号;其中,所述稀疏模型具体表现为:当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数;在所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,所述方法还包括:设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为循环迭代计算结束的判断条件;将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为所述样本个数K为所述样本集中任意选择的样本个数。2.根据权利要求1所述的方法,其特征在于,所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码,包括:设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。3.根据权利要求1~2任一所述的方法,其特征在于,所述将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,包括:设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时,所述稀疏编码为A={a1,a2,……,aN},其中,为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的代换为E,使得所述计算离散字典的表达式转换为并计算离散字典,其中X为已知的样本集合,A为所述稀疏编码,di为已知字典基元,所述E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号,所述为X-DA在字典基元di依次代入后扩展得到。4.根据权利要求3所述的方法,其特征在于,所述当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,包括:根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为||E-dkA||2;若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;或者,若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为...
【专利技术属性】
技术研发人员:王宇,张宇,王栋,唐胜,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。