一种基于域相似性脑电跨被试源域选择方法技术

技术编号:34890605 阅读:30 留言:0更新日期:2022-09-10 13:49
本发明专利技术公开了一种基于域相似性脑电跨被试源域选择方法。针对现有技术的问题,提出的技术方案为:首先根据改进的MMD公式求出每一被试内的类间间距MMD(xi)并给出置信度;通过计算选择出的Copula函数Kendall秩相关系数并叠加前者的置信度,设置阈值选取大致1/3的源域作为迁移对象进行迁移学习;再通过对分布平衡进行自适应调节以平衡条件分布和边缘分布;最后更新目标域软标签最后返回分类器进行三分类输出分类准确度。本发明专利技术使用了源域选择提高了基于流形嵌入分布对齐的效率,最终使用适合迁移学习的源域进行学习,相比传统方法提高了准确度并极大降低了运算时间。了准确度并极大降低了运算时间。了准确度并极大降低了运算时间。

【技术实现步骤摘要】
一种基于域相似性脑电跨被试源域选择方法


[0001]本专利技术涉及情绪脑电信号源域选择方法,具体通过对比源域与目标域相似性对比选择适合迁移学习的源域的方法。

技术介绍

[0002]人类的情感是以人为主体的需求愿望等倾向的心理现象,近年来,研究人员一直在为人类的情绪做分类。在现代,情感识别主题日渐步入人类的视野中,在不同领域中发挥着其重要的作用,例如在医疗行业中通过监测患者情绪来实现快速诊断,利用情绪进行图像检索等。
[0003]在跨被试模式识别领域中,迁移学习就其利用先前获得的知识来提高某个领域学习的效率和准确性以及无需大量的标记数据等优势映入眼帘,其方法就是通过迁移数据标注、迁移模型、自适应学习以及相似领域知识迁移等利用少量数据标签得到更好的效果。而对于不同的个体,很难使用单一被试模型识别每个个体的情绪,通过测量源域与目标域之间的域相似性,强关联相似性较强的源域,弱关联甚至剔除相似性较差的域,很大程度上提高了跨被试间情感识别准确度。

技术实现思路

[0004]本专利技术就脑电跨被试情绪识别问题中,主要提出利用基于Copula函数建模跨被试中脑电信号间非线性相关关系,以及叠加改进的最大均值差异(MMD)的计算方法计算类内间距的权重,并对源域数据进行筛选,使得筛选出的数据能够更好地进行迁移。
[0005]本专利技术的目的可以通过以下技术方案实现:
[0006]本专利技术将脑电数据基于域相似性进行选择,并对选择后的数据进行无监督分类,具体包括以下步骤:
[0007]步骤1.首先根据改进的MMD公式求出每一源域被试内的类间间距MMD(xi)并给出置信度;
[0008]步骤2.为能确定使用的Copula函数类型,方便比较源域与目标域的分布,首先对所选取的源域数据进行切分,每一被试每次实验的不同情绪类别中,将每一类情绪切分出来并与目标域整体均值构造联合分布,选取分析二者核分布估计选取Copula函数中的Frank
‑ꢀ
Copula函数并参数估计,求得参数估计值为18.1323;
[0009]步骤3.计算Frank

Copula函数的Kendall秩相关系数并叠加步骤1的置信度,设置阈值为1.5来选取部分的源域作为迁移对象进行迁移学习;
[0010]步骤4.对分布平衡进行自适应调节以平衡条件分布和边缘分布,然后更新目标域软标签,最后返回分类器输出分类准确度。
[0011]所述的步骤1中,MMD距离(Maximum mean discrepancy)是度量在再生核希尔伯特空间中两个分布的距离,公式理解就是求两堆数据在核空间中的均值距离。在脑电情绪识别源域选择中,本文实验了大量数据在MMD基础上改进了公式,用于计算源域内类间距离均
值差异并求和:
[0012]其数学表达式:
[0013][0014]C为源域内类别,MMD(xi)为某一被试的类内间距,D
s
对应的便是源域,n
s
对应的是单源域内的n个样本,f便是样本对应的映射函数;因为其是无穷维的,无法直接在原始空间中求解,故对式子进行平方,化简得到内积并利用核函数表达求解。其理解为单源域内的样本分布分别映射到再生希尔伯特空间中的对应的点,这样通过两个点的内积表示这两个分布的距离,最后求出距离和。
[0015]以传统迁移学习为基础,首先使用源域内类间均值和对不同的源域进行筛选后,再进行迁移学习并分类识别准确率,使用Pearson函数对结果进行相关性检验得到0.61的相关系数,属于显著相关,类内距离越大准确率相对越高。
[0016]所述的步骤2中,源域切分选取分析并选取Copula函数进行参数估计,具体步骤为:
[0017]2‑
1.每一被试每次实验的不同情绪类别中,分时段将一次实验按照标签分割成15个片段,为方便作为边缘分布进行拟合,将每一分段求取均值,目标域处理时将整个目标域片段求取均值进行相似度测量。
[0018]2‑
2.根据经验分布函数核分布估计近似总体分布类型,可以得到不同被试的脑电情绪分布图像尾部是不对称的,那么选择Archimedean

Copula对跨被试脑电情绪信号分布进行描述。
[0019]2‑
3.根据经验Copula函数与Copula函数的欧式距离进行度量,其距离越小表示 Copula函数拟合程度越好。
[0020]Archimedean

Copula函数中Frank

Copula距离为0.0467最小,故选取其进行建模。
[0021]所述的步骤3中,Kendall相关系数τ是对定类变量的统计,用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况,尤其针对脑电信号的分类。
[0022]其数学表达式:
[0023][0024]其中(x
i

x
j
),i,j=1,2,...,d是观测数据,sign是符号函数,τ值越大,变量间相关性越显著。
[0025]在所述的步骤4中,为避免特征失真,并定量评估边缘分布和条件分布的重要性,首先为应对消除退化特征,原始数据在Grassmann流形空间中学习了流形特征泛函g(.) 并引用了测地线流核(GFK)促进其域适应,通过动态分布对齐定量评价边缘分布和条件分布在域适应中的重要性。
[0026]其数学表达式:
[0027]μ∈[0,1]为自适应因子,D
f
为边缘分布,为条件分布,C为类别,通过计算A距离自适应μ值平衡两个分布的重要性,其数学表达式:
[0028][0029]d
M
为边缘A距离,d
c
为某一类的A距离,通过结构风险最小化(structuralriskminimization,SRM)原理对上述流形特征学习和动态分布对齐进行总结后得到如下损失函数表达式:
[0030]本专利技术有益效果如下:
[0031]针对脑电信号迁移学习中跨学科情感识别的准确性不可避免地下降是由于源域中某些数据的负迁移造成的问题,提出了一种新的方法来动态选择适合迁移学习的数据,并消除可能导致负迁移的源域数据;以情绪脑电信号作为特征提取对象,在流形嵌入分布对齐的方法进行改进,基于Copula函数和改进的MMD距离方法进行域相似性选择。切分每一源域的每一类次的的数据,通过非线性相似性分析找到与目标域更相近的源域并叠加单域内的类间间距,很大程度上筛选剔除了可能导致负迁移的数据,理论上该方法提高了情感分类的准确率,并极大地减少了计算机运算时间。
附图说明
[0032]图1为部分分类结果与源域中类内距离和的相关图像;
[0033]图2为部分跨被试的频率直方图对比;
[0034]图3为部分同被试不同时段的频率直方图对比;
[0035]图4为基于域相似性选择的流程图。
具体实施方式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于域相似性脑电跨被试源域选择方法,其特征在于,包括以下步骤:步骤1.首先根据改进的MMD公式求出每一源域被试内的类间间距MMD(xi)并给出置信度;步骤2.为能确定使用的Copula函数类型,方便比较源域与目标域的分布,对所选取的源域数据进行切分,每一被试每次实验的不同情绪类别中,将每一类情绪切分出来并与目标域整体均值构造联合分布,选取分析二者核分布估计选取Copula函数中的Frank

Copula函数并参数估计,求得参数估计值;步骤3.计算Frank

Copula函数的Kendall秩相关系数并叠加步骤1的置信度,设置阈值为1.5来选取部分的源域作为迁移对象进行迁移学习;步骤4.对分布平衡进行自适应调节以平衡条件分布和边缘分布,然后更新目标域软标签,最后返回分类器输出分类准确度。2.根据权利要求1所述的一种基于域相似性脑电跨被试源域选择方法,其特征在于,所述的步骤1中,MMD距离(Maximum mean discrepancy)是度量在再生核希尔伯特空间中两个分布的距离,在脑电情绪识别源域选择中,用于计算源域内类间距离均值差异并求和;其数学表达式:其中:C为源域内类别,MMD(x
i
)为某一被试的类内间距,D
s
对应的便是源域,n
s
对应的是单源域内的n个样本,f便是样本对应的映射函数;针对SEED数据集,以传统迁移学习为基础,使用源域内类间均值和对不同的源域进行筛选后,再进行迁移学习并分类识别准确率,使用Pearson函数对结果进行相关性检验得到0.61的相关系数,属于显著相关,类内距离越大准确率相对越高。3.根据权利要求1所述的一种基于域相似性脑电跨被试源域选择方法,其特征在于,所述的步骤2中,源域切分选取分析并选取Copula函数进行参数估计,具体步骤为:步骤2

1.分时段将一次实验按照标签分割成15个片段,为方...

【专利技术属性】
技术研发人员:赵伟程马玉良孙明旭申涛张启忠吴永琪
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1