单分子光谱特征识别模型的训练方法、光谱特征识别方法技术

技术编号：43195162 阅读：28 留言：0更新日期：2024-11-01 20:16

一种单分子的光谱特征识别模型的训练方法、光谱特征识别方法，其中训练方法包括：采用模拟数据集对光谱特征识别模型进行训练，得到初步训练的光谱特征识别模型，模拟数据集包括多张仿真光谱信息样本图像和对应的光谱质心标签；获取真实数据集，真实数据集包括多张真实光谱信息样本图像和对应的光谱质心伪标签；以模拟数据集为源域数据，以真实数据集为目标域数据，对初步训练的光谱特征识别模型进行域适应训练，得到训练完成的光谱特征识别模型。本发明专利技术基于机器学习模型进行单分子的光谱特征识别，通过采用本申请的训练方法训练得到的光谱特征识别模型进行单分子的光谱特征识别，能够有效地提高识别精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及光谱分析，具体涉及单分子光谱特征识别模型的训练方法、光谱特征识别方法。

技术介绍

1、对生物体系内的动态过程进行观测对于理解生命活动的内在机制具有重要意义。很多生物动态过程发生在毫秒时间尺度和纳米空间尺度上，同时大多受到细胞微环境参数的影响。荧光光谱是研究生物分子性质的关键工具，可以探测如ph值、极性、粘度和分子排列等在内的环境变化，揭示细胞的环境参数，使在分子水平上研究生物分子相互作用动力学等过程成为可能。

2、荧光光谱是荧光染料分子吸收特定波长的激发光的光子后发射出的荧光的光谱。荧光染料分子的荧光光谱可以指示环境参数的变化，例如通过分析荧光光谱的特征如光谱质心等，可以监测细胞微环境的变化。由于需要在纳米空间尺度上进行成像，因此每次采集只能获得单个荧光染料分子的光谱分布信息。而目前测量光谱的方式主要可以分为基于荧光分光光度计和基于色散棱镜的多光谱超分辨成像技术两种方法。传统的基于分光光度计的方法通常测量一群分子的平均效应，这对于细胞内的单分子分析并不理想。基于色散棱镜的多光谱超分辨成像技术能够精确观察和测量复杂生物环境中的单个分子，然而由于荧光信号较微弱，加之背景荧光等因素的影响，信噪比较差，这种情况下传统的识别荧光光谱特征的方法精度较低。

技术实现思路

1、本专利技术主要解决的技术问题是单分子的信噪比较低导致其光谱质心的识别精度较低。

2、根据第一方面，一种实施例中提供一种单分子的光谱特征识别模型的训练方法，所述光谱特征识别模型用于识别单分

3、获取模拟数据集，所述模拟数据集包括多张仿真光谱信息样本图像和对应的光谱质心标签，所述仿真光谱信息样本图像为仿真的单分子的光谱信息图像；

4、将所述仿真光谱信息样本图像输入光谱特征识别模型进行光谱质心的识别，得到第一光谱质心预测结果；

5、根据标签预测损失函数对光谱特征识别模型进行训练，得到初步训练的光谱特征识别模型，所述标签预测损失函数根据所述第一光谱质心预测结果和对应的光谱质心标签构建；

6、获取真实数据集，所述真实数据集包括多张真实光谱信息样本图像和对应的光谱质心伪标签，所述真实光谱信息样本图像为在实际环境中采集的单分子的光谱信息图像；

7、以所述模拟数据集为源域数据，以所述真实数据集为目标域数据，对所述初步训练的光谱特征识别模型进行域适应训练，得到训练完成的光谱特征识别模型。

8、一些实施例中，所述标签预测损失函数为：

9、，

10、其中 n s是所述模拟数据集中仿真光谱信息样本图像的数量， y s, i表示所述模拟数据集中的第 i张仿真光谱信息样本图像对应的光谱质心标签，表示所述模拟数据集中的第 i张仿真光谱信息样本图像的第一光谱质心预测结果。

11、一些实施例中，所述光谱特征识别模型包括图像特征提取网络和回归预测网络，所述将所述仿真光谱信息样本图像输入所述光谱特征识别模型进行光谱质心的识别，得到第一光谱质心预测结果，包括：

12、通过所述图像特征提取网络对所述仿真光谱信息样本图像进行特征提取，得到第一特征向量；

13、将所述第一特征向量输入所述回归预测网络进行光谱质心的回归预测，得到所述第一光谱质心预测结果。

14、一些实施例中，所述图像特征提取网络包括线性投影层和transformer编码器，所述transformer编码器为transformer模型的编码器部分，所述transformer编码器能够接收包括 n p+1个输入向量的输入向量序列，并输出包括 n p+1个输出向量的输出向量序列；

15、所述通过所述图像特征提取网络对所述仿真光谱信息样本图像进行特征提取，得到第一特征向量，包括：

16、将所述仿真光谱信息样本图像等分为 n p个图像块；其中， n p为不小于2的整数；

17、将所述 n p个图像块输入所述线性投影层进行线性变换，得到所述 n p个图像块各自的嵌入向量；

18、分别为每个所述图像块和预设的类别嵌入向量配置一位置编码向量，将每个所述图像块的嵌入向量与相应的位置编码向量相加得到该图像块的表示向量，将所述类别嵌入向量与相应的位置编码向量相加得到类别表示向量；

19、将所述类别表示向量作为所述输入向量序列的第一个输入向量，并分别将所述 n p个图像块的表示向量作为所述输入向量序列的后 n p个输入向量，输入所述transformer编码器，从所述transformer编码器输出的输出向量序列中，获取到所述第一特征向量，其中，所述第一特征向量为所述输出向量序列的第一个输出向量。

20、一些实施例中，所述回归预测网络为多层感知机。

21、一些实施例中，对所述初步训练的光谱特征识别模型进行域适应训练，得到训练完成的光谱特征识别模型，包括：

22、将所述模拟数据集和所述真实数据集混合，得到混合数据集；

23、从所述混合数据集读取光谱信息样本图像输入所述初步训练的光谱特征识别模型进行光谱质心的识别，得到第二光谱质心预测结果；

24、在所述初步训练的光谱特征识别模型中增加梯度反转层，所述梯度反转层位于所述图像特征提取网络和所述回归预测网络之间，用于在前向传递期间，充当恒等函数，使数据不加更改地通过，在反向传递期间，将梯度乘以一个负常数后向后传递；

25、从所述混合数据集读取光谱信息样本图像输入增加梯度反转层的所述初步训练的光谱特征识别模型进行光谱质心的识别，得到对抗性预测结果；

26、根据域适应损失函数对所述初步训练的光谱特征识别模型进行训练，得到训练完成的光谱特征识别模型；其中，所述域适应损失函数根据所述第二光谱质心预测结果、对抗性预测结果、所述仿真光谱信息样本图像对应的光谱质心标签和所述真实光谱信息样本图像对应的光谱质心伪标签构建。

27、一些实施例中，所述域适应损失函数由源域的回归损失函数、目标本文档来自技高网...

【技术保护点】

1.一种单分子的光谱特征识别模型的训练方法，其特征在于，所述光谱特征识别模型用于识别单分子的光谱质心，所述光谱质心为单分子的光谱中强度最大峰所对应的波长，所述训练方法包括：

2.如权利要求1所述的训练方法，其特征在于，所述标签预测损失函数为：

3.如权利要求1所述的训练方法，其特征在于，所述光谱特征识别模型包括图像特征提取网络和回归预测网络，所述将所述仿真光谱信息样本图像输入所述光谱特征识别模型进行光谱质心的识别，得到第一光谱质心预测结果，包括：

4.如权利要求3所述的训练方法，其特征在于，所述图像特征提取网络包括线性投影层和Transformer编码器，所述Transformer编码器为Transformer模型的编码器部分，所述Transformer编码器能够接收包括Np+1个输入向量的输入向量序列，并输出包括Np+1个输出向量的输出向量序列；

5.如权利要求3所述的训练方法，其特征在于，所述回归预测网络为多层感知机。

6.如权利要求3所述的训练方法，其特征在于，对所述初步训练的光谱特征识别模型进行域适应训练，得到训

7.如权利要求6所述的训练方法，其特征在于，所述域适应损失函数由源域的回归损失函数、目标域的回归损失函数和回归边缘差异不一致性损失函数组成；

8.如权利要求7所述的训练方法，其特征在于，所述域适应损失函数为：

9.如权利要求1至8中任一项所述的训练方法，其特征在于，所述光谱质心伪标签通过以下方式确定：对处于与采集所述真实光谱信息样本图像时单分子所处的环境相同的环境下的荧光小球，多次采集其光谱，并计算得到这多次采集的光谱的平均光谱，获取所述平均光谱的强度最大峰所对应的波长作为所述光谱质心伪标签。

10.一种单分子的光谱特征识别方法，其特征在于，包括：

11.如权利要求10所述的光谱特征识别方法，其特征在于，所述单分子的光谱信息图像由所述单分子的光强图像和所述单分子的色散光谱图像拼接得到，其中，所述单分子的光强图像和所述单分子的色散光谱图像分别由所述单分子被激发后发出的发射光分成的两路光形成，其中一路光直接在图像传感器上成像形成所述光强图像，另一路光被色散棱镜色散后在所述图像传感器上成像形成所述色散光谱图像。

12.一种计算机可读存储介质，其特征在于，所述介质上存储有程序，所述程序能够被处理器执行以实现如权利要求1至9中任一项所述的训练方法或者如权利要求10至11中任一项所述的光谱特征识别方法。

...

【技术特征摘要】

2.如权利要求1所述的训练方法，其特征在于，所述标签预测损失函数为：

4.如权利要求3所述的训练方法，其特征在于，所述图像特征提取网络包括线性投影层和transformer编码器，所述transformer编码器为transformer模型的编码器部分，所述transformer编码器能够接收包括np+1个输入向量的输入向量序列，并输出包括np+1个输出向量的输出向量序列；

5.如权利要求3所述的训练方法，其特征在于，所述回归预测网络为多层感知机。

6.如权利要求3所述的训练方法，其特征在于，对所述初步训练的光谱特征识别模型进行域适应训练，得到训练完成的光谱特征识别模型，包括：

7.如权利要求6所述的训练方法，其特征在于，所述域适应损失函数由...

【专利技术属性】
技术研发人员：侯尚国，沙浩，张永兵，
申请(专利权)人：深圳湾实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人