一种墨水分类和溯源的方法技术

技术编号:35737217 阅读:20 留言:0更新日期:2022-11-26 18:39
本发明专利技术公开一种墨水分类和溯源的方法,包括:建立一个全彩色喷墨打印墨水质谱数据库,墨水质谱数据库为通过实时直接分析质谱方法在大气压下对物质的原始状态进行快速和直接的分析获得;通过实时直接分析质谱方法获得待溯源样品的墨水质谱数据;两质谱数据均是按照质谱图像上的每个像素点为最小数据单元,将墨水质谱数据库和样品墨水质谱数据一起进行质谱对齐和标准化预处理后形成质谱峰矩阵;对质谱峰矩阵进行降维处理,将降维处理后的数据作为质谱特征数据,质谱成像技术对降维数据进行可视化,直接呈现墨水之间的不同,或者进一步使用卷积神经网络(CNN)模型对质谱特征数据进行分类和溯源。经本申请实现对墨水品牌和型号进行稳健的高准确率的溯源。进行稳健的高准确率的溯源。进行稳健的高准确率的溯源。

【技术实现步骤摘要】
一种墨水分类和溯源的方法


[0001]本专利技术涉及司法笔迹鉴定的
,特别是涉及一种墨水分类和溯源的方法。

技术介绍

[0002]在司法笔迹鉴定中,墨水分析是法庭科学领域的重要工作之一,通常包含区分两种或多种墨水是否相同,以及预测墨水的来源,如品牌、型号、种类等。针对区别两种或几种墨水及区分墨水是否相同的技术任务学术界的研究较多,其中质谱分辨率高、定性能力好,是一种有效的墨水区分方法,主要解决的是两种或多种墨水之间的鉴别问题,主要是墨水的分类。墨水的质谱成像技术能够在同一视场内,对不同墨水的质谱或处理后的质谱进行分析和可视化,在墨水分析中具有独特的优势。目前的研究具有局限性,即墨水需要在同一载体上小区域进行一次性检测后成像,尚未有直接应用于同一载体不同区域、不同载体(分离载体)等不能一次性检测成像的情况。
[0003]而当前墨水的溯源研究较少,尚不能满足法庭科学墨水溯源的实际需求。预测墨水的来源(如品牌、型号、种类等)任务需要建立一个庞大的数据库,采用质谱法和质谱技术是墨水分析的有效手段,但质谱数据是一种高维数组,在海量数据库种检索和匹配的分析工作量巨大,无论人工视觉观察判断还是计算机自动化辅助判断难度都很大。
[0004]墨水溯源需要一个庞大的墨水数据库和高效的溯源方法,当前的技术方法普遍缺少一个高质量的墨水数据库作为背景数据,没有对同一墨水和不同墨水质谱数据的变化规律进行系统的研究,因此解决这项任务的技术还不够成熟。在法庭科学实践中,无法有效提供墨水的溯源信息,在应用上存在严重的瓶颈问题。<br/>
技术实现思路

[0005]本专利技术的目的是提供一种墨水分类和溯源的方法,能够实现对海量高维质谱数据进行降维和可视化,质谱成像是一种快速、直观的墨水分类方法,具有高度的溯源准确性,实现科学、准确的判断墨水的来源。
[0006]为实现上述技术目的,本专利技术提供一种墨水分类和溯源的方法,其包括:建立一个全彩色喷墨打印墨水质谱数据库,其中:所述墨水质谱数据库为通过实时直接分析质谱方法在大气压下对物质的原始状态进行快速和直接的分析获得;通过所述实时直接分析质谱方法获得待溯源样品的墨水质谱数据;所述墨水质谱数据库和所述样品墨水质谱数据均是按照质谱图像上的每个像素点为最小数据单元,将所述墨水质谱数据库和所述样品墨水质谱数据一起进行质谱对齐和标准化预处理后形成质谱峰矩阵;对所述质谱峰矩阵进行降维处理,将所述降维处理后的数据作为质谱特征数据;采用质谱成像技术对所述质谱特征数据进行可视化后并进行如下方法分类和溯源:直接观察质谱成像图上墨水之间的不同,以作为法庭科学墨水分析中一种快速、直观的分类方法;对于质谱成像未发现差异的墨水,进一步使用卷积神经网络模型以对所述待溯源样品中的墨水品牌和型号分别进行分类和溯源。
[0007]本专利技术提供一种墨水溯源方法,其创造基于一个全彩色(黑色、品红、黄色、蓝色)喷墨打印墨水的实时直接分析质谱(DART-MS)数据库,同时对样品墨水建立样品墨水质谱数据,对两数据利用降维技术帮助对海量高维质谱数据进行降维,质谱成像技术对降维数据进行可视化,直接呈现墨水之间的不同,可作为法庭科学墨水分析中一种快速、直观的分类方法;对于质谱成像未发现差异的墨水,进一步使用卷积神经网络模型对所述质谱特征数据进行分类和溯源,对同一墨水、不同墨水、墨水品牌和型号质谱的变化进行了系统的研究,以质谱数据库为背景信息,为科学、准确的判断墨水的来源提供了坚实的基础。
[0008]作为进一步的改进,所述待溯源样品包括:背景材料和所述背景材料上的墨水材料。
[0009]作为进一步的改进,所述墨水材料在所述背景材料上呈现为文字、线条、色块或图案中的至少一种形式。
[0010]作为进一步的改进,所述样品墨水质谱数据的获得过程为:在相同条件和相同质谱方法下分别获得:包括所述背景材料和所述墨水材料在内的整体样品质谱数据,和排除所述墨水材料而获得的背景材料质谱数据;在所述整体样品质谱数据中扣除背景材料质谱数据,以获得所述样品墨水质谱数据。
[0011]作为进一步的改进,所述降维处理采用:主成分分析方法、非负矩阵分解方法和概率潜在语义分析方法中的至少一种进行降维处理。
[0012]作为进一步的改进,在采用所述主成分分析方法、非负矩阵分解方法和概率潜在语义分析方法进行降维处理时,概率潜在语义分析方法参数选择包括:变化阈值等于0.01。
[0013]作为进一步的改进,在同时采用所述主成分分析方法、所述非负矩阵分解方法和所述概率潜在语义分析方法进行降维处理时,分别选取所述主成分分析方法降维处理后的300个维度数据,所述非负矩阵分解方法降维处理后的前300个维度数据,和所述概率潜在语义分析方法降维处理后的前300个维度数据,以形成共3
×
300维度的融合数据作为所述质谱特征数据。
[0014]作为进一步的改进,所述分类和溯源中,其中80%的数据作为训练集,剩余20%的数据作为测试集。
[0015]作为进一步的改进,在质谱成像比较上,所述主成分分析方法和所述非负矩阵分解方法的成像效果接近,但所述非负矩阵分解方法在成像的层次上更丰富;所述概率潜在语义分析方法与所述主成分分析方法和所述非负矩阵分解方法在成像效果上存在差异,三种方法之间存在成像效果优势互补的关系,所述主成分分析方法和所述非负矩阵分解方法对不同品牌的墨水显示明显的区别,所述概率潜在语义分析方法对相同品牌不同型号墨水显示区别。
[0016]作为进一步的改进,在所述实时直接分析质谱方法中,采用实时直接分析离子源、高分辨质谱仪、实时直接分析软件、Xcalibur软件、赛默飞QExactive软件。
[0017]作为进一步的改进,在所述实时直接分析质谱方法中的参数包括:45
°
角吹扫模块,离子源解离气体为氦气,温度为250℃,X-Y图像测试模式,X轴速度为1毫米/秒,Y轴速度为1毫米/秒,X轴的测试时间设定为0.25分,所述Xcalibur软件建立方法的参数为:正离子模式全扫描,扫描范围为50~750m/z,分辨率为35000FWHM,网格电压为150V。
[0018]作为进一步的改进,在所述实时直接分析质谱方法中包括样品检测步骤序列,所
述样品检测步骤序列包括:对所述待溯源样品的确定标准样品区域,在所述样品区域中进行序列步进。
[0019]作为进一步的改进,所述样品区域的长度为1.5厘米,高度0.5厘米,所述序列步进的顺序是在所述样品区域内沿所述高度内平均分成5个检测行,自最低检测行逐行并与上一行首尾相连直至上升到最高检测行,且每一行检测100个点。
[0020]作为进一步的改进,所述质谱图像包括:一次性检测成像的情况和无法一次性检测成像的情况,所述无法一次性检测成像的情况包括:同一载体的不同区域成像和不同载体成像,对于所述无法一次性检测成像墨水,先分别进行检测然后融合成一个质谱图像,所述墨水质谱数据库和所述样品墨水质谱数据采用的所述质谱图像的格式为imzML格式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种墨水分类和溯源的方法,其包括:建立一个全彩色喷墨打印墨水质谱数据库,其特征在于:所述墨水质谱数据库为通过实时直接分析质谱方法在大气压下对物质的原始状态进行快速和直接的分析获得;通过所述实时直接分析质谱方法获得待溯源样品的墨水质谱数据;所述墨水质谱数据库和所述样品墨水质谱数据均是按照质谱图像上的每个像素点为最小数据单元,将所述墨水质谱数据库和所述样品墨水质谱数据一起进行质谱对齐和标准化预处理后形成质谱峰矩阵;对所述质谱峰矩阵进行降维处理,将所述降维处理后的数据作为质谱特征数据;采用质谱成像技术对所述质谱特征数据进行可视化后并进行如下方法分类和溯源:(1)直接观察质谱成像图上墨水之间的不同,以作为法庭科学墨水分析中一种快速、直观的分类方法;(2)对于质谱成像未发现差异的墨水,进一步使用卷积神经网络模型以对所述待溯源样品中的墨水品牌和型号分别进行分类和溯源。2.根据权利要求1所述的一种墨水分类和溯源的方法,其特征在于:所述待溯源样品包括:背景材料和所述背景材料上的墨水材料。3.根据权利要求2所述的一种墨水分类和溯源的方法,其特征在于:所述墨水材料在所述背景材料上呈现为文字、线条、色块或图案中的至少一种形式。4.根据权利要求3所述的一种墨水分类和溯源的方法,其特征在于:所述样品墨水质谱数据的获得过程为:在相同条件和相同质谱方法下分别获得:包括所述背景材料和所述墨水材料在内的整体样品质谱数据,和排除所述墨水材料而获得的背景材料质谱数据;在所述整体样品质谱数据中扣除背景材料质谱数据,以获得所述样品墨水质谱数据。5.根据权利要求1所述的一种墨水分类和溯源的方法,其特征在于:所述降维处理采用:主成分分析方法、非负矩阵分解方法和概率潜在语义分析方法中的至少一种进行降维处理。6.根据权利要求5所述的一种墨水分类和溯源的方法,其特征在于:在采用所述主成分分析方法、非负矩阵分解方法和概率潜在语义分析方法进行降维处理时,概率潜在语义分析方法参数选择包括:变化阈值等于0.01。7.根据权利要求6所述的一种墨水分类和溯源的方法,其特征在于:在同时采用所述主成分分析方法、所述非负矩阵分解方法和所述概率潜在语义分析方法进行降维处理时,分别选取所述主成分分析方法降维处理后的300个维度数据,所述非负矩阵分解方法降维处理后的前300个维度数据,和所述概率潜在语义分析方法降维处理后的前300个维度数据,以形成共3
×
300维度的融合数据作为所述质谱特征数据。8.根据权利要求7所述的一种墨水分类和溯源的方法,其特征在于:所述分类和溯源中,其中80%的数据作为训练集,剩余20%的数据作为测试集。9.根据权利要求8所述的一种墨水分类和溯源的方法,其特征在于:在质谱成像比较上,所述主成分分析方法和所述非负矩阵分解方法的成像效果接近,但所述非负矩阵分解方法在成像的层次上更丰富;所述概率潜在语义分析方法与所述主成分分析方法和所述非
负矩阵分解方法在成像效果上存在差异,三种方法之间存在成像效果优势互补的关系,所述主成分分析方法和所述非负矩阵分解方法对不同品牌的墨水显示明显的区别,所述概率潜在语义分析方法对相同品牌不同型号墨水显示区别。10.根据权利要求9所述的一种...

【专利技术属性】
技术研发人员:陈晓红杨旭张敬伟汤昊张清华王雅晨
申请(专利权)人:司法鉴定科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1