一种数据评测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35702214 阅读:38 留言:0更新日期:2022-11-23 14:56
本公开提供了一种数据评测方法、装置、电子设备及存储介质,该方法包括:获取待评测特征数据,其中,所述待评测特征数据为测序仪器对任一批次的样本基因数据进行测序后得到的;利用至少一种异常值检测算法,对所述待评测特征数据进行检测,确定所述待评测特征数据对应的数据测试结果;其中,所述数据测试结果用于指示所述待评测特征数据内处于异常状态的测序流通槽信息、拍摄视场的视场标识、视场数量、测序循环数的循环标识、循环数量中的至少一种;基于所述待评测特征数据对应的数据检测结果,生成针对所述测序仪器的测序评测结果。生成针对所述测序仪器的测序评测结果。生成针对所述测序仪器的测序评测结果。

【技术实现步骤摘要】
一种数据评测方法、装置、电子设备及存储介质


[0001]本公开涉及高通量测序
,具体而言,涉及一种数据评测方法、装置、电子设备及存储介质。

技术介绍

[0002]随着高通量测序技术的研究与发展,测序的数据量在不断的增加,测序数据会存在质量好坏的差别,其中,高质量的测序数据是科学研究和临床诊断的保障;低质量的测序数据能够影响试验结果的准确性,且对于后续分析也会造成较大的失误,造成人力成本浪费,故对测序数据的质量控制尤为重要。
[0003]因此,提出一种可以较快速和较准确地对测序数据进行评测的方法尤为重要。

技术实现思路

[0004]有鉴于此,本公开至少提供一种数据评测方法、装置、电子设备及存储介质。
[0005]第一方面,本公开提供了一种数据评测方法,包括:
[0006]获取待评测特征数据,其中,所述待评测特征数据为测序仪器对任一批次的样本基因数据进行测序后得到的;
[0007]利用至少一种异常值检测算法,对所述待评测特征数据进行检测,确定所述待评测特征数据对应的数据测试结果;其中,所述数据测试结果用于指示所述待评测特征数据内处于异常状态的测序流通槽信息、拍摄视场的视场标识、视场数量、测序循环数的循环标识、循环数量中的至少一种;
[0008]基于所述待评测特征数据对应的数据检测结果,生成针对所述测序仪器的测序评测结果。
[0009]上述方法中,在测序仪器对任一批次的样本基因数据进行测序后,可以获取到样本基因数据对应的待评测特征数据;再利用至少一种异常值检测算法,对待评测特征数据进行检测,确定待评测特征数据对应的数据测试结果;异常值检测算法为常见的数据处理算法,该算法能够在普通计算机上实现,且该算法处理数据的效率较高,实现较快速、较高效的确定数据测试结果。再可以基于待评测特征数据对应的数据检测结果,较准确的生成针对测序仪器的测序评测结果;在保障评测准确度的前提,实现了对测序仪器输出数据的快速评估。同时,该数据测试结果能够用于指示待评测特征数据内处于异常状态的拍摄视场的视场标识和/或视场数量,故基于该数据检测结果可以实现异常定位,比如确定存在异常的拍摄视场Grid。
[0010]一种可能的实施方式中,在生成针对所述测序仪器的测序评测结果之后,所述方法还包括:
[0011]在所述测序评测结果指示所述测序仪器输出数据合格的情况下,生成第一反馈信息,其中所述第一反馈信息用于指示对所述测序仪器的输出数据进行生物学信息评估;
[0012]在所述测序评测结果指示所述测序仪器输出数据不合格的情况下,生成第二反馈
信息,其中,所述第二反馈信息用于指示基于所述数据测试结果确定测试调整策略。
[0013]上述方法中,基于针对测序仪器的测序评测结果,可以较快速的确定是否能够对测序仪器的输出数据进行生物学信息评估。比如,若测序评测结果指示测序仪器输出数据合格,则可以生成用于指示对测序仪器的输出数据进行生物学信息评估的第一反馈信息;若测序评测结果指示测序仪器输出数据不合格,则表示该输出数据存在异常,无需对测序仪器的输出数据进行生物学信息评估,并可以生成用于指示基于数据测试结果确定测试调整策略的第二反馈信息,再次进行样本基因数据的测序,减小了测序的时间成本。
[0014]一种可能的实施方式中,所述获取待评测特征数据,包括:
[0015]在所述测序仪器对所述任一批次的样本基因数据进行测序,得到输出数据之后,从所述输出数据中获取与本次测序结果相关的至少一个测序文件;
[0016]基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据。
[0017]这里,从输出数据中获取与本次测序结果相关的至少一个测序文件;并基于至少一个测序文件包括的测序信息,生成待评测特征数据,以便后续利用待评测特征数据对测序仪器的本次测序过程进行评测。
[0018]一种可能的实施方式中,在从所述输出数据中获取与本次测序结果相关的至少一个测序文件之后,所述方法还包括:
[0019]确定至少一个待测参数;
[0020]针对每个所述待测参数,确定所述至少一个测序文件包括的测序信息中,与所述待测参数匹配的目标信息是否存在缺失,得到信息检查结果;
[0021]所述基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据,包括:
[0022]响应于所述信息检查结果指示为不存在缺失,基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据。
[0023]一种可能的实施方式中,所述基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据,包括:
[0024]针对各个最小拍摄视场中每个测序循环数,从所述至少一个测序文件包括的测序信息中,确定与所述测序循环数匹配的至少一种特征数据的特征值;
[0025]基于各个所述测序循环数对应的所述至少一种特征数据的特征值,生成所述待评测特征数据。
[0026]一种可能的实施方式中,所述利用至少一种异常值检测算法,对所述待评测特征数据进行检测,确定所述待评测特征数据对应的数据测试结果,包括:
[0027]利用至少一种异常值检测算法,对所述待评测特征数据包括的各种特征数据进行异常值检测,确定每种所述异常值检测算法输出的各种所述特征数据分别对应的异常值;
[0028]基于每种所述异常值检测算法输出的各种所述特征数据分别对应的异常值,确定所述异常值检测算法输出的所述待评测特征数据对应的数据测试结果。
[0029]本公开实施例中,通过采用至少一种异常值检测算法对待评测特征数据进行异常值检测,可以较快速的得到异常值检测算法输出的各种特征数据分别对应的异常值;并利用各种特征数据分别对应的异常值,能够较快速和较准确的确定待评测特征数据对应的数据测试结果,以便可以利用数据测试结果对测序仪器的输出数据的质量进行检测。
[0030]一种可能的实施方式中,所述异常值检测算法为多种,所述基于所述待评测特征数据对应的数据检测结果,生成针对所述测序仪器的测序评测结果,包括:
[0031]将各种所述异常值检测算法输出的所述待评测特征数据对应的数据检测结果进行取交集处理,确定所述待评测特征数据对应的目标检测结果;
[0032]在所述目标检测结果指示所述待评测特征数据内处于异常状态的拍摄视场的视场数量大于设置的数量阈值,生成用于指示所述测序仪器输出数据不合格的测序评测结果。
[0033]这里,在异常值检测算法为多种的情况下,通过对各种异常值检测算法输出的待评测特征数据对应的数据检测结果进行取交集处理,可以较准确的确定待评测特征数据对应的目标检测结果;并基于目标检测结果指示待评测特征数据内处于异常状态的拍摄视场的视场数量和设置的数量阈值,较准确的生成针对测序仪器的测序评测结果,在保障评测准确度的基础上提高了评测效率。同时,本方案使用异常值检测算法对待评测特征数据进行检测,无需专业人员进行评测,降低了评测的难度,提高了评测的灵活性和广泛性。...

【技术保护点】

【技术特征摘要】
1.一种数据评测方法,其特征在于,包括:获取待评测特征数据,其中,所述待评测特征数据为测序仪器对任一批次的样本基因数据进行测序后得到的;利用至少一种异常值检测算法,对所述待评测特征数据进行检测,确定所述待评测特征数据对应的数据测试结果;其中,所述数据测试结果用于指示所述待评测特征数据内处于异常状态的测序流通槽信息、拍摄视场的视场标识、视场数量、测序循环数的循环标识、循环数量中的至少一种;基于所述待评测特征数据对应的数据检测结果,生成针对所述测序仪器的测序评测结果。2.根据权利要求1所述的方法,其特征在于,在生成针对所述测序仪器的测序评测结果之后,所述方法还包括:在所述测序评测结果指示所述测序仪器输出数据合格的情况下,生成第一反馈信息,其中所述第一反馈信息用于指示对所述测序仪器的输出数据进行生物学信息评估;在所述测序评测结果指示所述测序仪器输出数据不合格的情况下,生成第二反馈信息,其中,所述第二反馈信息用于指示基于所述数据测试结果确定测试调整策略。3.根据权利要求1所述的方法,其特征在于,所述获取待评测特征数据,包括:在所述测序仪器对所述任一批次的样本基因数据进行测序,得到输出数据之后,从所述输出数据中获取与本次测序结果相关的至少一个测序文件;基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据。4.根据权利要求3所述的方法,其特征在于,在从所述输出数据中获取与本次测序结果相关的至少一个测序文件之后,所述方法还包括:确定至少一个待测参数;针对每个所述待测参数,确定所述至少一个测序文件包括的测序信息中,与所述待测参数匹配的目标信息是否存在缺失,得到信息检查结果;所述基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据,包括:响应于所述信息检查结果指示为不存在缺失,基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据。5.根据权利要求3或4所述的方法,其特征在于,所述基于所述至少一个测序文件包括的测序信息,生成所述待评测特征数据,包括:针对各个最小拍摄视场中每个测序循环数,从所述至少一个测序文件包括的测序信息中,确定与所述测序循环数匹配的至少一种特征数据的特征值;基于各个所述测序循环数对应的所述至少...

【专利技术属性】
技术研发人员:王丹阳陈懂懂袁静贤
申请(专利权)人:郑州思昆生物工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1