System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物信息学,尤其涉及一种基于gu值的新型糖链结构鉴定方法。
技术介绍
1、糖链结构在许多生物过程中扮演着至关重要的角色,包括细胞识别、信号传导和免疫应答等。然而,由于糖链结构的复杂性和多样性,对其进行准确的鉴定一直是生物信息学中的一项挑战。传统上,质谱分析(ms)和核磁共振波谱(nmr)技术是鉴定糖链结构的主要手段,这些方法能够提供精确的分子量和部分结构信息。然而,质谱和nmr技术往往依赖于精确的分子量或序列匹配来鉴定糖链结构,对于一些高度复杂的糖链结构,特别是那些在分子量或序列上存在微小差异的糖链,这种方法的区分力不足,难以提供高效且精准的鉴定结果。此外,传统方法的实验过程复杂,分析时间长,通常需要大量的样本处理和数据分析,导致整个鉴定过程既耗时又费力。其次,现有的糖链结构数据库检索方法也存在局限性。这些方法通常基于分子量或序列的直接匹配,而缺乏有效的工具来处理由于修饰、连接方式或空间构象导致的糖链结构多样性,特别是在糖链样本结构复杂的情况下,现有技术难以实现快速的结构推断和匹配,严重影响了糖链结构鉴定的效率。因此,亟需一种新的方法,能够在复杂糖链结构的背景下提供更高效和更准确的鉴定手段,以应对现有技术的不足。
技术实现思路
1、针对上述存在的技术不足,本专利技术的目的是提出一种基于gu值的新型糖链结构鉴定方法,旨在通过引入gu值计算和深度学习模型,克服传统方法在鉴定效率和精确度上的局限,实现高效、准确地推断和鉴定未知糖链结构。
2、为解决上述技术问题,
3、优选地,所述步骤s10包括利用内标校准标准物样本的迁移时间;
4、优选地,所述步骤s10中的已知糖链的结构信息包括糖苷键类型、单糖单元、修饰基团、空间构象和分子量信息;
5、优选地,所述步骤s20中的数据清洗步骤包括去除冗余数据、填补缺失值以及标准化糖链结构信息;
6、优选地,所述步骤s30中,特征向量的生成包括使用分子指纹ecfp对糖链结构进行编码;
7、优选地,根据权利要求1所述的基于gu值的新型糖链结构鉴定方法,其特征在于,所述步骤s40还包括使用l2正则化防止模型过拟合;
8、优选地,所述基于gu值的新型糖链结构鉴定装置包括:
9、gu值计算模块,用于通过毛细管电泳实验获取未知糖链样本的迁移时间,并结合相邻标准物样本的迁移时间计算未知糖链样本的gu值;
10、数据收集与处理模块,用于收集已知糖链的结构信息并计算对应的gu值,将所述结构信息和对应的gu值整理成数据集,并经过数据清洗后将已知糖链结构以smiles形式表示;
11、特征向量生成模块,用于将已知糖链结构转换为已知糖链特征向量,同时将已知的gu值作为糖链结构模型的目标变量;
12、模型训练模块,用于将糖链结构特征向量排列得到糖链结构特征序列,选择图卷积网络模型处理所述序列,并使用交叉验证方法训练糖链结构模型;
13、相似度分析模块,用于将计算得到的未知糖链样本的gu值输入预先训练的糖链结构模型中,进行糖链结构相似度分析。
14、本专利技术的有益效果在于:相较于现有技术中依赖于精确分子量或序列匹配的糖链结构鉴定方法,在处理复杂糖链结构时,尤其是在样本结构复杂的条件下,难以实现高效、精准的鉴定。本专利技术通过采用gu值计算结合深度学习模型对糖链结构进行预测,从而能够高效、准确地推断未知糖链的结构,避免了现有技术中因复杂性高、耗时长而带来的限制,显著提高了糖链结构鉴定的效率和准确性。
本文档来自技高网...【技术保护点】
1.一种基于GU值的新型糖链结构鉴定方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于GU值的新型糖链结构鉴定方法,其特征在于,所述步骤S10包括利用内标校准标准物样本的迁移时间。
3.根据权利要求1所述的基于GU值的新型糖链结构鉴定方法,其特征在于,所述步骤S20中的已知糖链的结构信息包括糖苷键类型、单糖单元、修饰基团、空间构象和分子量信息。
4.根据权利要求1所述的基于GU值的新型糖链结构鉴定方法,其特征在于,所述步骤S20中的数据清洗步骤包括去除冗余数据、填补缺失值以及标准化糖链结构信息。
5.根据权利要求1所述的基于GU值的新型糖链结构鉴定方法,其特征在于,所述步骤S30中,特征向量的生成包括使用分子指纹ECFP对糖链结构进行编码。
6.根据权利要求1所述的基于GU值的新型糖链结构鉴定方法,其特征在于,所述步骤S40还包括使用L2正则化得到约束后的糖链结构模型。
7.一种基于GU值的新型糖链结构鉴定装置,其特征在于,所述基于GU值的新型糖链结构鉴定装置包括:
【技术特征摘要】
1.一种基于gu值的新型糖链结构鉴定方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于gu值的新型糖链结构鉴定方法,其特征在于,所述步骤s10包括利用内标校准标准物样本的迁移时间。
3.根据权利要求1所述的基于gu值的新型糖链结构鉴定方法,其特征在于,所述步骤s20中的已知糖链的结构信息包括糖苷键类型、单糖单元、修饰基团、空间构象和分子量信息。
4.根据权利要求1所述的基于gu值的新型糖链结构鉴定方法,其特征在于,所述步骤s2...
【专利技术属性】
技术研发人员:陈艳,陈功俊,
申请(专利权)人:安徽溯远分析仪器有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。