System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种骨肉瘤基因的识别方法、装置、设备及存储介质制造方法及图纸_技高网

一种骨肉瘤基因的识别方法、装置、设备及存储介质制造方法及图纸

技术编号:41197897 阅读:19 留言:0更新日期:2024-05-07 22:25
本申请公开了一种骨肉瘤基因的识别方法、装置、设备及存储介质,通过筛选骨肉瘤与正常组织之间的差异表达基因集并进行批次效应去除;通过Lasso回归算法和SVM‑RFE算法分别对差异表达基因集进行筛选,得到关键生物标志物;并获取关键生物标志物中表达水平上调最高的PLVAP基因作为生物标志物。本申请旨在基于生物信息学和机器学习来识别OS的新型诊断基因,且本申请分析了两个GEO数据集(GSE19276和GSE33383)以确定OS和健康标本之间的DEGs,基于机器学习分析了DEGs在OS中的诊断价值,最后,本申请针对筛选出的关键基因进行抑制并进行体外表型实验确认了参与OS进展的新的关键基因。

【技术实现步骤摘要】

本申请涉及基因检测,尤其涉及一种骨肉瘤基因的识别方法、装置、设备及存储介质


技术介绍

1、骨肉瘤是一种最常见的原发恶性骨肿瘤,一般青少年群体中发病率较高,目前在临床上针对骨肉瘤的治疗手段多采用手术切除并结合全身化疗以控制微转移瘤。尽管原发性骨肉瘤患者的五年生存率约为70%,但由于骨肉瘤的特异性较大,进展的转移性或复发性疾病患者的预后并不理想,总生存率仅20%左右。特别是一些在初诊时就已经确定发生肿瘤转移的患者,其五年生存率更低于20%。根据目前的研究进展来看,针对性治疗骨肉瘤的靶向化疗药物或更加完善的临床治疗方案尚未成型。因此,寻找合适的生物标志物对骨肉瘤进行早期监测及临床靶向治疗具有重要的意义。

2、近年已发现许多特定基因参与os的进展。例如,与正常软骨相比,os患者trim35(tripartite motif家族成员)的表达水平要高得多。研究表明,trim35可以通过影响介导上皮-间充质转化(epithelial–mesenchymal transition,emt)能力,消除上皮细胞的极化,从而促进间质细胞的转移,进一步增加骨肉瘤癌细胞的生长侵袭能力。神经膜蛋白2(neurogenin2,nrsn2)是一种小神经元膜蛋白,定位于神经细胞中的小囊泡中。keremua等通过生物信息学分析方法在geo数据库找出nran2蛋白,发现其在骨肉瘤组织中高度表达。经过研究证实,nrsn2通过直接影响pi3k/akt/mtor信号传导和间接影响wnt/β-连环蛋白信号传导来促进骨肉瘤细胞在体内的生长侵袭。这些发现提示了一些功能基因在os进展中的重要作用。然而,许多基因的潜在诊断价值尚未在os中得到研究。


技术实现思路

1、本申请的主要目的在于提供一种骨肉瘤基因的识别方法、装置、设备及存储介质,以解决现有技术中骨肉瘤基因的关键基因尚不明确的问题。

2、为实现上述目的,本申请提供如下技术方案:

3、一种骨肉瘤基因的识别方法,所述识别方法包括:

4、通过limma软件包筛选骨肉瘤与正常组织之间的第一差异表达基因集;

5、通过gse19276数据集与gse33383数据集对所述第一差异表达基因集进行批次效应去除,得到第二差异表达基因集;

6、通过lasso回归算法和svm-rfe算法分别对所述第二差异表达基因集进行筛选,得到第一潜在生物标志物和第二潜在生物标志物;

7、获取所述第一潜在生物标志物与所述第二潜在生物标志物相互重叠的部分作为关键生物标志物;

8、获取所述关键生物标志物中mmp13基因、plvap基因、spp1基因的表达水平上调的生物标志物;

9、获取所述mmp13基因、所述plvap基因、所述spp1基因中auc最高的plvap基因并定义为骨肉瘤基因。

10、作为本申请的进一步改进,通过gse19276数据集与gse33383数据集对所述第一差异表达基因集进行批次效应去除,得到第二差异表达基因集,包括:

11、通过预设策略所述gse19276数据集和所述gse33383数据集;

12、将所述gse19276数据集和所述gse33383数据集组合为一个数据队列;

13、通过sva和所述limma软件包消除所述数据队列的批处理影响。

14、作为本申请的进一步改进,通过lasso回归算法和svm-rfe算法分别对所述第二差异表达基因集进行筛选,得到第一潜在生物标志物和第二潜在生物标志物,包括:

15、通过所述lasso回归算法的g lmnet包筛选所述第二差异表达基因集,获取所述第二差异表达基因集中表达水平上调的生物标志物,并作为基于所述骨肉瘤与所述正常组织的诊断性生物标志物;

16、通过所述svm-rfe算法对所述第二差异表达基因集进行训练,获取所述第二差异表达基因集中表达水平上调的生物标志物,并作为基于所述骨肉瘤与所述正常组织的诊断性生物标志物的潜在生物标志物。

17、作为本申请的进一步改进,获取所述mmp13基因、所述plvap基因、所述spp1基因中auc最高的plvap基因并定义为骨肉瘤基因,之后,包括:

18、敲减所述骨肉瘤的骨肉瘤细胞中的plvap基因;

19、对敲减后的骨肉瘤细胞进行mg63细胞增殖;

20、判断敲减后的骨肉瘤细胞的增殖速率相比于正常的骨肉瘤细胞是否具有第一预设幅度的下降;

21、若是,则判断敲减后的骨肉瘤细胞的凋亡速率相比于正常的骨肉瘤细胞是否具有第二预设幅度的提升;

22、若是,则将所述plvap基因判定为所述骨肉瘤基因。

23、作为本申请的进一步改进,获取所述mmp13基因、所述plvap基因、所述spp1基因中auc最高的plvap基因并定义为骨肉瘤基因,之后,包括:

24、制备所述plvap基因的蛋白晶体结构;

25、以ythdf1蛋白晶体结构为分子对接受体,通过libdock分子对接程序确定所述plvap基因的蛋白晶体结构与所述ythdf1蛋白晶体结构的最佳配体结合位点;

26、在预设数据库中筛选出plvap基因的小分子抑制剂;

27、通过libdock分子对接程序获取所述小分子抑制剂中评分最高的laminin分子;

28、基于所述最佳配体结合位点通过libdock分子对接程序对接所述laminin分子和所述ythdf1蛋白晶体结构,形成配体分子;

29、判断所述配体分子的增殖速率相比于正常的骨肉瘤细胞是否具有第一预设幅度的下降;

30、若是,则判断所述配体分子的凋亡速率相比于正常的骨肉瘤细胞是否具有第二预设幅度的提升;

31、若是,则将所述plvap基因判定为所述骨肉瘤基因。

32、作为本申请的进一步改进,通过所述lasso回归算法的glmnet包筛选所述第二差异表达基因集,获取所述第二差异表达基因集中表达水平上调的生物标志物,并作为基于所述骨肉瘤与所述正常组织的诊断性生物标志物,包括:

33、将表达水平上调的幅度作为输入节点(xi,yi),通过式(1)定义所述诊断性生物标志物的代价函数:

34、

35、其中,l(yi,β0+βtxi)为观测第i个输入节点的负对数似然,为elastic-net正则化项,β为学习变量,w为权重系数,α=1为指定使用lasso回归;

36、根据式(2)定义所述代价函数的权重系数w:

37、

38、初始化所述权重系数至零向量;

39、依次将其中一个权重系数作为变量、其他权重系数定义为上一次计算产生的常量;

40、求解出当前条件下只有一个权重系数变量的情况下的最优解;

41、进行第一预设次数的迭代,求解出最后一次迭代的最优解并作为表达水平上调的幅度大于等于第一预设本文档来自技高网...

【技术保护点】

1.一种骨肉瘤基因的识别方法,其特征在于,所述识别方法包括:

2.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,通过GSE19276数据集与GSE33383数据集对所述第一差异表达基因集进行批次效应去除,得到第二差异表达基因集,包括:

3.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,通过Lasso回归算法和SVM-RFE算法分别对所述第二差异表达基因集进行筛选,得到第一潜在生物标志物和第二潜在生物标志物,包括:

4.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,获取所述MMP13基因、所述PLVAP基因、所述SPP1基因中AUC最高的PLVAP基因并定义为骨肉瘤基因,之后,包括:

5.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,获取所述MMP13基因、所述PLVAP基因、所述SPP1基因中AUC最高的PLVAP基因并定义为骨肉瘤基因,之后,包括:

6.根据权利要求3所述的骨肉瘤基因的识别方法,其特征在于,通过所述Lasso回归算法的Glmnet包筛选所述第二差异表达基因集,获取所述第二差异表达基因集中表达水平上调的生物标志物,并作为基于所述骨肉瘤与所述正常组织的诊断性生物标志物,包括:

7.根据权利要求6所述的骨肉瘤基因的识别方法,其特征在于,通过所述SVM-RFE算法对所述第二差异表达基因集进行训练,获取所述第二差异表达基因集中表达水平上调的生物标志物,并作为基于所述骨肉瘤与所述正常组织的诊断性生物标志物的潜在生物标志物,包括:

8.一种骨肉瘤基因的识别装置,所述骨肉瘤基因的识别装置应用于如权利要求1至7之一所述的骨肉瘤基因的识别方法,其特征在于,所述骨肉瘤基因的识别装置包括:

9.一种电子设备,其特征在于,包括处理器、以及与所述处理器耦接的存储器,所述存储器存储有可被所述处理器执行的程序指令;所述处理器执行所述存储器存储的所述程序指令时实现如权利要求1至7中任一项所述的骨肉瘤基因的识别方法。

10.一种存储介质,其特征在于,所述存储介质内存储有程序指令,所述程序指令被处理器执行时能够实现如权利要求1至7中任一项所述的骨肉瘤基因的识别方法。

...

【技术特征摘要】

1.一种骨肉瘤基因的识别方法,其特征在于,所述识别方法包括:

2.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,通过gse19276数据集与gse33383数据集对所述第一差异表达基因集进行批次效应去除,得到第二差异表达基因集,包括:

3.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,通过lasso回归算法和svm-rfe算法分别对所述第二差异表达基因集进行筛选,得到第一潜在生物标志物和第二潜在生物标志物,包括:

4.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,获取所述mmp13基因、所述plvap基因、所述spp1基因中auc最高的plvap基因并定义为骨肉瘤基因,之后,包括:

5.根据权利要求1所述的骨肉瘤基因的识别方法,其特征在于,获取所述mmp13基因、所述plvap基因、所述spp1基因中auc最高的plvap基因并定义为骨肉瘤基因,之后,包括:

6.根据权利要求3所述的骨肉瘤基因的识别方法,其特征在于,通过所述lasso回归算法的glmnet包筛选...

【专利技术属性】
技术研发人员:唐志方李川徐永清
申请(专利权)人:中国人民解放军联勤保障部队第九二〇医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1