System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种骨质疏松伴动脉粥样硬化诊断生物标志物及列线图的构建、应用制造技术_技高网

一种骨质疏松伴动脉粥样硬化诊断生物标志物及列线图的构建、应用制造技术

技术编号:44406022 阅读:0 留言:0更新日期:2025-02-25 10:19
本发明专利技术属于医学生物分子技术领域,具体公开了一种骨质疏松伴随动脉粥样硬化的列线图构建方法,具体包括从GEO数据库获取GSE1428、GSE230665和GSE1000927数据集;利用Limma包,筛选出骨质疏松与正常组织、动脉粥样硬化与健康组织之间的差异表达基因;再对DEGs进行WGCNA分析,最后使用LASSO回归算法、随机森林与SVM‑RFE算法对差异表达基因进行筛选,得到潜在关键共同生物标志物;并基于关键共同生物标志物构建列线图,并绘制ROC曲线,评价候选共同生物标志物基因的诊断能力达到0.99。基于该列线图,提供一种预测系统,为骨质疏松伴动脉粥样硬化的临床诊断提供可视化依据。

【技术实现步骤摘要】

本专利技术属于医学生物分子,涉及一种骨质疏松伴动脉粥样硬化诊断生物标志物及列线图的构建,还涉及列线图应用。


技术介绍

1、骨质疏松(osteoporosis)是一种以骨密度降低和骨组织微结构破坏为特征的疾病,导致骨骼脆性增加,进而引发骨折风险上升。根据世界卫生组织(who)的定义,骨质疏松症是指因骨量减少和骨组织质量下降而导致的骨折风险增加的状态。该病常常被称为“隐形疾病”,因为在早期阶段,患者往往没有明显的症状,直到发生骨折才被确诊。骨质疏松症在女性中的发病率特别高,尤其是在绝经后,这与雌激素水平的下降密切相关。骨折不仅影响患者的生活质量,还可能导致长期的身体功能障碍和心理问题,增加医疗成本和社会负担。

2、动脉粥样硬化(atherosclerosis)是一种由于血管内脂质沉积、炎症反应及血管内皮损伤引起的动脉硬化性疾病。随着病情的发展,动脉壁逐渐增厚和弹性降低,血管腔变窄,最终可能导致心肌梗死、脑卒中等严重心脑血管事件。动脉粥样硬化的发生与多种因素相关,包括高血压、高血脂、糖尿病和吸烟等生活方式因素。该病在老年人群中尤为常见,是导致老年人群体心脑血管疾病的重要原因。

3、在一些老年群体中,骨质疏松伴随动脉粥样硬化发病的现象也比较多,传统的诊断方法可能只能基于临床症状或影像学检查,存在一定的局限性。早期诊断和干预对改善患者的预后至关重要。常规的影像学检查和生化指标监测虽可辅助诊断,但往往存在时效性差、准确性不足的问题。因此,识别新的生物标志物及建立起对应的列线图,尤其是在早期阶段,能够帮助临床医生更准确地评估骨质疏松伴动脉粥样硬化的风险,为患者提供个性化的治疗方案,从而提高疾病管理的效率和效果。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种骨质疏松相关的动脉粥样硬化诊断生物标志物及列线图的构建,还涉及基于列线图构建的骨质疏松伴随动脉粥样硬化预测或诊断的系统。

2、为达到上述目的,本专利技术提供如下技术方案:

3、1.一种骨质疏松伴随动脉粥样硬化预测或诊断的基因标志物,所述基因标志物为col1a1、smad2、pten或/和fbn1。

4、2.检测基因标志物表达水平的试剂在制备预测或诊断骨质疏松伴随动脉粥样硬化产品中的应用,所述基因标志物为col1a1、smad2、pten或/和fbn1。

5、3.一种骨质疏松伴随动脉粥样硬化的列线图构建方法,包括以下步骤:

6、1)从geo数据库获取gse1428、gse230665和gse1000927数据集;

7、2)利用limma包,设置了|log2倍数变化(fc)|>1.5和p<0.05,筛选出骨质疏松与正常组织、动脉粥样硬化与健康组织之间的差异表达基因;

8、3)利用基于pearson相关性的加权基因共表达网络分析识别动脉粥样硬化候选基因模块;

9、4)使用string数据库构建蛋白质-蛋白质相互作用网络并进行功能富集分析;

10、5)使用lasso回归算法、随机森林与svm-rfe算法对差异表达基因进行筛选,得到潜在共同生物标志物;

11、6)使用r软件包proc基于步骤5)的共同生物标志物构建列线图,评价候选共同生物标志物基因的诊断能力,并绘制roc曲线。

12、进一步,列线图构建方法中,步骤1)中数据集进行预处理,包括批次效应校正和缺失值处理。

13、进一步,列线图构建方法中,所述批次效应校正使用经验贝叶斯方法。

14、进一步,列线图构建方法中,所述缺失值处理,包括去除缺失值超过50%的基因和样本,再使用r包“impute”中的“impute.knn”函数对缺失值进行了填补。

15、进一步,“impute.knn”函数中邻居数量设置为10。

16、进一步,列线图构建方法中,lasso回归采用三折交叉验证,随机森林采用十折交叉验证,svm-rfe采用五折交叉验证来评估各自算法的诊断价值。

17、进一步,列线图构建方法中,lasso回归的λ值为0.0639847346226388。

18、4.一种用于骨质疏松伴随动脉粥样硬化预测或诊断的列线图,所述列线图中由上至下依次排列七行标尺:

19、第一行标尺为分值标尺,分值范围为0~100;

20、第二行标尺为col1a1基因表达量,数值范围为6.5~12;6.5对应分值标尺上的分值0,12对应分值标尺上的分值100;

21、第三行标尺为smad2基因表达量,数值范围为5.5~4.4;5.5对应分值标尺上的分值0,4.4对应分值标尺上的分值范围72-74;

22、第四行标尺为pten基因表达量,数值范围为5.6~7.4;7.4对应分值标尺上的分值0,5.6对应分值标尺上的分值范围75-77;

23、第五行标尺为fbn1基因表达量,数值范围为5.5~6.9;6.9对应分值标尺上的分值0,5.5对应分值标尺上的分值范围37~40;

24、第六行标尺为总分值标尺,数值范围为0~260;由第二行标尺至第五行标尺对应分值标尺的数值总和得到总分值;

25、第七行标尺为骨质疏松伴随动脉粥样硬化发病预测概率,由第六行总分值通过列线图预测模型计算得到。

26、进一步,骨质疏松伴随动脉粥样硬化发病预测概率在0.1~0.99,对应总分标尺的162~182。

27、5.一种骨质疏松伴随动脉粥样硬化预测或诊断的系统,包括上述列线图。

28、本专利技术的有益效果在于:本专利技术提供一种骨质疏松伴随动脉粥样硬化的列线图构建方法,以及基于该方法得到预测或诊断骨质疏松伴随动脉粥样硬化的基因标志物为col1a1、smad2、pten或/和fbn1,以及相应的列线图,并基于列线图构建骨质疏松伴随动脉粥样硬化发病概率的预测系统,为骨质疏松伴动脉粥样硬化的临床诊断提供可视化依据。本专利技术通过调整lasso回归中的λ值、优化随机森林的参数设置,以及svm-rfe的特征选择策略,最终选择最优的参数组合,以最小化预测误差并提高模型的诊断准确性,筛选出具有极高诊断价值的关键生物标志物,通过制roc曲线可知,筛选的生物标志物共同诊断能力达到0.99,具有极高的临床诊断应用价值。进一步对探讨骨质疏松与动脉粥样硬化的关联,对改善老年患者的综合管理和治疗策略具有重要的临床意义。

本文档来自技高网...

【技术保护点】

1.一种骨质疏松伴随动脉粥样硬化预测或诊断的基因标志物,其特征在于,所述基因标志物为COL1A1、SMAD2、PTEN或/和FBN1。

2.检测权利要求1所述基因标志物表达水平的试剂在制备预测或诊断骨质疏松伴随动脉粥样硬化产品中的应用。

3.一种骨质疏松伴随动脉粥样硬化的列线图构建方法,其特征在于,包括以下步骤:

4.根据权利要求3所述列线图构建方法,其特征在于,步骤1)中数据集进行预处理,包括批次效应校正和缺失值处理。

5.根据权利要求4所述列线图构建方法,其特征在于,所述缺失值处理,包括去除缺失值超过50%的基因和样本,再使用R包“impute”中的“impute.knn”函数对缺失值进行了填补。

6.根据权利要求3所述列线图构建方法,其特征在于,LASSO回归采用三折交叉验证,随机森林采用十折交叉验证,SVM-RFE采用五折交叉验证来评估各自算法的诊断价值。

7.根据权利要求3所述列线图构建方法,其特征在于,LASSO回归的λ值为0.0639847346226388。

8.一种由权利要求2-7任一项构建方法得到的列线图,其特征在于,所述列线图中由上至下依次排列七行标尺:

9.根据权利要求8所述的骨质疏松伴随动脉粥样硬化预测或诊断的系统,其特征在于,骨质疏松伴随动脉粥样硬化发病预测概率在0.1~0.99,对应总分标尺的162~182。

10.一种骨质疏松伴随动脉粥样硬化预测或诊断的系统,其特征在于,包括权利要求8或9所述列线图。

...

【技术特征摘要】

1.一种骨质疏松伴随动脉粥样硬化预测或诊断的基因标志物,其特征在于,所述基因标志物为col1a1、smad2、pten或/和fbn1。

2.检测权利要求1所述基因标志物表达水平的试剂在制备预测或诊断骨质疏松伴随动脉粥样硬化产品中的应用。

3.一种骨质疏松伴随动脉粥样硬化的列线图构建方法,其特征在于,包括以下步骤:

4.根据权利要求3所述列线图构建方法,其特征在于,步骤1)中数据集进行预处理,包括批次效应校正和缺失值处理。

5.根据权利要求4所述列线图构建方法,其特征在于,所述缺失值处理,包括去除缺失值超过50%的基因和样本,再使用r包“impute”中的“impute.knn”函数对缺失值进行了填补。

6.根据权...

【专利技术属性】
技术研发人员:周晓丽孙祥钱智勇
申请(专利权)人:天津市疾病预防控制中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1