口腔微生物群落检测模型的构建方法技术

技术编号:14140570 阅读:72 留言:0更新日期:2016-12-10 16:09
本发明专利技术涉及微生物检测模型领域,具体的说是一种口腔微生物群落检测模型的构建方法。本发明专利技术包括以下步骤:数据收集,数据筛选,数据剔除,模型的初步构建和模型的优化。本发明专利技术的模型对象采集处理简易、无侵害性、成本低、检测对象相对简单;建模优化方法易于操作、数据处理高效、检测能力强。

【技术实现步骤摘要】

本专利技术涉及微生物检测模型领域,具体的说是一种口腔微生物群落检测模型的构建方法及其应用。
技术介绍
寄生于人体的大量共生菌群作为后天禀赋的主要承载者与人体的健康息息相关。目前认为共生微生物可作为人体的第二基因组,其遗传信息的总和被称为微生物组(microbiome),赋予人类不依赖于自身进化而获得的复杂个体特征。因此,全面认识人体共生菌群的基础上,才能深度揭示其对人体健康或疾病状态的影响,从而构建微生物群落存在及变化情况与特定的疾病之间的联系。口腔系统是连通人体内外的交通枢纽,为人体共生菌群非常重要的栖息位点,其包括牙齿生态区、牙周生态区、口腔黏膜生态区、唾液生态区等多个生态区,其微生物群落结构复杂,这些微生物以细菌为主,也有少量真菌、病毒、古细菌的存在。口腔菌群失调与口腔疾病如龋齿、牙龈炎、牙周炎等发生发展有关,甚至与全身性疾病如糖尿病、心血管疾病、胰腺癌等具有显著相关。维持口腔菌群结构和功能的健康平衡状态,对于人体健康具有深刻而不容忽视的重大意义。此外,与血液和尿液作为疾病诊断媒介相比,口腔位点采样具有低侵害性、低成本、样品采集和处理简易、快捷等优势。现有的检测模型构建的数据通常是通过横向研究方法而获得,即比较健康人群和疾病人群的特征而获得特定特征健康和疾病差异。但慢性疾病发展的不同阶段存在变异性;而疾病的同一发展阶段在不同个体间亦存在一定异质性,如可受到宿主基因、免疫、生活习惯等因素影响。而年龄(时间)因素对于诊断数据也有着深刻而不容忽视的影响。这些基于单时间点的横断面研究方法,忽略时间轴上健康状态下的自然变异和疾病状态下的特殊变异等特征,无法真实揭示疾病的机制,极大降低了所筛选出的标记物的精确性和鲁棒性,从而极大限制了诊断和监测方法的性能。此外,对于疾病诊断采样通常集中于单一位点, 如血液样品或尿液样品等。但不同位点提供的有效信息存在差异,目前对于不同采样位点对于同一种疾病诊断的是否具有优劣性,是否不同位点对于疾病诊断存在互补性均较少考察。因此,多数诊断方法和模型止步于生物因子的筛选后简单建模,未将其方法和模型进一步优化和完善,限制了其临床转化和应用前景。因此,好的诊断方法应考察不同参数以优化方法,使其自身具备高敏感性、高特异性,同时在临床应用上应满足高通量、易操作、无侵害性和低成本等要求。
技术实现思路
针对现有技术中存在的上述不足之处,本专利技术要解决的技术问题是提供一种口腔微生物群落检测模型的构建方法及其应用。本专利技术为实现上述目的所采用的技术方案是:一种口腔微生物群落检测模型的构建方法,包括以下步骤:数据收集:在待收集人群中收集口腔微生物群落数据,并随着待收集人群的年龄增长,收集多个时间点的口腔微生物群落数据,并在所述待收集人群中区分出在患有牙病人群和未患有牙病人群在多个时间点上的口腔微生物群落数据;数据筛选:在所述未患有牙病人群在多个时间点上的口腔微生物群落数据中,筛选出于年龄相关的微生物群落;数据剔除:在所述患有牙病人群在多个时间点上的口腔微生物群落数据中,剔除数据筛选步骤得到的微生物群落的数据成分;模型的初步构建:利用数据剔除步骤得到的口腔微生物群落数据,初步构建口腔微生物群落检测模型;模型的优化:分别考察种系发育水平和不同生态位点对于初步模型的效能的影响,并进一步在不影响模型性能前提下根据模型变量对模型性能重要性程度精简变量,最终确定优化的模型。所述口腔微生物群落数据为高通量测序手段获得微生物群落的16s RNA或 全基因组信息。所述数据筛选,具体为:利用随机森林回归分析方法处理健康人群多时间点口腔微生物群落数据,分别筛选出具有区分年龄能力的微生物标记物。所述模型的初步构建,包括以下步骤:(1)从患有牙病人群多时间点口腔微生物群落数据中去除数据筛选步骤所得的年龄相关的微生物数据;(2)利用随机森林二分类方法处理已进行剔除步骤的患有牙病人群多时间点的口腔微生物群落数据,建立初步检测模型。所述模型的优化,包括以下步骤:(1)分别建立不同种系发育水平检测模型;(2)基于各种系发育水平建立不同生态位点的检测模型;(3)确定可最优化模型的种系发育水平和生态位点后,定量此条件下检测模型的每个变量对模型的重要性程度,评价在不降低模型性能前提最简化的变量组合数目,从而确定最终优化模型。所述种系发育水平包括门、纲、目、科、属、种共六个水平所述生态位点包括单一生态位点和多个生态位点组合的复合生态位点。所述模型用作检测口腔疾病发生的可能性评价。本专利技术具有以下优点及有益效果:1.模型对象采集处理简易、无侵害性、成本低、检测对象相对简单;2.建模优化方法易于操作、数据处理高效、检测能力强;3.模型应用广泛:其应用对象不仅适用于大规模人群筛选,也可针对个体实现最终监测;其应用形式不仅可检测口腔微生物宿主此时状态,也可预测宿主未来可能发生状态。附图说明图1为本专利技术方法的实施流程图;图2为本专利技术实施提供的实验设计图;图3为本专利技术实施提供的口腔微生物群落结构特征图;图4为本专利技术实施提供的口腔微生物群落功能特征图;图5为本专利技术实施提供的通过随机森林回归方法筛选出与年龄相关的口腔微生物及其功能组成热图;图6为本专利技术实施提供的基于随机森林二分类方法不同种系发育水平和位点的疾病检测模型的准确率箱状图。具体实施方式下面结合附图及实施例对本专利技术做进一步的详细说明。本专利技术以利用口腔牙菌斑和唾液微生物群落构建和优化儿童口腔状态的检测模型作为实施例(图1),包括下列内容:(1)收集儿童口腔健康状态临床信息(表1):对广州市南方中英文幼儿园全日制儿童的口腔健康进行追踪调查,每半年检查一次,持续一年三次检查,之后再间隔一年进行检查,根据三次调查记录的儿童dmfs(龋,失,补牙数)指数,根据本研究目的选择具有下述三类口腔健康变化特征的儿童纳入此课题研究:①健康对照组(H2H组):口腔龋病状况始终保持健康的17名儿童;②龋病发生组(H2C组):口腔龋病状况经历从健康到龋病新发过程的21名儿童;③龋病进展组(C2C组):口腔龋病状况经历从已患龋到龋病发展过程的12名儿童。入选标准包括:年龄约4岁,20颗乳牙全部萌出,排除标准包括:有全身系统性疾病和牙周、口臭等口腔疾患,三个月未服用抗生素。选取所有入选儿童的三次口腔检查时所取的龈上牙菌斑和唾液样品共计284个,按照dmfs指数进行如下分类:低龋样品(LC,0<dmfs<6)39个,重症婴幼儿龋样品(SC,dmfs≥6)29个,健康对照样品(H,dmfs=0)74个。无论低龋和高龋样品均为龋病样品。而其中健康对照样品分为绝对健康样品和相对健康样品:绝对健康样品是指两个时间点均为健康的前一个时间点的样本;对应地,如果宿主某一时间为健康状态,但在下一个时间点口腔情况为龋病状态,其健康状态样品即定义为相对健康样本。就整个实验流程各项细节及以后的数据公布等事宜 征得志愿者监护人同意,并签署知情同意书。调查方法:由两名牙体牙髓专科医生以视诊结合探诊的方式进行检查,检查器械高温高压消毒,必要时借助棉签去除软垢。检查前统一认识、方法和标准,标准一致性检验的Kappa值均大于0.92。采用世界卫生组织《口腔健康调查基本方法》(1997年)对龋病的诊断标准。冠龋诊断标准:牙齿的窝沟点隙或光滑面本文档来自技高网
...
口腔微生物群落检测模型的构建方法

【技术保护点】
一种口腔微生物群落检测模型的构建方法,其特征在于,包括以下步骤:数据收集:在待收集人群中收集口腔微生物群落数据,并随着待收集人群的年龄增长,收集多个时间点的口腔微生物群落数据,并在所述待收集人群中区分出在患有牙病人群和未患有牙病人群在多个时间点上的口腔微生物群落数据;数据筛选:在所述未患有牙病人群在多个时间点上的口腔微生物群落数据中,筛选出于年龄相关的微生物群落;数据剔除:在所述患有牙病人群在多个时间点上的口腔微生物群落数据中,剔除数据筛选步骤得到的微生物群落的数据成分;模型的初步构建:利用数据剔除步骤得到的口腔微生物群落数据,初步构建口腔微生物群落检测模型;模型的优化:分别考察种系发育水平和不同生态位点对于初步模型的效能的影响,并进一步在不影响模型性能前提下根据模型变量对模型性能重要性程度精简变量,最终确定优化的模型。

【技术特征摘要】
1.一种口腔微生物群落检测模型的构建方法,其特征在于,包括以下步骤:数据收集:在待收集人群中收集口腔微生物群落数据,并随着待收集人群的年龄增长,收集多个时间点的口腔微生物群落数据,并在所述待收集人群中区分出在患有牙病人群和未患有牙病人群在多个时间点上的口腔微生物群落数据;数据筛选:在所述未患有牙病人群在多个时间点上的口腔微生物群落数据中,筛选出于年龄相关的微生物群落;数据剔除:在所述患有牙病人群在多个时间点上的口腔微生物群落数据中,剔除数据筛选步骤得到的微生物群落的数据成分;模型的初步构建:利用数据剔除步骤得到的口腔微生物群落数据,初步构建口腔微生物群落检测模型;模型的优化:分别考察种系发育水平和不同生态位点对于初步模型的效能的影响,并进一步在不影响模型性能前提下根据模型变量对模型性能重要性程度精简变量,最终确定优化的模型。2.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述口腔微生物群落数据为高通量测序手段获得微生物群落的16s RNA或全基因组信息。3.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述数据筛选,具体为:利用随机森林回归分析方法处理健康人群多时间点口腔微生物群落数据,分别筛选出具有...

【专利技术属性】
技术研发人员:滕飞杨芳黄适凌均棨徐健
申请(专利权)人:中国科学院青岛生物能源与过程研究所中山大学附属口腔医院
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1