基于基因组学和微生物组学的遗传性胃癌评估方法及系统技术方案

技术编号:36574743 阅读:20 留言:0更新日期:2023-02-04 17:32
本发明专利技术涉及基因分析技术领域,具体为一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统,本发明专利技术方法包括:获取遗传性胃癌患者的数据,遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将遗传性胃癌患者的数据分为训练集和测试集并进行预处理,构建基于AdaBoost算法优化的BP神经网络的预测模型,通过训练集对预测模型进行训练,通过测试集对预测模型进行验证,通过预测模型对人患胃癌进行评估;本发明专利技术通过患者的基因组学和微生物组学数据,构建基于AdaBoost算法优化的BP神经网络的预测模型,实现对患胃癌的准确预测。实现对患胃癌的准确预测。实现对患胃癌的准确预测。

【技术实现步骤摘要】
基于基因组学和微生物组学的遗传性胃癌评估方法及系统


[0001]本专利技术涉及基因分析
,具体为一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统。

技术介绍

[0002]由于传统饮食起居文化,患者往往无法正确区分胃肠道疾病和障碍(GI Diseases and Disorders)如消化不良胃炎和感染和胃癌和结肠癌,往往未有及时就诊或误诊;对于医生,仍依靠传统的临床学形态和影像学为主要方法,无法及时准确致病性肠道微生物群落种类和患者体细胞和生殖细胞基因变异,虽然上述临床表型未有明显变化,而在癌症前期和早期癌症和有关微生物(细胞和分子水平上)的往往具有明显变化;由于对患者无法分层,严重影像治疗方案和有效性。从1964年和1999年日本和韩国,通过血清胃蛋白酶原(pepsinogen,PG)与幽门螺杆菌(Helicobacterpylori,HP)抗体联合法(即“ABC法”)分别启动国家胃癌筛查计划;2019年,美国对45~75岁的人群开展通过高灵敏的粪便检测结合结直肠镜的筛查。2018年,我国“消化道肿瘤筛查及早诊早治项目”启动,在2030年实现胃肠道早期癌症诊断率提高到20%,胃肠道癌5年生存率提高至50%的目标。及时早期高效地发现肿瘤早期病灶和癌前病变,是改变我国消化道肿瘤防治严峻形势的可行且高效的途径。

技术实现思路

[0003]针对上述现有技术的不足,本专利技术旨在提供一种基于基因组学和微生物组学的遗传性胃癌评估方法和系统,以实现对患遗传性胃癌的评估。
[0004]为了解决上述问题,本专利技术采用了如下的技术方案:一方面,本专利技术提供一种基于基因组学和微生物组学的遗传性胃癌评估系统,包括数据获取模块、预测模型构建模块和预测模块;所述数据获取模块,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;所述预测模型构建模块,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;所述预测模块,用于通过所述预测模型对人患遗传性胃癌进行评估。
[0005]进一步,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。
[0006]进一步,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;
初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
[0007]进一步,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,其中,是原始数据集中的最小值,是原始数据集中的最大值,x是原始数据,y是归一化之后的数据。
[0008]进一步,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
[0009]进一步,所述预测误差E
i
通过下式进行计算:其中,为BP神经网络,、为训练样本;所述相对误差e
ti
通过下式计算:所述计算误差率通过下式进行计算:其中,m为迭代次数,为权重;所述计算所述基学习器在最终强学习器中所占的权重a
t
,通过下式进行计算:所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值D
t+1
:其中,。
[0010]进一步,所述用于通过所述预测模型对人患遗传性胃癌进行评估,包括:所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分
与所述患病几率相乘得评估评分。
[0011]另一方面,本专利技术提供一种基于基因组学和微生物组学的遗传性胃癌评估方法,包括:获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;通过所述预测模型对人患遗传性胃癌进行评估。
[0012]进一步,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
[0013]进一步,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
[0014]本专利技术的有益效果在于:本专利技术提供的一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统,通过基因组学、微生物组学数据对遗传性胃癌进行预测,结合AdaBoost算法对BP神经网络进行优化,构建得到预测模型,使得对患遗传性胃癌的预测更为准确。
附图说明
[0015]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步的详细描述,其中:图1为本专利技术实施例一种基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,包括数据获取模块、预测模型构建模块和预测模块;所述数据获取模块,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;所述预测模型构建模块,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;所述预测模块,用于通过所述预测模型对人患遗传性胃癌进行评估。2.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。3.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。4.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,其中,是原始数据集中的最小值,是原始数据集中的最大值,x是原始数据,y是归一化之后的数据。5.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。6.根据权利要求5所述基...

【专利技术属性】
技术研发人员:沈成国许峥许娟史文钊
申请(专利权)人:神州医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1