中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型制造技术

技术编号:35364189 阅读:31 留言:0更新日期:2022-10-29 18:03
本发明专利技术公开了一种中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,涉及中药技术领域,所述中药抗大肠杆菌活性预测模型和所述中药抗金黄色葡萄球菌活性预测模型包括以下步骤:构建中药抗大肠杆菌和金黄色葡萄球菌活性数据库。本发明专利技术通过人工对中药抗大肠杆菌和金黄色葡萄球菌文献进行检索,建立中药抗大肠杆菌和金黄色葡萄球菌数据库,挖掘中药抗菌的影响因素,建立中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,可使两个模型的AUC值分别为77.5%和80%,达到预测准确率较高的效果,极大的节省了实验法判断中药抗菌活性的时间经济成本。济成本。

【技术实现步骤摘要】
中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型


[0001]本专利技术涉及一种中药抗菌活性预测模型,特别涉及一种中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型。

技术介绍

[0002]据世界卫生组织报道,抗菌药物的滥用已成为全球危机。由抗菌药物引发的疾病越来越多,可供临床选择的抗菌药物越来越局限,寻找替代抗生素的天然药物成为热点话题。中药作为我国最珍贵、最有价值的资源之一,具有“多成分、多靶点”的特点,且不易产生耐药性,不仅如此,还具有延缓、消除细菌耐药性的作用,在传染病的治疗方面有着悠久的历史。
[0003]目前研究中药抗菌的文献很多,但大多数采用实验的方法判断中药是否具有抗菌活性,实验周期长、成本高、盲目选用中药等情况加大了科研工作者利用中药解决抗菌问题的难度,随着人工智能技术的不断发展,利用数据分析和计算机预测的方法,挖掘中药抗菌活性的影响因素,并进行预测模型的构建,既能缩短实验周期、降低实验成本,还能对选用抗菌中药提供指导作用,是大批量筛选抗菌中药的最优选择。

技术实现思路

[0004]本专利技术的目的在于提供一种中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,以解决上述
技术介绍
中提出的目前研究中药抗菌的文献很多,但大多数采用实验的方法判断中药是否具有抗菌活性,实验周期长、成本高、盲目选用中药等情况加大了科研工作者利用中药解决抗菌问题的难度的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,所述中药抗大肠杆菌活性预测模型和所述中药抗金黄色葡萄球菌活性预测模型包括以下步骤:
[0006]S1:构建中药抗大肠杆菌和金黄色葡萄球菌活性数据库:通过人工对中药抗菌文献进行检索,获取关键信息,补充中药的四气、五味、归经、功效、主治信息,根据中药拉丁名称补充中药的科属信息;
[0007]S2:挖掘中药抗菌的影响因素:通过频数分析、关联规则挖掘以及构建系统发育树的方法发现影响中药抗菌活性的特征信息;
[0008]S3:根据挖掘的特征集合建立中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,具体的选择机器学习算法包括以下步骤:
[0009]a1:对特征集合进行预处理,包括删除特征信息不全的中药数据,将因变量转变成适合分类模型的因子变量;
[0010]a2:使用递归特征消除法进行特征的选择,以模型的预测能力作为特征选择的衡量标准;
[0011]a3:选择机器学习算法,通过建立中药抗菌预测模型的受试者工作特征曲线,计算
曲线下面积,比较每种模型的性能,对各模型预测能力进行评估;
[0012]a4:对筛选出来的模型进行参数优化,通过网格调参法和随机调参法相结合的方式,遍历所有模型的参数组合,以得到最佳的模型;
[0013]a5:最后采用预测模型对未经验证的中药进行预测,并利用实验进行预测结果的验证,获得两种模型预测的准确率。
[0014]S4:最终根据以上步骤筛选得到中药抗大肠杆菌活性模型算法是经Bagged CART选择后的NN,中药抗金黄色葡萄球菌活性模型算法是经LDA选择后的NN。
[0015]作为本专利技术的一种优选技术方案,所述S1步骤中获取的关键信息包括中药名称、菌种名称、具体的抗菌指标、活性。
[0016]作为本专利技术的一种优选技术方案,所述S2步骤中影响中药抗菌活性的特征信息包括:四气、五味、归经、科属。
[0017]作为本专利技术的一种优选技术方案,所述四气包括寒、热、平,所述五味包括酸、苦、甘、辛、咸,所述归经包括肝、心、脾、肺、肾、胆、小肠、胃、大肠、膀胱、心包、三焦,所述科属包括界、门、纲、目、科、属。
[0018]与现有技术相比,本专利技术的有益效果是:
[0019]本专利技术通过人工对中药抗大肠杆菌和金黄色葡萄球菌文献进行检索,建立中药抗大肠杆菌和金黄色葡萄球菌数据库,挖掘中药抗菌的影响因素,建立中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,可使两个模型的AUC值分别为77.5%和80%,达到预测准确率较高的效果,极大的节省了实验法判断中药抗菌活性的时间经济成本。
附图说明
[0020]图1为本专利技术的模型构建步骤示意图。
具体实施方式
[0021]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]请参阅图1,本专利技术提供了一种中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,所述中药抗大肠杆菌活性预测模型和所述中药抗金黄色葡萄球菌活性预测模型包括以下步骤:
[0023]S1:构建中药抗大肠杆菌和金黄色葡萄球菌活性数据库:通过人工对中药抗菌文献进行检索,获取关键信息,补充中药的四气、五味、归经、功能、主治信息,根据中药拉丁名称补充中药的科属信息;
[0024]S2:挖掘中药抗菌的影响因素:通过频数分析、关联规则挖掘以及构建系统发育树的方法发现影响中药抗菌活性的特征信息;
[0025]S3:根据挖掘的特征集合建立中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,具体的选择机器学习算法包括以下步骤:
[0026]a1:对特征集合进行预处理,包括对数据特征进行编码:利用“是则记为1,不是则
记为0”的原则记录中药的四气、五味、归经特征,采用1、2、3

n的方式记录科属特征;转换数据类型:将因变量转变成适合分类模型的因子变量;对数据进行分割:将数据划分为80%的训练集和20%的测试集;对数据进行标准化和中心化;
[0027]a2:将经过特征选择的不同数据集均采用随机森林(RF)、K最近邻(KNN)、分类与回归树(CART)、支持向量机(SVM)、朴素贝叶斯(NB)、神经网络(NN)六种机器学习算法建立模型,每种算法都使用5次10折交叉验证;
[0028]a3:使用递归特征消除法进行特征的选择,以模型的预测能力作为特征选择的衡量标准,分别拟合随机森林(RF)、朴素贝叶斯(NB)和Bagged分类与回归树(Bagged CART),线性判别分析(LDA)四种函数,每种函数都使用10折交叉验证;
[0029]a4:通过建立中药抗菌预测模型的受试者工作特征曲线(ROC曲线),计算曲线下面积(AUC),比较每种模型的性能,对各模型预测能力进行评估;
[0030]a5:为了进一步优化模型的性能,对筛选出来的模型进行参数优化,通过网格调参法和随机调参法相结合的方式,遍历所有模型的参数组合,以得到最佳的模型;
[0031]a6:最终根据以上步骤筛选得到中药抗大肠杆菌活性模型算法是经Bagged CART选择后的NN,中药抗金黄色葡萄球菌活性模型算法是经LDA选择后的NN,AUC值分别为77.5%和80%;
[0032]a7:使用这两种模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,其特征在于:所述中药抗大肠杆菌活性预测模型和所述中药抗金黄色葡萄球菌活性预测模型包括以下步骤:S1:构建中药抗大肠杆菌和金黄色葡萄球菌活性数据库:通过人工对中药抗菌文献进行检索,获取关键信息,补充中药的四气、五味、归经、功效、主治信息,根据中药拉丁名称补充中药的科属信息;S2:挖掘中药抗菌的影响因素:通过频数分析、关联规则挖掘以及构建系统发育树的方法发现影响中药抗菌活性的特征信息;S3:根据挖掘的特征集合建立中药抗大肠杆菌和抗金黄色葡萄球菌活性预测模型,具体的选择机器学习算法包括以下步骤:a1:对特征集合进行预处理,包括删除特征信息不全的中药数据,将因变量转变成适合分类模型的因子变量;a2:使用递归特征消除法进行特征的选择,以模型的预测能力作为特征选择的衡量标准;a3:选择机器学习算法,通过建立中药抗菌预测模型的受试者工作特征曲线,计算曲线下面积,比较每种模型的性能,对各模型预测能力进行评估;a4:对筛选出来的模型进行参数优化,通过...

【专利技术属性】
技术研发人员:付先军任夏李谨彤魏雅雯闫春晓李秀雪李紫薇绪扩李卉
申请(专利权)人:山东中医药大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1