一种基于深度神经网络的融合表型和分子信息的中药处方人工智能评价方法技术

技术编号:35674358 阅读:25 留言:0更新日期:2022-11-23 14:11
本发明专利技术提供了一种基于深度学习的融合表型与分子信息的中药处方人工智能评价方法。本方法首先构建基于卷积神经网络的诊断描述特征智能提取,基于网络嵌入的药物特征智能提取,同时在药物特征中融合了分子信息。进而,基于提取的诊断描述及中药处方特征,设计基于卷积神经网络的中药处方人工智能评价方法。同时,本方法还首次提出了一种基于中药处方相似性的分层采样策略。实验结果表明,我们的方法在中药处方评价性能上要优于基线方法,且优于未添加分子信息的模型,能较好地学习专家经验。我们的方法促进了基于经验的、宏观的传统中医药学走向基于数据的、宏微观结合现代科学,有助于减少中药处方的不合理使用情况,推动中医药的精准化和智能化。动中医药的精准化和智能化。动中医药的精准化和智能化。

【技术实现步骤摘要】
一种基于深度神经网络的融合表型和分子信息的中药处方人工智能评价方法


[0001]本专利技术涉及一种基于深度神经网络的融合表型和分子信息的中药处方人工智能评价方法。

技术介绍

[0002]中药在临床上使用广泛,然而其不合理使用情况也比较严重。一项针对北京市第一中西医结合医院2013年门诊不规范中药饮片处方的分析[1]表明,2400张处方中不规范处方177张,占所抽处方的7.38%。另外一项针对北京积水潭医院2011年1月-2013年5月药师在调配前不合理处方的研究表明[2],663张不合理处方中共有709处不合理因素,其中以下3种情况居多:毒性饮片超量(73.76%),处方开具配伍禁忌未签字(12.13%),处方饮片输机错误(7.76%)。这些统计结果表明中药处方的不合理使用,除了常见的人工操作错误之外,主要是违法配伍禁忌、没有进行辨证论治、没有考虑不良反应等情况,而这些恰恰是比较严重的不合理使用情况。因此,准确地推荐中药处方、降低中药处方的不合理使用率是一个亟待解决的问题。
[0003]随着人工智能、大数据时代的到来,越来越多的研究关注于使用人工智能的方法挖掘名医经验,从而实现中药处方的人工智能评价。实际上,人工智能技术已经在中医药领域具有了一定的应用,例如基于人工智能的中医“四诊”信息标准化采集、处理与分析,中医体质辨析,中医名医经验的挖掘等等。这些应用在一定程度上促进了中医的客观化和标准化。因此,人工智能技术应用于中药处方的人工智能评价即是中药临床精准使用所需,也是人工智能、大数据时代下多学科交叉发展所孕育的一大趋势。人工智能技术应用于中药处方人工智能评价的优势主要体现在:一方面人工智能技术的使用能够实现已经数据化的历代中医病案资料以及名师的临床诊疗记录的挖掘,从而更好地总结和传承名医的用药经验;另外一方面,能够促进临床中药处方的合理使用,降低中药处方不合理使用率,提高诊疗效率。
[0004]目前,人工智能在医疗领域的应用较为广泛,包括医学影像处理、疾病诊断、药物推荐等。人工智能技术在中药处方人工智能评价方面的研究可以分为三类:第一类是基于中医药学积累的大量先验知识的数据挖掘,第二类是整合先验知识和临床信息的联合推荐;第三类是基于中药成分指纹图谱的中药活性鉴定和匹配。
[0005]在中医药学先验知识的数据挖掘方面,Liang Yao[3]等提出了一个从方剂文献中挖掘方剂关系的系统,包括基于Trie树建立的方剂组成成分的关系和以及基于主题模型建立的方剂功效关系。Wei Li[4]等人提出了一种具有覆盖机制和软损失函数的解码器。该研究从中药方剂数据库中抓取了85166张处方,获得82044个症状,验证得到准确率38.22%,召回率30.18%,F1值33.73%。根据中医专家的判断,生成的处方的正确率为73%。Jinpeng Chen等[5]提出了一种基于三部图的症状

证候

中药关系推断方法。该方法首先构建了一个承载丰富信息的异构三部信息网络,后从该信息网络中系统地提取出基于路径的拓扑特
征,最后用无监督的方法来学习与不同特征相关的最佳参数从而决定症状与中药的关系。在整合先验知识和临床信息的联合推荐方面,杨蕴[6]等使用基于高斯核的岭回归的算法,构建了中医药治疗肺癌处方系统。该处方系统利用2955例次中医肺癌门诊资料完成模型训练,使其能完成较高准确率的处方输出,并最终应用于临床治疗参考。通过专家评估实际的108病例来验证处方的准确率,发现出现频率次数高于300的药物,准确率达到62.9%,召回率80.2%,F1值为70.5%。Kuo,Yang等[7]提出一个多阶段的分析方法,整合倾向性病例配对、复杂网络分析和中药富集分析,以确定针对特定疾病(例如失眠)的有效药方。首先,应用倾向性病例匹配来匹配临床病例。然后,将核心网络提取和中药富集相结合,对核心有效中药处方进行检测。在基于中药成分指纹图谱的中药活性鉴定和匹配方面,Chen H等[8]从中药成分的化学色谱指纹图谱角度出发,通过建立叠加多元线性回归(SMLR)方法,从色谱指纹图谱预测中药的生物活性,相比于其他方法具有更好的通用性,能够为中药的精准使用提供支撑。
[0006]这些方法大多集中在表型层次,其主要特点在于挖掘“症状”和“中药”在文本层次上的关系,缺少分子层次信息。中药处方治疗疾病分子层次上的机制对于精准地推荐中药处方至关重要。因此,提出一种融合表型信息和分子信息的中药处方评价方法是十分必须的。

技术实现思路

[0007]针对现有技术存在的不足,本专利技术提出一种基于深度神经网络的融合表型和分子信息的中药处方人工智能评价方法,从而在此基础上合理有效地建立实现中医处方的高精度人工智能评价。
[0008]为实现上述目的,本专利技术提供了一种基于深度神经网络的融合表型和分子信息的中药处方人工智能评价方法,其特征在于包括如下步骤:
[0009]步骤一、通过数学建模实现了诊断描述的数字化和向量化表示,其中诊断描述包括主诉、现病史、舌象和脉象信息,
[0010]步骤二、通过构建融合分子信息的中药分子异构网络,使用网络嵌入表示实现对异构网络的特征智能提取,获得中药的低维向量特征,进而实现了中药处方的向量化表示,
[0011]步骤三、进行训练集和测试集的划分,其中训练集和测试集的划分遵循疾病内部相似性原则,既保证诊断描述的相似性也保证中药处方的相似性,
[0012]步骤四、训练集中药处方的分层采样,其中分层采样使得相似性较高尤其是排名靠前中药都相同但排名靠后中药略有差别的中药处方被纳入推荐范围,并以此在构建的深度神经网络模型中实现处方推荐的回归预测,
[0013]步骤五、构建神经网络模型并训练该神经网络模型,其中神经网络模型包括3部分:基于卷积神经网络的诊断描述信息的深度特征提取、基于网络嵌入表示的中药处方信息的深度特征提取、以及基于卷积神经网络的中药处方人工智能评价,通过训练神经网络模型使其达到最优,实现给定诊断描述,能够批量、智能地推荐最优中药处方,
[0014]步骤六、神经网络模型评价。模型评价包括:模型内部评价、和其他基线方法比较。评价指标包括但不限于Hit ratio(HR)、AUC和Spearman相关性等。
[0015]根据本专利技术的进一步的实施例的基于深度神经网络的融合表型和分子信息的中
药处方人工智能评价方法的特征包括下列中的至少一种:
[0016]A)诊断描述主要包括主诉、现病史、舌象和脉象,使用长度不同的卷积核在文本上进行一维卷积,然后将不同长度的卷积核提取到的特征拼接在一起,作为一段文本的特征输入到神经网络模型中进行训练。
[0017]B)中药处方信息的深度特征提取所使用的方法主要包括低维嵌入表示(Network Embedding)的方式,包括:从公开的数据库搜集中药、化合物、靶点信息,构建中药

化合物

靶点异构网络;使用低维嵌入表示方法对异构网络进行低维嵌入表示,提取中药、化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的融合表型与分子信息的中药处方人工智能评价方法,其特征在于包括如下步骤:1)提取诊断描述的特征,其中:诊断描述包括主诉、现病史、舌象和脉象,诊断描述的特征提取采取是基于TextCNN,包括使用长度不同的卷积核在文本上进行一维卷积,然后将不同长度的卷积核提取到的特征拼接在一起,作为一段文本的特征输入到网络中进行训练,2)提取中药处方信息的深度特征,包括:从公开的数据库搜集中药、化合物、靶点信息,构建中药

化合物

靶点异构网络;使用低维嵌入表示方法对异构网络进行低维嵌入表示,提取中药、化合物、靶点的特征;在通过低维嵌入表示的方式度量了中药的特征之后,进一步度量中药处方的特征,其中,中药处方的特征被定义为该处方所含中药各个维度上值的均值,即:假设中药处方中含有m个中药,每个中药特征的维度为d,则中药处方的特征表示为:3)划分训练集和测试集,其中:训练集和测试集的划分遵循疾病内部相似性原则从而既保证诊断描述的相似性也保证中药处方的相似性,包括:首先使用Doc2Vec训练所有的诊断描述,从而能够度量任何两个诊断描述之间的相似性;然后,使用Jaccard度量任意两个中药处方之间的相似性;最后,设定每种疾病训练集占比0.9,测试集占比0.1,针对每一条测试集数据,保证在当前疾病的训练集中至少有一条数目满足诊断描述相似性大于等于0.7并且中药处方相似性大于等于0.7,4)对训练集的中药处方进行分层采样,其中:每一个样本包含三方面信息:诊断描述,疾病和中药处方,包括:将当前中药处方和当前疾病的其他中药处方计算Jaccard相似性;然后根据Jaccard的值进行分层采样,其中Jaccard的值分布在0

1之间;将该0

1切分为20等长小区间,在每个小区间上进行采样并且采样量和当前疾病的样本量占总样本量的比例成正比,即:其中具体的采样规则为:K=50,且设这个小区间上的中药处方量为X,如果X≥S,则不放回随机抽样S个中药处方;如果0<X<S,则X全部被采样,并且通过倒序依次删减当前中药处方尾部的中药产生新的S

X个中药处方,如果X=0,则通过倒序依次删减当前中药处方尾部的中药产生新的S个中药处方;从而通过该策略即实现了大幅度扩充训练样本也能够捕捉同一诊断描述的“次优”中药处方信息,5)构建神经网络模型并进行训练,其中:神经网络模型分为3部分:基于卷积神经网络的诊断描述信息的深度特征提取,其中:诊断描述先经过一个嵌入层,嵌入层的维度为100,然后分别经过三个单元数为16的一维卷积层,卷积核的长度分别
为6,7,8,步长为10,每个卷积层后面连接一个一维MaxPooling层,三个MaxPooling提取的特征拼接在一起作为诊断描述的特征,基于网络嵌入表示的中药处方信息的深度特征提取,其中:中药处方的特征经过网络嵌入方法提取特征后,长度归一化到256,依次经过两个长度分别为128,64的全连接层,激活函数都为Relu,基于卷积神经网络的中药处方人工智能评价,其中:诊断描述的特征和中药处方的特征拼接在一起之后,依次经过两个单元数为32一维卷积层和MaxPooling层,最后输出到两个单元数分别为32和16的全连接层,激活函数都为Relu,输出层单元数为1,6)确定神经网络模型评价指标并进行评价,其中:评价指标包括命中率HR和接收者操作特征曲线ROC的曲线下方的面积大小AUC,包括:按如下公式确定命中率HR:其中,分母GT是所有的测试集合,分子NumberOfHits表示命中的样本个数,接收者操作特征曲线ROC曲线的横轴为假正例率FPR,纵轴为真正例率TPR,其表达公式分别为:分别为:其中,FP为假阳性率,TP为真阳性率,TN为真阴性率,评价的方式为命中率HR和/或AUC越高则模型越好,评价过程包括:按照上述的命中率HR公式直接计算命中率HR,AUC的计算过程包括:把每个诊断描述和当前诊断描述对应的疾病的所有中药处方进行预测,从而每个诊断描述都有一个已知标签向量,一个预测的分数向量,以及当前中药处方和当前诊断描述对应的疾病的所有中药处方的Jaccard相似性向量,按预测的分数对样本进行降序排序,对于不设定Jaccard阈值的情况,直接依据已知标签向量和预测的分数向量计算TPR和FPR,对于设定Jaccard阈值的情况,将Jaccard相似性向量从上到下按照Jaccard阈值进行划分,把Jaccard相似性大于Jaccard阈值的样本归为预测正确的样本,把Jaccard相似性小于阈值的样本归为预测错误的样本,分别计算出此时的TPR和FPR,从而确定AUC。2.根据权利要求1所述的基于深度神经网络的融合表型与分子信息的中药处方人工智能评价方法,其特征在于:在所述基于卷积神经网络的中药处方人工智能评价的操作中,每个诊断描述都由若干个字符组成,经过Embedding层之后,每个字符的维度为D=100,假设诊断描述包含的字符数为N,则每个诊断描述用一个随机初始化的D维向量表示:S
i:j
代表诊断描述中的第i个到第j个字符,即:
...

【专利技术属性】
技术研发人员:李梢李艳周武爱杨扩王鑫吴敏
申请(专利权)人:皖南医学院弋矶山医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1