本发明专利技术提供了基于知识图谱的免疫药物人群高低危筛选方法及系统,该方法包括以下步骤:S1:获取病人数据,并对病人数据进行数据预处理,并构建同构图数据以及异构图数据;S2:根据病人数据中的PFS值,对病人节点赋予标签,若PFS值大于PFS中位数,则赋予低危标签;S3:根据异构图数据构建异构图;将异构图节点数据转换为同构图数据,并根据同构图数据构建同构图;S4:将同构图输入到GCN以及GAT模型,异构图输入HAN模型,分别输出节点特征矩阵;S5:将三个节点特征矩阵进行拼接,输入MLP多层神经网络,并输出PFS类别预测。本发明专利技术融合了同构图信息以及异构图信息,并分别将其输出的节点表征拼接到一起,经过双层的MLP网络结构,能够准确预测病人的PFS类别。测病人的PFS类别。测病人的PFS类别。
【技术实现步骤摘要】
基于知识图谱的免疫药物人群高低危筛选方法及系统
[0001]本专利技术涉及计算机领域,具体设计基于知识图谱的免疫药物人群高低危筛选方法及系统。
技术介绍
[0002]肝癌素有“癌中之王”的称号,治疗手段与治疗效果均非常有限,目前,免疫治疗在晚期肝癌治疗中的客观缓解率在20%左右,虽然在总生存的延长上并未达到理想的结果,但其积极作用值得肯定,为晚期肝癌患者带来一线生机。PFS是无进展生存期,是英文Progression
‑
Free
‑
Survival的缩写,指的是癌症病人从随机化入组到出现疾病进展的时间。PFS是抗肿瘤药物的临床实验研究中非常常用的一个研究指标,通常将PFS作为临床实验研究的终点,它的主要的价值是用来判断所要研究的抗肿瘤药物的临床疗效,如果PFS时间长说明抗肿瘤药物的疗效好,如果PFS的时间短说明抗肿瘤药物的疗效不好。
[0003]现阶段对于PFS类别的预测主要有Gcn、Gat、Han等模型结构,然而,Gcn、Gat都是一个神经网络层,只能处理同构图数据,而Han是针对异构图数据的模型。上述模型单独使用时无法对病人数据的节点表征进行最大化的利用,从而无法对PFS类别进行精准预测。
技术实现思路
[0004]本专利技术提出了基于知识图谱的免疫药物人群高低危筛选方法及系统,模型框架充分融合了同构图信息以及异构图信息,并分别将其输出的节点表征拼接到一起,经过双层的MLP网络结构,预测病人的PFS类别,实验结果表明,我们的模型框架要优于其他图模型算法。
[0005]本专利技术具体的技术方案如下:
[0006]第一方面,本专利技术提供了基于知识图谱的免疫药物人群高低危筛选方法,包括以下步骤:
[0007]S1:获取病人数据,并对病人数据进行数据预处理,并构建异构图数据;
[0008]S2:根据病人数据中的PFS值,对病人节点赋予标签,若PFS值大于PFS中位数,则赋予低危标签;若PFS值小于PFS中位数,则赋予高危标签;
[0009]S3:根据异构图数据构建异构图;将异构图节点数据转换为同构图数据,并根据同构图数据构建同构图;
[0010]S4:将同构图输入到GCN以及GAT模型,分别输出第一节点特征矩阵以及第二节点特征矩阵;将异构图输入HAN模型,输出第三节点特征矩阵;
[0011]S5:将第一节点特征矩阵、第二节点特征矩阵以及第三节点特征矩阵进行拼接,输入MLP多层神经网络,并输出PFS类别预测。
[0012]在一些实施例中,所述S1包括:
[0013]S11:获取病人数据,并对病人数据进行数据预处理,包括:缺失值填充,数值数据归一化以及离散化数据one
‑
hot编码;
[0014]S12:将预处理后的病人数据特征作为初始病人节点的初始化节点特征,构建同构图数据以及异构图数据。
[0015]在一些实施例中,所述S3包括:
[0016]S31:在病人数据中心中,选择病人节点作为主节点,选择若干种其他类型变量作为从节点,构建异构图;
[0017]S32:将从节点特征聚合到主节点,构建同构图。
[0018]在一些实施例中,所述S4包括:
[0019]S41:将同构图输入到GCN以及GAT模型的 Layer层,并将GCN以及GAT模型隐藏层的最后一层输出分别作为第一节点特征矩阵以及第二节点特征矩阵;
[0020]S42:将异构图输入HAN模型,并将HAN模型隐藏层的最后一层输出作为第三节点特征矩阵。
[0021]在一些实施例中,所述S5包括:
[0022]S51:将第一节点特征矩阵、第二节点特征矩阵以及第三节点特征矩阵进行拼接,输入MLP多层神经网络;
[0023]S52:在MLP多层神经网络每一个线性层间采用relu激活函数,最终输入到softmax中,并输出高低危类别概率。
[0024]第二方面,本专利技术提供了基于知识图谱的免疫药物人群高低危筛选系统,包括:
[0025]数据获取模块,用于获取病人数据,并对病人数据进行数据预处理,并构建同构图数据以及异构图数据;
[0026]标签赋予模块,用于根据病人数据中的PFS值,对病人节点赋予标签,若PFS值大于PFS中位数,则赋予低危标签;若PFS值小于PFS中位数,则赋予高危标签;
[0027]同构异构图构建模块,用于根据异构图数据构建异构图;将异构图节点数据转换为同构图数据,并根据同构图数据构建同构图;
[0028]表征获取模块,用于将同构图输入到GCN以及GAT模型,分别输出第一节点特征矩阵以及第二节点特征矩阵;将异构图输入HAN模型,输出第三节点特征矩阵;
[0029]预测模块,用于将第一节点特征矩阵、第二节点特征矩阵以及第三节点特征矩阵进行拼接,输入MLP多层神经网络,并输出PFS类别预测。
[0030]在一些实施例中,所述数据获取模块包括:
[0031]数据预处理子模块,用于获取病人数据,并对病人数据进行数据预处理,包括:缺失值填充,数值数据归一化以及离散化数据one
‑
hot编码;
[0032]图数据构建子模块,用于将预处理后的病人数据特征作为初始病人节点的初始化节点特征,构建同构图数据以及异构图数据。
[0033]在一些实施例中,所述同构异构图构建模块包括:
[0034]异构图构建子模块,用于在病人数据中心中,选择病人节点作为主节点,选择若干种其他类型变量作为从节点,构建异构图;
[0035]同构图构建子模块,用于将从节点特征聚合到主节点,构建同构图。
[0036]在一些实施例中,所述表征获取模块包括:
[0037]同构图表征获取子模块,用于将同构图输入到GCN以及GAT模型的 Layer层,并将GCN以及GAT模型隐藏层的最后一层输出分别作为第一节点特征矩阵以及第二节点特征矩
阵;
[0038]异构图表征获取子模块,用于将异构图输入HAN模型,并将HAN模型隐藏层的最后一层输出作为第三节点特征矩阵。
[0039]在一些实施例中,所述预测模块包括:
[0040]表征拼接子模块,用于将第一节点特征矩阵、第二节点特征矩阵以及第三节点特征矩阵进行拼接,输入MLP多层神经网络;
[0041]结果输出子模块,用于在MLP多层神经网络每一个线性层间采用relu激活函数,最终输入到softmax中,并输出高低危类别概率。
[0042]本申请的有益效果是:
[0043]本专利技术提出了基于知识图谱的免疫药物人群高低危筛选方法,通过Gcn、Gat以及Han模型框架,融合了同构图信息以及异构图信息,并分别将其输出的节点表征拼接到一起,进而经过双层的MLP网络结构,预测病人的PFS类别,实验结果表明,我们的模型框架要优于其他图模型算法。
附图说明
[0044]图1为本申请基于知识图谱的免疫药物人群高低危筛选本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于知识图谱的免疫药物人群高低危筛选方法,其特征在于,包括以下步骤:S1:获取病人数据,并对病人数据进行数据预处理,并构建异构图数据;S2:根据病人数据中的PFS值,对病人节点赋予标签,若PFS值大于PFS中位数,则赋予低危标签;若PFS值小于PFS中位数,则赋予高危标签;S3:根据异构图数据构建异构图;将异构图节点数据转换为同构图数据,并根据同构图数据构建同构图;S4:将同构图输入到GCN以及GAT模型,分别输出第一节点特征矩阵以及第二节点特征矩阵;将异构图输入HAN模型,输出第三节点特征矩阵;S5:将第一节点特征矩阵、第二节点特征矩阵以及第三节点特征矩阵进行拼接,输入MLP多层神经网络,并输出PFS类别预测。2.根据权利要求1所述的基于知识图谱的免疫药物人群高低危筛选方法,其特征在于,所述S1包括:S11:获取病人数据,并对病人数据进行数据预处理,包括:缺失值填充,数值数据归一化以及离散化数据one
‑
hot编码;S12:将预处理后的病人数据特征作为初始病人节点的初始化节点特征,构建同构图数据以及异构图数据。3.根据权利要求2所述的基于知识图谱的免疫药物人群高低危筛选方法,其特征在于,所述S3包括:S31:在病人数据中心中,选择病人节点作为主节点,选择若干种其他类型变量作为从节点,构建异构图;S32:将从节点特征聚合到主节点,构建同构图。4.根据权利要求3所述的基于知识图谱的免疫药物人群高低危筛选方法,其特征在于,所述S4包括:S41:将同构图输入到GCN以及GAT模型的 Layer层,并将GCN以及GAT模型隐藏层的最后一层输出分别作为第一节点特征矩阵以及第二节点特征矩阵;S42:将异构图输入HAN模型,并将HAN模型隐藏层的最后一层输出作为第三节点特征矩阵。5.根据权利要求4所述的基于知识图谱的免疫药物人群高低危筛选方法,其特征在于,所述S5包括:S51:将第一节点特征矩阵、第二节点特征矩阵以及第三节点特征矩阵进行拼接,输入MLP多层神经网络;S52:在MLP多层神经网络每一个线性层间采用relu激活函数,最终输入到softmax中,并输出高低危类别概率。6.基于知识图谱的免疫药物人群高低危筛选系统,其特征在于,包括:数据获取模块,用于获取病人数据,并对病人数据进行数据预处理,...
【专利技术属性】
技术研发人员:王瑞国,许峥,许娟,张佳乐,史文钊,
申请(专利权)人:神州医疗科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。