基于多标记学习的抗菌肽活性预测方法技术

技术编号：11234462 阅读：137 留言：0更新日期：2015-04-01 08:22

基于多标记学习的抗菌肽活性预测方法通过提取肽序列对应的氨基酸成分，然后根据物理化学属性编码获取对应的矩特征，共同构成肽序列的特征向量。每条肽序列的特征向量是由两部分构成，一是氨基酸成分，二是基于物理化学属性编码提取的矩特征。采用最小二乘的多标记学习算法计算最小化变换矩阵W，则能够通过变换矩阵W得出待测样本的各标记输出，根据各标记输出获取预测类标签向量集合。根据类标签向量集合快速准确预测抗菌肽序列的活性。因此，能够获取肽序列各个角度的形状特定，从而能够快速、准确、自动标注抗菌肽活性。

全部详细技术资料下载

【技术实现步骤摘要】
基于多标记学习的抗菌肽活性预测方法
本专利技术涉及生物医学工程，特别是涉及一种能够快速、准确、自动标注抗菌肽活性的基于多标记学习的抗菌肽活性预测方法。
技术介绍
抗菌肽是一种参与固有免疫的小分子多肽，一般由20～60个氨基酸残基组成，这类活性多肽对细菌具有广谱高效杀菌活性。随着人们研究的深入，发现这些抗细菌肽对部分真菌、原虫、病毒及癌细胞等均具有强有力的杀伤作用。抗菌肽的广泛的生物学活性显示了其在医学上良好的应用前景。通过实验手段测定抗菌肽的活性，无论是基于体内或体外的技术，不仅非常费时，费用也较昂贵。目前，研究者们已经提出了十多种抗菌肽预测器，然而这些工具基本都是用于判断肽分子是否具有抗菌性，或者说是否属于抗菌肽家族，没有进一步对抗菌肽的具体活性做出预测。大多数都是设计二分类模型用来判断肽分子是否属于抗菌肽；或提出的方法能够实现对抗菌肽的活性预测，但是只限于5种活性，预测精度也有待进一步提高。现有的方法大多数都是二分类模型，只能用于抗菌肽识别。
技术实现思路
基于此，有必要针对提供一种能够快速、准确、自动标注抗菌肽活性的基于多标记学习的抗菌肽活性预测方法。一种基于多标记学习的抗菌肽活性预测方法，包括以下步骤：提取肽序列对应的氨基酸成分，并根据所述氨基酸成分获取对应的矩特征向量x，其中，所述矩特征向量x用于描述肽序列各个角度的形状特点；采用多标记学习算法并根据公式W＝(XTX)-1XTY计算最小化变换矩阵W，其中，设x的类标签向量为y＝[y1,y2,...,yc]T；最小化变换矩阵W的公式为min||XW-Y||；c为种类标签数，X表示训练样本矩阵，Y表示训练...
基于多标记学习的抗菌肽活性预测方法

【技术保护点】
一种基于多标记学习的抗菌肽活性预测方法，包括以下步骤：提取肽序列对应的氨基酸成分，并根据所述氨基酸成分获取对应的矩特征向量x，其中，所述矩特征向量x用于描述肽序列各个角度的形状特点；采用多标记学习算法并根据公式W＝(XTX)‑1XTY计算最小化变换矩阵W，其中，设x的类标签向量为y＝[y1,y2,…,yc]T；最小化变换矩阵W的公式为min||XW‑Y||；c为种类标签数，X表示训练样本矩阵，Y表示训练样本对应的类标记矩阵，每个行向量对应一个样本；则对于待测样本x’，其对各标记的输出为f(x,y)＝xW；根据各标记输出f(x,y)＝xW获取预测类标签向量集合h(x)＝{y|f(x，y)≥0，y∈{1，2，...，c}}。

【技术特征摘要】
1.一种基于多标记学习的抗菌肽活性预测方法，包括以下步骤：提取肽序列对应的氨基酸成分，并根据所述氨基酸成分获取对应的矩特征向量x，其中，所述矩特征向量x用于描述肽序列各个角度的形状特点；根据氨基酸的物理化学属性指标对氨基酸序列作数字编码；将氨基酸序列的每个氨基酸残基一一对应转换成数值序列；根据所述数值序列对肽序列的整体、N端和C端计算矩特征向量x，其中，N端指肽序列的前5个氨基酸，C端指肽序列的后5个氨基酸采用多标记学习算法并根据公式W＝(XTX)-1XTY计算最小化变换矩阵W，其中，设x的类标签向量为y＝[y1,y2,...,yc]T；最小化变换矩阵W的公式为min||XW-Y||；y1，y2，…，yc为标签向量的元素值，c为种类标签数，X表示训练样本矩阵，Y表示训练样本对应的类标记矩阵，每个行向量对应一个样本；则对于待测样本x，其对各标记的输出为f(x,y)＝xW；根据各标记输出f(x,y)＝xW获取预测类标签向量集合h(x)＝{y|f(x,y)≥0,y∈{1,2,...,c}}。2.根据权利要求1所述的基于多标记学习的抗菌肽活性预测方法，其特征在于，所述矩特征向量x包括1阶原点矩、2阶中心矩、3阶中心矩和4阶中心矩。3.根据权利要求1所述的基于多标记学习的抗菌肽活性预测方法，其特征在于，所述类标签向量为y＝[y1,y2,...,yc]T中yi＝1表示样本...

【专利技术属性】
技术研发人员：周丰丰，王普，肖绚，葛瑞泉，刘记奎，
申请(专利权)人：深圳先进技术研究院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人