一种使用血液标志物预测性别的方法技术

技术编号：27652202 阅读：38 留言：0更新日期：2021-03-12 14:13

本发明专利技术涉及生物信息领域，且公开了一种使用血液标志物预测性别的方法，包括血液标志物数据收集、数据预处理、模型的建立与评估和模型的测试四个步骤。相比其他方法和标志物，所选取的血液标志物即血液生化指标，是临床和体检机构中最常见的指标，获取难度小、成本低，同时，使用机器学习模型对选取的血液标志物进行计算，使得流程更加智能、结果更加准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种使用血液标志物预测性别的方法
本专利技术涉及生物信息领域，具体为一种使用血液标志物预测性别的方法。
技术介绍
性别指男女两性的区别。在染色体层面上，人类具有22对常染色体和一对性染色体，男性的性染色体为XY，女性的性染色体为XX，Y染色体的存在也是判断人类性别的方法之一；基因层面上通常使用SRY睾丸决定基因作为性别判断的依据，SRY基因位于Y染色体上，因此具有SRY基因的个体为男性，不具有的为女性；在更宏观的层面上看，性腺、生殖器等都可以作为划分性别的依据。国内外的研究表明，一些血液指标在男女个体中存在差异，并且这些差异性指标已应用于临床。成年男女两性的红细胞计数存在显著差异，这种差异在新生儿和婴幼儿时期无明显表现，到青春期和成年期后才表现出显著差异。在我国成年男性红细胞为400万-550万/μl，女性为350万-500万/μl，但女性到40岁以后，其体内红细胞数又逐渐升高，与男性水平相接近。据医学研究发现，这种差异与性腺功能的成熟有一定关系。在青春期，男性体内雄性激素水平开始升高，而雄性激素可通过两方面的作用来刺激红细胞的增加，一方面雄性激素可直接作用于骨髓造血组织，刺激骨髓造血组织加速有核红细胞的分裂活动和血红蛋白的合成，另一方面，雄性激素可刺激肾脏产生一种酶—红细胞生成酶，这种酶又能使肝脏产生的促红细胞生成素原转变为促红细胞生成素，后者可刺激骨髓内原始的血细胞加速分化形成原始红细胞，并能促进有核红细胞的有丝分裂过程，使其成熟过程加快。对红细胞的主要成分—血红蛋白的生物合成也有推动作用。此外，促红细胞...

【技术保护点】
1.一种使用血液标志物预测性别的方法，其特征在于：包括血液标志物数据收集、数据预处理、模型的建立与评估和模型的测试四个步骤，所述血液标志物按照以下方法预测性别：/n第一步，血液标志物数据收集，奇云诺德从多个相关数据库总计获取92062个样本的血液标志物数据，所述每个样本中包含个体性别和19项血液标志物数据，所述血液标志物数据即为血液生化指标，常见于医院和体检机构的血常规和血液生化指标检测报告单；/n第二步，数据预处理，移除有遗漏数据的样本和有明显错误离群值（Outliar）的样本后，总计获得26754例完整样本用于模型的训练和测试，随后对19项血液标志物数据进行标准化处理，将所有标志物数据的数值都映射在[0,1]范围内；/n第三步，模型的建立与评估，预处理后的数据按照7:3的比例随机分为训练集和测试集进行模型的训练，使用深度神经网络（DNN）机器学习算法训练26754个样本的19个血液标志物数据，调整隐藏层数量、神经元个数和Dropout数量等模型参数，训练多个性别预测模型;/n第四步，模型的测试，在所用的26754个样本数据中，随机获取30%的数据输入模型预测性别，进行模型内部数据的...

【技术特征摘要】
1.一种使用血液标志物预测性别的方法，其特征在于：包括血液标志物数据收集、数据预处理、模型的建立与评估和模型的测试四个步骤，所述血液标志物按照以下方法预测性别：
第一步，血液标志物数据收集，奇云诺德从多个相关数据库总计获取92062个样本的血液标志物数据，所述每个样本中包含个体性别和19项血液标志物数据，所述血液标志物数据即为血液生化指标，常见于医院和体检机构的血常规和血液生化指标检测报告单；
第二步，数据预处理，移除有遗漏数据的样本和有明显错误离群值（Outliar）的样本后，总计获得26754例完整样本用于模型的训练和测试，随后对19项血液标志物数据进行标准化处理，将所有标志物数据的数值都映射在[0,1]范围内；
第三步，模型的建立与评估，预处理后的数据按照7:3的比例随机分为训练集和测试集进行模型的训练，使用深度神经网络（DNN）机器学习算法训练26754个样本的19个血液标志物数据，调整隐藏层数量、神经元个数和Dropout数量等模型参数，...

【专利技术属性】
技术研发人员：罗奇斌，申玉林，廖胜光，任毅，
申请(专利权)人：天津奇云诺德生物医学有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人