System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大数据的绒山羊基因分析方法及系统技术方案_技高网

一种基于大数据的绒山羊基因分析方法及系统技术方案

技术编号:42732322 阅读:31 留言:0更新日期:2024-09-13 12:18
本发明专利技术公开了一种基于大数据的绒山羊基因分析方法及系统,涉及生物信息学和生态保护技术领域,该发明专利技术通过全基因组测序技术,全面获取绒山羊的基因信息,避免了传统小规模样本采集的局限性。对绒山羊的历史健康信息进行系统收集,使得健康数据更加完整和精确。通过大数据技术,去除基因数据中的噪声和错误序列;通过构建综合数据库,将环境、基因和健康数据进行相关联整合,建立预测基因多样化分析模型。能够全面评估绒山羊群体的香农多样性指数Xnd、平均杂合指数Zhz、环境优渥指数Hjsy、遗传分化指数Ycf和绒山羊生理指数Slzs。相比传统单一维度的分析方法,本发明专利技术能够多维度综合考虑各种因素对绒山羊群体的影响,评估结果更加全面和科学。

【技术实现步骤摘要】

本专利技术涉及生物信息学和生态保护,具体为一种基于大数据的绒山羊基因分析方法及系统


技术介绍

1、绒山羊因其产出的羊绒纤维细而柔软、保暖性好,成为纺织业中极为珍贵的原料之一,具有极高的经济价值和市场需求。此外,绒山羊适应性强,能够在严酷的环境条件下生存,成为一些高原和荒漠地区农牧民的重要收入来源。保护和管理好绒山羊资源,对促进当地经济发展、维护生态平衡具有重要意义。

2、然而,绒山羊的繁育和保护面临着多种挑战。传统的管理方法主要依赖于人工观察和经验判断,缺乏系统的科学依据和大规模的数据支持。在环境、基因和健康数据的综合考虑和评估方面存在较大局限性,具体表现在以下几个方面:

3、首先,传统方法在环境数据采集方面,往往依赖于定期的人工实地考察和观测,数据覆盖范围有限且更新不及时。环境数据包括气候条件、海拔高度、植被覆盖情况和水源分布等,这些因素对绒山羊的生存和繁殖有直接影响。缺乏实时、全面的环境数据,使得对绒山羊栖息地环境质量的评估难以做到精准和全面;

4、其次,在基因数据的获取和处理上,传统方法多依赖于小规模的基因样本采集和分析,无法充分反映绒山羊群体的基因多样性和遗传结构。同时,基因数据处理过程复杂,容易产生噪声和错误序列,影响结果的准确性。基因多样性和遗传结构对绒山羊的适应能力、繁殖力和抗病能力具有重要影响,缺乏系统的基因数据分析,会影响到保护和繁育策略的制定,导致评估不全面,管理策略缺乏科学依据。因此,亟需一种基于大数据的绒山羊基因分析方法和系统。


技术实现思

1、(一)解决的技术问题

2、针对现有技术的不足,本专利技术提供了一种基于大数据的绒山羊基因分析方法及系统,以解决
技术介绍
中提到的问题。

3、(二)技术方案

4、为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于大数据的绒山羊基因分析方法,包括,

5、步骤一、通过大数据确定不同环境绒山羊栖息地的位置:利用卫星影像和无人机识别不同环境的绒山羊的栖息区域,并使用地理信息系统gis,建立生态位模型;模拟绒山羊的分布范围,以划分为若干组栖息子区域,并做标记;

6、步骤二、数据采集:在若干组栖息子区域内设置监测点,实时采集环境数据,包括气候、海拔、植被信息和水源信息,生成第一数据组;同时对若干组栖息子区域内绒山羊的基因样本进行采集,通过全基因组测序技术,对样本进行测序获取基因信息,生成第二数据组;同时收集若干组栖息子区域绒山羊的历史健康信息,生成第三数据组;

7、步骤三、数据处理:去除第二数据组基因数据中的噪声和错误序列,对第一数据组和第三数据组进行清洗和标准化;

8、步骤四、基因多样化预测分析:将第一数据组、第二数据组和第三数据组进行相关联整合,构建综合数据库,并建立预测基因多样化分析模型,将综合数据库作为输入项对若干个栖息子区域进行计算分析获得:香农多样性指数xnd、平均杂合指数zhz、环境优渥指数hjsy、遗传分化指数ycf和绒山羊生理指数slzs;

9、步骤五、群体多样性评估:将香农多样性指数xnd和平均杂合指数zhz相关联,获得第一评估指数dy1,若第一评估指数dy1低于第一多样性阈值,则生成第一策略,包括基因保护和基因交换策略;

10、步骤六、多级预测分析:并对环境优渥指数hjsy、遗传分化指数ycf和绒山羊生理指数slzs进行评估,获取相对应的评估结果,并根据相对应的评估结果,生成相对应策略。

11、优选的,所述步骤一包括:

12、s11、采集获取卫星影像数据,包括landsat、sentinel-2和modis卫星影像数据源;同时使用无人机携带摄像头在目标区域进行低空飞行,拍摄图像和视频,获取第一图像数据;

13、s12、将卫星影像数据和第一图像数据进行辐射校正、大气校正和几何校正预处理后,合成多光谱影像,并导入地理信息gis软件,叠加已有的地理信息数据后,使用监督分类对多光谱影像进行分类,根据分类结果,结合绒山羊的生态习性,识别潜在的栖息地;

14、s13、使用gis工具绘制栖息地边界,将目标区域划分为若干个栖息子区域,标记为并分别对若干组子区域进行标记,记作第一子区域qy1、第二子区域qy2、第三子区域qy3、...、第n子区域qyn。

15、优选的,所述步骤三包括:

16、s31、读取全基因组测序数据;

17、s32、使用工具fastqc评估测序数据质量,按照指令得分阈值q30去除不合格质量读段;

18、s33、使用工具trimmomatic或cutadapt去除测序读段中的接头序列;

19、s34、将高质量读段比对到参考基因组并使用picard或samtools标记并去除pcr重复序列,使用gatk或samtools进行变异检测,并根据覆盖度、质量得分标准阈值过滤掉置信度不合格的变异;

20、s35、使用gatk的variantrecalibrator对变异结果进行重新校准,并根据等位基因频率和基因型数据对基因型进行归一化处理;

21、s36、对第一数据组和第三数据组,进行缺失值处理后,使用箱形图或z分数法检测异常值后删除或替换异常值后,将数据归一化到0-1区间,对体重、血液参数进行min-maxscaling归一化处理;对绒山羊年龄和性别分类数据进行独热编码one-hot-encoding编码方法处理。

22、优选的,所述第一数据组包括以下数据:年降雨量、年均温度、海拔、地形特征、日照时长、植被覆盖率、主要植物种类及分布、植被生长季节和生长速率、水源分布位置及数量、土壤养分含量;通过气象站以及卫星影像分析技术获得以上数据;

23、所述第二数据组包括以下数据:绒山羊全基因组数据和遗传标记数据;

24、所述绒山羊全基因组数据包括基因组序列、单核苷酸多态性snp数据、基因型数据和基因表达谱;所述遗传标记数据包括微卫星标记和功能基因变异数据;

25、所述第三数据组包括以下数据:年龄、性别、出生记录、疾病史及疫病预防记录、体重及生长记录、繁殖记录、血红蛋白含量、白细胞计数、心率和呼吸频率、体温、饮食记录、食疗质量及营养成分信息。

26、优选的,所述香农多样性指数xnd和平均杂合指数zhz通过以下公式计算获得:

27、

28、

29、

30、式中,s是基因型的总数,是第i种基因型在群体中的相对频率;n是总个体数,表示第i种基因型的个体数;表示对每个相对频率进行自然对数运算,对每个进行加权求和,用符号来反映信息的熵,香农多样性指数xnd衡量的是群体中基因型或物种的多样性和均匀度,考虑的是不同基因型或物种的相对频率;平均杂合指数zhz衡量的是群体中基因型的杂合度,即基因型频率的变异程度。香农多样性指数xnd反映群体种基因型的多样性的值越高,群体的多样性和均匀性越好。...

【技术保护点】

1.一种基于大数据的绒山羊基因分析方法,其特征在于:包括,

2.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤一包括:

3.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤三包括:

4.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述第一数据组包括以下数据:年降雨量、年均温度、海拔、地形特征、日照时长、植被覆盖率、主要植物种类及分布、植被生长季节和生长速率、水源分布位置及数量、土壤养分含量;通过气象站以及卫星影像分析技术获得以上数据;

5.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述香农多样性指数Xnd和平均杂合指数Zhz通过以下公式计算获得:

6.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述环境优渥指数Hjsy通过以下公式计算获得:

7.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述遗传分化指数Ycf通过以下公式计算获得:

8.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:将香农多样性指数Xnd和平均杂合指数Zhz通过以下相关联公式生成第一评估指数dy1:

9.根据权利要求8所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤六包括:

10.一种基于大数据的绒山羊基因分析系统,应用于权利要求1-9任一项所述的一种基于大数据的绒山羊基因分析方法,其特征在于:包括,

...

【技术特征摘要】

1.一种基于大数据的绒山羊基因分析方法,其特征在于:包括,

2.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤一包括:

3.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤三包括:

4.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述第一数据组包括以下数据:年降雨量、年均温度、海拔、地形特征、日照时长、植被覆盖率、主要植物种类及分布、植被生长季节和生长速率、水源分布位置及数量、土壤养分含量;通过气象站以及卫星影像分析技术获得以上数据;

5.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述香农多样性指数xnd和平均杂合指数zhz通过以...

【专利技术属性】
技术研发人员:双金许浩
申请(专利权)人:中科云谱内蒙古基因生物科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1