System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物信息学和生态保护,具体为一种基于大数据的绒山羊基因分析方法及系统。
技术介绍
1、绒山羊因其产出的羊绒纤维细而柔软、保暖性好,成为纺织业中极为珍贵的原料之一,具有极高的经济价值和市场需求。此外,绒山羊适应性强,能够在严酷的环境条件下生存,成为一些高原和荒漠地区农牧民的重要收入来源。保护和管理好绒山羊资源,对促进当地经济发展、维护生态平衡具有重要意义。
2、然而,绒山羊的繁育和保护面临着多种挑战。传统的管理方法主要依赖于人工观察和经验判断,缺乏系统的科学依据和大规模的数据支持。在环境、基因和健康数据的综合考虑和评估方面存在较大局限性,具体表现在以下几个方面:
3、首先,传统方法在环境数据采集方面,往往依赖于定期的人工实地考察和观测,数据覆盖范围有限且更新不及时。环境数据包括气候条件、海拔高度、植被覆盖情况和水源分布等,这些因素对绒山羊的生存和繁殖有直接影响。缺乏实时、全面的环境数据,使得对绒山羊栖息地环境质量的评估难以做到精准和全面;
4、其次,在基因数据的获取和处理上,传统方法多依赖于小规模的基因样本采集和分析,无法充分反映绒山羊群体的基因多样性和遗传结构。同时,基因数据处理过程复杂,容易产生噪声和错误序列,影响结果的准确性。基因多样性和遗传结构对绒山羊的适应能力、繁殖力和抗病能力具有重要影响,缺乏系统的基因数据分析,会影响到保护和繁育策略的制定,导致评估不全面,管理策略缺乏科学依据。因此,亟需一种基于大数据的绒山羊基因分析方法和系统。
技术实现思
1、(一)解决的技术问题
2、针对现有技术的不足,本专利技术提供了一种基于大数据的绒山羊基因分析方法及系统,以解决
技术介绍
中提到的问题。
3、(二)技术方案
4、为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于大数据的绒山羊基因分析方法,包括,
5、步骤一、通过大数据确定不同环境绒山羊栖息地的位置:利用卫星影像和无人机识别不同环境的绒山羊的栖息区域,并使用地理信息系统gis,建立生态位模型;模拟绒山羊的分布范围,以划分为若干组栖息子区域,并做标记;
6、步骤二、数据采集:在若干组栖息子区域内设置监测点,实时采集环境数据,包括气候、海拔、植被信息和水源信息,生成第一数据组;同时对若干组栖息子区域内绒山羊的基因样本进行采集,通过全基因组测序技术,对样本进行测序获取基因信息,生成第二数据组;同时收集若干组栖息子区域绒山羊的历史健康信息,生成第三数据组;
7、步骤三、数据处理:去除第二数据组基因数据中的噪声和错误序列,对第一数据组和第三数据组进行清洗和标准化;
8、步骤四、基因多样化预测分析:将第一数据组、第二数据组和第三数据组进行相关联整合,构建综合数据库,并建立预测基因多样化分析模型,将综合数据库作为输入项对若干个栖息子区域进行计算分析获得:香农多样性指数xnd、平均杂合指数zhz、环境优渥指数hjsy、遗传分化指数ycf和绒山羊生理指数slzs;
9、步骤五、群体多样性评估:将香农多样性指数xnd和平均杂合指数zhz相关联,获得第一评估指数dy1,若第一评估指数dy1低于第一多样性阈值,则生成第一策略,包括基因保护和基因交换策略;
10、步骤六、多级预测分析:并对环境优渥指数hjsy、遗传分化指数ycf和绒山羊生理指数slzs进行评估,获取相对应的评估结果,并根据相对应的评估结果,生成相对应策略。
11、优选的,所述步骤一包括:
12、s11、采集获取卫星影像数据,包括landsat、sentinel-2和modis卫星影像数据源;同时使用无人机携带摄像头在目标区域进行低空飞行,拍摄图像和视频,获取第一图像数据;
13、s12、将卫星影像数据和第一图像数据进行辐射校正、大气校正和几何校正预处理后,合成多光谱影像,并导入地理信息gis软件,叠加已有的地理信息数据后,使用监督分类对多光谱影像进行分类,根据分类结果,结合绒山羊的生态习性,识别潜在的栖息地;
14、s13、使用gis工具绘制栖息地边界,将目标区域划分为若干个栖息子区域,标记为并分别对若干组子区域进行标记,记作第一子区域qy1、第二子区域qy2、第三子区域qy3、...、第n子区域qyn。
15、优选的,所述步骤三包括:
16、s31、读取全基因组测序数据;
17、s32、使用工具fastqc评估测序数据质量,按照指令得分阈值q30去除不合格质量读段;
18、s33、使用工具trimmomatic或cutadapt去除测序读段中的接头序列;
19、s34、将高质量读段比对到参考基因组并使用picard或samtools标记并去除pcr重复序列,使用gatk或samtools进行变异检测,并根据覆盖度、质量得分标准阈值过滤掉置信度不合格的变异;
20、s35、使用gatk的variantrecalibrator对变异结果进行重新校准,并根据等位基因频率和基因型数据对基因型进行归一化处理;
21、s36、对第一数据组和第三数据组,进行缺失值处理后,使用箱形图或z分数法检测异常值后删除或替换异常值后,将数据归一化到0-1区间,对体重、血液参数进行min-maxscaling归一化处理;对绒山羊年龄和性别分类数据进行独热编码one-hot-encoding编码方法处理。
22、优选的,所述第一数据组包括以下数据:年降雨量、年均温度、海拔、地形特征、日照时长、植被覆盖率、主要植物种类及分布、植被生长季节和生长速率、水源分布位置及数量、土壤养分含量;通过气象站以及卫星影像分析技术获得以上数据;
23、所述第二数据组包括以下数据:绒山羊全基因组数据和遗传标记数据;
24、所述绒山羊全基因组数据包括基因组序列、单核苷酸多态性snp数据、基因型数据和基因表达谱;所述遗传标记数据包括微卫星标记和功能基因变异数据;
25、所述第三数据组包括以下数据:年龄、性别、出生记录、疾病史及疫病预防记录、体重及生长记录、繁殖记录、血红蛋白含量、白细胞计数、心率和呼吸频率、体温、饮食记录、食疗质量及营养成分信息。
26、优选的,所述香农多样性指数xnd和平均杂合指数zhz通过以下公式计算获得:
27、
28、
29、
30、式中,s是基因型的总数,是第i种基因型在群体中的相对频率;n是总个体数,表示第i种基因型的个体数;表示对每个相对频率进行自然对数运算,对每个进行加权求和,用符号来反映信息的熵,香农多样性指数xnd衡量的是群体中基因型或物种的多样性和均匀度,考虑的是不同基因型或物种的相对频率;平均杂合指数zhz衡量的是群体中基因型的杂合度,即基因型频率的变异程度。香农多样性指数xnd反映群体种基因型的多样性的值越高,群体的多样性和均匀性越好。本文档来自技高网...
【技术保护点】
1.一种基于大数据的绒山羊基因分析方法,其特征在于:包括,
2.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤一包括:
3.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤三包括:
4.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述第一数据组包括以下数据:年降雨量、年均温度、海拔、地形特征、日照时长、植被覆盖率、主要植物种类及分布、植被生长季节和生长速率、水源分布位置及数量、土壤养分含量;通过气象站以及卫星影像分析技术获得以上数据;
5.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述香农多样性指数Xnd和平均杂合指数Zhz通过以下公式计算获得:
6.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述环境优渥指数Hjsy通过以下公式计算获得:
7.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述遗传分化指数Ycf通过以下公式计算获得:
8.根据权
9.根据权利要求8所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤六包括:
10.一种基于大数据的绒山羊基因分析系统,应用于权利要求1-9任一项所述的一种基于大数据的绒山羊基因分析方法,其特征在于:包括,
...【技术特征摘要】
1.一种基于大数据的绒山羊基因分析方法,其特征在于:包括,
2.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤一包括:
3.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述步骤三包括:
4.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述第一数据组包括以下数据:年降雨量、年均温度、海拔、地形特征、日照时长、植被覆盖率、主要植物种类及分布、植被生长季节和生长速率、水源分布位置及数量、土壤养分含量;通过气象站以及卫星影像分析技术获得以上数据;
5.根据权利要求1所述的一种基于大数据的绒山羊基因分析方法,其特征在于:所述香农多样性指数xnd和平均杂合指数zhz通过以...
【专利技术属性】
技术研发人员:双金,许浩,
申请(专利权)人:中科云谱内蒙古基因生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。