基于制造技术

技术编号:39751262 阅读:11 留言:0更新日期:2023-12-17 23:49
本发明专利技术公开了一种基于

【技术实现步骤摘要】
基于ARM架构云平台的基因数据处理方法及系统


[0001]本专利技术涉及
ARM
架构云平台
,尤其涉及一种基于
ARM
架构云平台的基因数据处理方法及系统


技术介绍

[0002]在基因组学和生物信息学领域,基因数据处理是分析和解释基因组测序数据的关键步骤

目前,对于基因数据的处理,一般采用的是串行计算方法

传统的串行计算方法是一种逐步处理的方式,它按顺序执行数据处理的各个步骤

然而,随着高通量测序技术的迅速发展,测序数据量呈指数级增长,传统的串行计算方法已无法满足需求,面临诸多技术问题

其中包括大规模数据处理效率低下,导致数据处理时间延长,无法充分利用现代处理器和计算平台的潜力;数据存储和传输瓶颈,大规模基因数据需要大量存储空间并可能影响整体效率;数据精度和准确性要求高,大规模数据处理中的错误和噪声增多,可能影响研究结果;缺乏实时数据处理能力,某些应用需要快速处理数据以指导临床决策;传统串行计算方法可能导致计算资源浪费


技术实现思路

[0003]为解决现有技术中存在的技术问题,本专利技术提出基于
ARM
架构云平台的基因数据处理方法及系统,通过将
samblaster

x86
架构计算平台移植到
ARM
架构云平台并进行并行化等优化,进一步提高
samblaster
对基因数据的处理速度和效率,同时通过云平台为用户提供大规模基因数据处理服务

[0004]为了达到上述目的,本专利技术技术方案为:
[0005]第一方面提供了一种基于
ARM
架构云平台的基因数据处理方法,包括:
[0006]S1
:搭建基于
ARM
架构的华为云平台;
[0007]S2
:获取
samblaster
源码包,将其上传至华为云平台,调整时钟使其适配
ARM
架构,编译安装
samblaster
并在
ARM
架构下验证;
[0008]S3
:基于
ARM
架构对
samblaster
进行优化并重新编译;
[0009]S4
:编译安装
samblaster
管道运行所需软件
bwa、samtools
,搭建基于
ARM
架构的基因数据处理环境;
[0010]S5
:基于搭建的基因数据处理环境为用户提供基因数据处理服务,具体包括:接收用户的云服务请求,对基因数据进行处理,并向用户返回处理后的基因数据

[0011]在一种实施方式中,步骤
S2
包括:
[0012]S2.1
:下载
samblaster
源码包;
[0013]S2.2
:使用
WinSCP
工具将其上传至服务器的
/root/samblaster
目录;
[0014]S2.3
:统一时钟;
[0015]S2.4
:编译安装
samblaster
并在
ARM
架构下验证
samblaster
的版本是否正确

[0016]在一种实施方式中,
S2.4
包括:
[0017]使用
PuTTY
工具以
root
用户身份登录服务器;
[0018]进入
samblaster
安装目录;
[0019]编译
samblaster

[0020]将文件拷贝到
/usr/local/bin/.
路径下;
[0021]验证
samblaster
的版本是否正确

[0022]在一种实施方式中,步骤
S3
中的优化方式包括:
[0023]编译优化

实现高效的内存访问机制和使用
OpenMP
进行并行化优化

[0024]在一种实施方式中,编译优化包括:使用华为毕昇编译器编译

优化编译选项或者优化原子操作多核场景;实现高效的内存访问机制具体包括:选择文件缓冲机制

减少内存拷贝

使用
jemalloc
优化内存分配或者修改业务代码使读写频繁的数据以缓存行大小对齐

[0025]在一种实施方式中,
S4
中编译安装
bwa
包括:
[0026]使用
PuTTY
工具以
root
用户身份登录服务器;
[0027]下载
bwa
安装包;
[0028]进入
bwa
安装目录;
[0029]修改
ksw.c
文件中的头文件,使其可以适配于
ARM
架构;
[0030]编译安装
bwa。
[0031]在一种实施方式中,步骤
S4
中编译安装
samtools
包括:
[0032]以
root
用户身份登录服务器;
[0033]下载
samtools
安装包;
[0034]解压
samtools
安装包;
[0035]进入
samtools
安装目录;
[0036]安装软件运行所需相关依赖包,包括支持
bzip2
压缩算法的库
bzip2

devel、
提供控制终端屏幕和键盘输入的功能的库
ncurses
以及支持
xz
压缩算法的库
xz

devel

[0037]编译安装
samtools。
[0038]在一种实施方式中,步骤
S5
包括:
[0039]S5.1
:设置远程访问权限,在华为云平台上配置安全组规则或防火墙,以允许远程访问;
[0040]S5.2
:为用户创建访问凭证及个人文件夹,访问凭证包括用户名和密码或
SSH
密钥;
[0041]S5.3
:向用户提供服务器的
IP
地址和端口号,以使用户通过
WinSCP
工具将需要处理的基因数据传输至个人文件夹,并通过
PuTTY
工具使用对应的访问凭本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于
ARM
架构云平台的基因数据处理方法,其特征在于,包括:
S1
:搭建基于
ARM
架构的华为云平台;
S2
:获取
samblaster
源码包,将其上传至华为云平台,调整时钟使其适配
ARM
架构,编译安装
samblaster
并在
ARM
架构下验证;
S3
:基于
ARM
架构对
samblaster
进行优化并重新编译;
S4
:编译安装
samblaster
管道运行所需软件
bwa、samtools
,搭建基于
ARM
架构的基因数据处理环境;
S5
:基于搭建的基因数据处理环境为用户提供基因数据处理服务,具体包括:接收用户的云服务请求,对基因数据进行处理,并向用户返回处理后的基因数据
。2.
如权利要求1所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,步骤
S2
包括:
S2.1
:下载
samblaster
源码包;
S2.2
:使用
WinSCP
工具将其上传至服务器的
/root/samblaster
目录;
S2.3
:统一时钟;
S2.4
:编译安装
samblaster
并在
ARM
架构下验证
samblaster
的版本是否正确
。3.
如权利要求2所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,
S2.4
包括:使用
PuTTY
工具以
root
用户身份登录服务器;进入
samblaster
安装目录;编译
samblaster
;将文件拷贝到
/usr/local/bin/.
路径下;验证
samblaster
的版本是否正确
。4.
如权利要求1所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,步骤
S3
中的优化方式包括:编译优化

实现高效的内存访问机制和使用
OpenMP
进行并行化优化
。5.
如权利要求4所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,编译优化包括:使用华为毕昇编译器编译

优化编译选项或者优化原子操作多核场景;实现高效的内存访问机制具体包括:选择文件缓冲机制

减少内存拷贝

使用
jemalloc
优化内存分配或者修改业务代码使读写频繁的数据以缓存行大小对齐
。6.
如权利要求1所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,
S4
...

【专利技术属性】
技术研发人员:边雨璇李沛段元元吕照阳姚世雄
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1