当前位置: 首页 > 专利查询>北京大学专利>正文

一种医学科研数据关键变量的加密方法及系统技术方案

技术编号:34528267 阅读:74 留言:0更新日期:2022-08-13 21:20
本发明专利技术涉及一种医学科研数据关键变量的加密方法及系统,其包括:读取数据行,获取数据行中的所有变量;基于固定容器随机选择数据行,进而选取待加解密的变量,对选取的变量采用多线程并发进行加解密。本发明专利技术能解决医学科研数据隐私数据的安全保密需求,同时保留密文的特征,支持将密文纳入研究作为分类区分。本发明专利技术可以在医学数据处理技术领域中应用。发明专利技术可以在医学数据处理技术领域中应用。发明专利技术可以在医学数据处理技术领域中应用。

【技术实现步骤摘要】
一种医学科研数据关键变量的加密方法及系统


[0001]本专利技术涉及一种医学数据处理
,特别是关于一种医学科研数据关键变量的加密方法及系统。

技术介绍

[0002]医学科研数据收集聚焦于与人类疾病或健康相关问题的信息,其数据量较大,覆盖内容极其广泛,既包括个人基本信息、日常行为生活方式、体格检查和各种检测结果。因此,关键和隐私信息的保密是医学科研的使用中最为关键的伦理问题。
[0003]目前,处理这些关键信息最为简单和常规的方法是直接删除这些关键变量,不用于分析和利用,然而这种简单粗暴的方法也存在缺陷。医学科研数据的利用通常需要多次反复利用,或者通过这些关键量链接到更多的数据。因此,传统方法无法满足上述要求。

技术实现思路

[0004]针对上述问题,本专利技术的目的是提供一种医学科研数据关键变量的加密方法及系统,其能解决医学科研数据隐私数据的安全保密需求,同时保留密文的特征,支持将密文纳入研究作为分类区分。
[0005]为实现上述目的,本专利技术采取以下技术方案:一种医学科研数据关键变量的加密方法,其包括:读取数据行,获取数据行中的所有变量;基于固定容器随机选择数据行,进而选取待加解密的变量,对选取的变量采用多线程并发进行加解密。
[0006]进一步,所述读取数据行中,数据的格式为csv、txt、dta、sas7bdat。
[0007]进一步,所述基于固定容器随机选择数据行,包括:
[0008]在数据加密开始后先读取一部分数据到基于内存的固定大小的容器中,直至写满容器;
[0009]在每读到新的一行数据前,先从当前的容器随机取一行数据输出到目标文件,再将读取到的数据存入容器;写到目标文件中的每一行数据都是从容器中随机选取的。
[0010]进一步,所述对选取的变量采用多线程并发进行加解密中,需设置密钥,所述密钥的生成方法包括:
[0011]将用户输入的申请编号与本地操作系统生成的盐进行混合,生成第一中间文本;
[0012]对所述第一中间文本进行Base64编码,生成第二中间文本;
[0013]将所述第二中间文本进行MD5散列得到第三中间文本,将所述第三中间文本进行HEX摘要处理,将字节数组转为16位得到参与加解密运算的密钥。
[0014]进一步,所述将用户输入的申请编号与本地操作系统生成的盐进行混合,包括:
[0015]在所述本地操作系统生成种子文件,该种子文件与操作系统用户进行绑定,所述种子文件的内容为所述申请编号转换过程中的所述盐。
[0016]进一步,所述加解密采用AES

192算法。
[0017]进一步,所述对选取的变量采用多线程并发进行加解密,包括:
[0018]开启两个线程,第一线程用于从数据行读取数据,第二线程用于将加密结果写入数据文件;
[0019]同时开启若干个第三线程进行并发加解密处理,若干所述第三线程并行地将输入数据行进行变量提取、对选定的变量进行加解密处理,处理后重新组装加密的变量和未加密的变量作为数据行,将组合后的数据行发送给用于写文件的所述第二线程,所述第二线程调用操作系统的追加写文件接口,即将处理完成后的数据行追加写入数据文件中。
[0020]一种医学科研数据关键变量的加密系统,其包括:数据读取模块,读取数据行,获取数据行中的所有变量;加解密模块,基于固定容器随机选择数据行,进而选取待加解密的变量,对选取的变量采用多线程并发进行加解密。
[0021]一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行上述方法中的任一方法。
[0022]一种计算设备,其包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行上述方法中的任一方法的指令。
[0023]本专利技术由于采取以上技术方案,其具有以下优点:
[0024]1、本专利技术具有快速,安全,方便的特点,能实现对变量进行加密、解密、打乱等操作,以解决医学科研数据隐私数据的安全保密需求,同时保留密文的特征,支持将密文纳入研究作为分类区分。
[0025]2、本专利技术针对医学科研数据的数据量庞大的特征,实现了快速、高效、内存占用小的加解密处理过程。
[0026]3、本专利技术对科研数据保密性和安全性提供保障,同时支持超大文件加解密操作,为对医学科研数据进行研究的科研人员提供便利。
附图说明
[0027]图1是本专利技术一实施例中医学科研数据关键变量的加密方法流程示意图;
[0028]图2是本专利技术一实施例中密钥的生成示意图;
[0029]图3是本专利技术一实施例中采用多线程并发进行加解密处理流程示意图。
具体实施方式
[0030]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例的附图,对本专利技术实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于所描述的本专利技术的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0032]为了更好的描述本专利技术的技术方案,对相关术语进行定义解释如下:
[0033]“明文”是指用户输入或指定的需要进行加密处理的文本。
[0034]“密钥”是指用户输入或指定的参与加密过程的密码文本。
[0035]“密文”是指经过加密处理后输出的文本。
[0036]“加密”是指将明文和密钥进行处理后得到密文的操作。
[0037]“解密”是指将密文和密钥进行处理后得到明文的操作。
[0038]“加解密”是加密与解密双向操作的简称。
[0039]在本专利技术的一个实施例中,提供一种医学科研数据关键变量的加密方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,加密或解密操作以基于密码学中的对称加密算法(Symmetric

Key Cryptography)为例进行说明,医学科研数据通常是结构化数据,对具有数据量大,变量多等特点的医学科研数据进行处理,如图1所示,该方法包括以下步骤:
[0040]1)读取数据行,获取数据行中的所有变量;
[0041]2)基于固定容器随机选择数据行,进而选取待加解密的变量,对选取的变量采用多线程并发进行加解密。
[0042]使用时,对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学科研数据关键变量的加密方法,其特征在于,包括:读取数据行,获取数据行中的所有变量;基于固定容器随机选择数据行,进而选取待加解密的变量,对选取的变量采用多线程并发进行加解密。2.如权利要求1所述医学科研数据关键变量的加密方法,其特征在于,所述读取数据行中,数据的格式为csv、txt、dta、sas7bdat。3.如权利要求1所述医学科研数据关键变量的加密方法,其特征在于,所述基于固定容器随机选择数据行,包括:在数据加密开始后先读取一部分数据到基于内存的固定大小的容器中,直至写满容器;在每读到新的一行数据前,先从当前的容器随机取一行数据输出到目标文件,再将读取到的数据存入容器;写到目标文件中的每一行数据都是从容器中随机选取的。4.如权利要求1所述医学科研数据关键变量的加密方法,其特征在于,所述对选取的变量采用多线程并发进行加解密中,需设置密钥,所述密钥的生成方法包括:将用户输入的申请编号与本地操作系统生成的盐进行混合,生成第一中间文本;对所述第一中间文本进行Base64编码,生成第二中间文本;将所述第二中间文本进行MD5散列得到第三中间文本,将所述第三中间文本进行HEX摘要处理,将字节数组转为16位得到参与加解密运算的密钥。5.如权利要求4所述医学科研数据关键变量的加密方法,其特征在于,所述将用户输入的申请编号与本地操作系统生成的盐进行混合,包括:在所述本地操作系统生成种子文件,该种子文件与操作系统用户进行绑定,所述种子文件的内容为所述申请编号转...

【专利技术属性】
技术研发人员:余灿清杨旭吕筠劳圣雄
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1