一种医学科研数据关键变量的加密方法及系统技术方案

技术编号：34528267 阅读：74 留言：0更新日期：2022-08-13 21:20

本发明专利技术涉及一种医学科研数据关键变量的加密方法及系统，其包括：读取数据行，获取数据行中的所有变量；基于固定容器随机选择数据行，进而选取待加解密的变量，对选取的变量采用多线程并发进行加解密。本发明专利技术能解决医学科研数据隐私数据的安全保密需求，同时保留密文的特征，支持将密文纳入研究作为分类区分。本发明专利技术可以在医学数据处理技术领域中应用。发明专利技术可以在医学数据处理技术领域中应用。发明专利技术可以在医学数据处理技术领域中应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种医学科研数据关键变量的加密方法及系统

[0001]本专利技术涉及一种医学数据处理
，特别是关于一种医学科研数据关键变量的加密方法及系统。

技术介绍

[0002]医学科研数据收集聚焦于与人类疾病或健康相关问题的信息，其数据量较大，覆盖内容极其广泛，既包括个人基本信息、日常行为生活方式、体格检查和各种检测结果。因此，关键和隐私信息的保密是医学科研的使用中最为关键的伦理问题。
[0003]目前，处理这些关键信息最为简单和常规的方法是直接删除这些关键变量，不用于分析和利用，然而这种简单粗暴的方法也存在缺陷。医学科研数据的利用通常需要多次反复利用，或者通过这些关键量链接到更多的数据。因此，传统方法无法满足上述要求。

技术实现思路

[0004]针对上述问题，本专利技术的目的是提供一种医学科研数据关键变量的加密方法及系统，其能解决医学科研数据隐私数据的安全保密需求，同时保留密文的特征，支持将密文纳入研究作为分类区分。
[0005]为实现上述目的，本专利技术采取以下技术方案：一种医学科研数据关键变量的加密方法，其包括：读取数据行，获取数据行中的所有变量；基于固定容器随机选择数据行，进而选取待加解密的变量，对选取的变量采用多线程并发进行加解密。
[0006]进一步，所述读取数据行中，数据的格式为csv、txt、dta、sas7bdat。
[0007]进一步，所述基于固定容器随机选择数据行，包括：
[0008]在数据加密开始后先读取一部分数据到基于内存的固定大小的容器中，...

【技术保护点】

【技术特征摘要】
1.一种医学科研数据关键变量的加密方法，其特征在于，包括：读取数据行，获取数据行中的所有变量；基于固定容器随机选择数据行，进而选取待加解密的变量，对选取的变量采用多线程并发进行加解密。2.如权利要求1所述医学科研数据关键变量的加密方法，其特征在于，所述读取数据行中，数据的格式为csv、txt、dta、sas7bdat。3.如权利要求1所述医学科研数据关键变量的加密方法，其特征在于，所述基于固定容器随机选择数据行，包括：在数据加密开始后先读取一部分数据到基于内存的固定大小的容器中，直至写满容器；在每读到新的一行数据前，先从当前的容器随机取一行数据输出到目标文件，再将读取到的数据存入容器；写到目标文件中的每一行数据都是从容器中随机选取的。4.如权利要求1所述医学科研数据关键变量的加密方法，其特征在于，所述对选取的变量采用多线程并发进行加解密中，需设置密钥，所述密钥的生成方法包括：将用户输入的申请编号与本地操作系统生成的盐进行混合，生成第一中间文本；对所述第一中间文本进行Base64编码，生成第二中间文本；将所述第二中间文本进行MD5散列得到第三中间文本，将所述第三中间文本进行HEX摘要处理，将字节数组转为16位得到参与加解密运算的密钥。5.如权利要求4所述医学科研数据关键变量的加密方法，其特征在于，所述将用户输入的申请编号与本地操作系统生成的盐进行混合，包括：在所述本地操作系统生成种子文件，该种子文件与操作系统用户进行绑定，所述种子文件的内容为所述申请编号转...

【专利技术属性】
技术研发人员：余灿清，杨旭，吕筠，劳圣雄，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人