一种基于基因综合数据库的基因检测系统技术方案

技术编号:38163418 阅读:13 留言:0更新日期:2023-07-13 09:37
本发明专利技术公开了一种基于基因综合数据库的基因检测系统,该系统包括基因数据收集模块、数据库建设模块、基因检测分析模块、可视化展示模块、报告生成模块及隐私保护模块。本发明专利技术通过对目标用户上传的基因数据进行分析,且根据用户的偏好,给出目标用户个性化的治疗项目,从而可以精准匹配更加适合该用户的治疗方案,提高治疗效果;个性化的推荐可以让客户感受到专为我设计的体验,提高客户满意度和体验;找到最适合一个人的治疗方案能够降低成本和节省时间;通过保护基因检测报告中的隐私数据,从而可以让用户放心使用基因检测服务,不担心隐私风险,是建立用户信任和吸引用户的重要因素,且保护基因数据可以最大限度避免歧视风险。风险。风险。

【技术实现步骤摘要】
一种基于基因综合数据库的基因检测系统


[0001]本专利技术涉及基因检测领域,具体来说,涉及一种基于基因综合数据库的基因检测系统。

技术介绍

[0002]基因综合数据库是指收集、整合和存储基因及其表达等数据的数据库。例如国家基因组科学数据中心和OMIM基因与遗传表型数据库。而基因检测则是一种通过分析个人DNA来揭示特定基因变异的检测方法。基因检测可以为疾病的诊断、治疗和预防提供重要信息,同时由于基因之间的复杂性和潜在缺陷,基因检测仍然存在一定的局限性。因此,在进行基因检测时需要通过对检测结果进行进一步的分析,以更好地理解和解释检测结果。
[0003]在基因检测领域出现了一些基因检测的系统或方法,例如中国专利号201710170733.3公开了基因检测平台方法,其包括将受试者通过基因检测流程的检测报告输入一辅助建议模块,辅助建议模块产生该检测报告中检测出显著基因信息所对应的治疗配方组合,并传输至基因检测用户接口;该基因检测用户接口将该些建议提供受试者了解。但是上述基因检测平台方法在具体应用时还存在以下不足:(1)无法满足定制化服务需求:该方法中的治疗配方组合侧重于通用建议,缺乏针对个体特异性的定制化服务。若不考虑加入个性化推荐功能,则不能更好地满足用户需求。
[0004](2)用户隐私保护问题:基因数据涉及个人隐私,平台需要在处理、存储和传输过程中确保用户数据的安全性。该方法对这方面的应对不足,需要加强关于隐私保护的措施。
[0005]针对相关技术中的问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]针对相关技术中的问题,本专利技术提出一种基于基因综合数据库的基因检测系统,以克服现有相关技术所存在的上述技术问题。
[0007]为此,本专利技术采用的具体技术方案如下:一种基于基因综合数据库的基因检测系统,该系统包括基因数据收集模块、数据库建设模块、基因检测分析模块、可视化展示模块、报告生成模块及隐私保护模块。
[0008]其中,所述基因数据收集模块,用于收集基因数据以及相应的不同治疗项目,并对基因数据进行质量评估、预处理和标准化处理。
[0009]所述数据库建设模块,用于根据收集的基因数据以及相应的治疗项目构建综合数据库,且该综合数据库具备数据存储、检索、更新和维护功能。
[0010]所述基因检测分析模块,用于对目标用户上传的基因数据进行分析,且根据用户的偏好,给出目标用户个性化的治疗项目。
[0011]所述可视化展示模块,用于将综合数据库中的基因数据通过染色体图谱、基因结构图、生物通路图的方式进行可视化展示。
[0012]所述报告生成模块,用于将基因数据转化为基因检测报告,并将用户个性化的治
疗项目填写在基因检测报告中预先设定的位置。
[0013]所述隐私保护模块,用于对基因检测报告中的隐私数据进行处理,并保护基因检测报告中的隐私数据。
[0014]进一步的,所述基因数据收集模块包括质量评估模块、预处理模块及标准化处理模块;其中,所述质量评估模块,用于对基因数据进行质控,排除低质量或有错误的数据。
[0015]所述预处理模块,用于对基因数据进行去污染、去适配体、去低质量序列、过滤重复序列、进行序列纠错预处理操作;所述标准化处理模块,用于对经过预处理的基因数据进行标准化处理。
[0016]进一步的,所述基因检测分析模块包括评分模块、相似度计算模块及推荐模块。
[0017]其中,所述评分模块,用于获取若干用户对基因数据对应的不同治疗项目的评分,评分采用五分制,最喜欢为五分,最不喜欢为一分,同时构建用户

治疗项目的评分矩阵R。
[0018]所述相似度计算模块,用于计算目标用户与其他用户的相似度,并生成目标用户的最近邻居集合。
[0019]所述推荐模块,用于在最近邻居集合中使用TOP

N方法选出排名靠前的n个用户作为目标用户实际选择的邻居用户,且根据相似度最高的邻居用户对一项基因数据对应的不同治疗项目的评分向目标用户推荐个性化的治疗项目。
[0020]进一步的,所述根据相似度最高的邻居用户对一项基因数据对应的不同治疗项目的评分向目标用户推荐个性化的治疗项目时,预测评分的计算公式为:
[0021]式中,为目标用户I与相似度最高的邻居用户J之间的相似度;为相似度最高的邻居用户J对第h个治疗项目的评分;表示目标用户I对第h个治疗项目的预测评分;和分别为目标用户I和相似度最高的邻居用户J对一项基因数据所有已评分治疗项目的平均评分;将预测评分从高到低排序,选取前x个治疗项目作为推荐结果返回给目标用户。
[0022]进一步的,所述计算目标用户与其他用户的相似度时,采用余弦相似度的算法计算相似度:
[0023]式中,cos(θ)为相似度,n为非零自然数;A
i
为目标用户对一项基因数据对应的第i个治疗项目的评分,B
i
为任一其他用户对一项基因数据对应的第i个治疗项目的评分。
[0024]进一步的,所述隐私保护模块包括标识模块、隐藏拆分模块、验证模块、合并模块
及统计模块。
[0025]所述标识模块,用于对每个用户上传的基因数据进行标识,并分配唯一ID。
[0026]所述隐藏拆分模块,用于按照预先设定的规则对用户的基因检测报告中基因数据进行隐藏,得到隐藏基因检测报告,同时将用户的基因检测报告及隐藏基因检测报告分别进行拆分,得到若干基因检测报告的拆分部分和若干隐藏基因检测报告的拆分部分。
[0027]所述验证模块,用于当用户查看自身的基因检测报告时,验证基因检测报告的拆分部分是否完整及正确。
[0028]所述合并模块,用于若基因检测报告的拆分部分完整且正确时,将用户的若干基因检测报告的拆分部分进行合并。
[0029]所述统计模块,用于统计基因检测报告中各项目的统计值,并确定每个用户中任一项目的统计值在所有用户中的分布位置。
[0030]进一步的,所述隐藏拆分模块包括隐藏模块及拆分模块。
[0031]所述隐藏模块,用于将用户的基因检测报告中基因数据进行平方处理,得到隐藏基因检测报告。
[0032]所述拆分模块,用于对基因检测报告或隐藏基因检测报告拆分为若干部分,并将每一部分独立存储在不同的分布式服务器中。
[0033]进一步的,所述验证基因检测报告的拆分部分是否完整时,预先通过数字签名技术,对基因检测报告的拆分部分进行签名,确保基因检测报告的拆分部分在传输过程中未被篡改,且通过接收基因检测报告的拆分部分的服务器对签名进行验证,对基因检测报告的拆分部分是否完整进行确认。
[0034]进一步的,所述验证基因检测报告的拆分部分是否正确时,根据隐藏基因检测报告与基因检测报告中基因数据的对应关系,对基因检测报告的拆分部分是否正确进行验证。
[0035]进一步的,所述确定每个用户中任一项目的统计值在所有用户中的分布位置之后,删除统计值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基因综合数据库的基因检测系统,其特征在于,该系统包括基因数据收集模块、数据库建设模块、基因检测分析模块、可视化展示模块、报告生成模块及隐私保护模块;其中,所述基因数据收集模块,用于收集基因数据以及相应的不同治疗项目,并对基因数据进行质量评估、预处理和标准化处理;所述数据库建设模块,用于根据收集的基因数据以及相应的治疗项目构建综合数据库,且该综合数据库具备数据存储、检索、更新和维护功能;所述基因检测分析模块,用于对目标用户上传的基因数据进行分析,且根据用户的偏好,给出目标用户个性化的治疗项目;所述可视化展示模块,用于将综合数据库中的基因数据通过染色体图谱、基因结构图、生物通路图的方式进行可视化展示;所述报告生成模块,用于将基因数据转化为基因检测报告,并将用户个性化的治疗项目填写在基因检测报告中预先设定的位置;所述隐私保护模块,用于对基因检测报告中的隐私数据进行处理,并保护基因检测报告中的隐私数据。2.根据权利要求1所述的一种基于基因综合数据库的基因检测系统,其特征在于,所述基因数据收集模块包括质量评估模块、预处理模块及标准化处理模块;其中,所述质量评估模块,用于对基因数据进行质控,排除低质量或有错误的数据;所述预处理模块,用于对基因数据进行去污染、去适配体、去低质量序列、过滤重复序列、进行序列纠错预处理操作;所述标准化处理模块,用于对经过预处理的基因数据进行标准化处理。3.根据权利要求2所述的一种基于基因综合数据库的基因检测系统,其特征在于,所述基因检测分析模块包括评分模块、相似度计算模块及推荐模块;其中,所述评分模块,用于获取若干用户对基因数据对应的不同治疗项目的评分,评分采用五分制,最喜欢为五分,最不喜欢为一分,同时构建用户

治疗项目的评分矩阵R;所述相似度计算模块,用于计算目标用户与其他用户的相似度,并生成目标用户的最近邻居集合;所述推荐模块,用于在最近邻居集合中使用TOP

N方法选出排名靠前的n个用户作为目标用户实际选择的邻居用户,且根据相似度最高的邻居用户对一项基因数据对应的不同治疗项目的评分向目标用户推荐个性化的治疗项目。4.根据权利要求3所述的一种基于基因综合数据库的基因检测系统,其特征在于,所述根据相似度最高的邻居用户对一项基因数据对应的不同治疗项目的评分向目标用户推荐个性化的治疗项目时,预测评分的计算公式为:5.式中,为目标用户I与相似度最高的邻居用户J之间的相似度;为相似度最高的邻居用户J对第h个治疗项目的评分;表示目标用户I对第h个治疗项目的预测评分;
和分别为目标用户I和相似度最高的邻居用户J对一项基因数...

【专利技术属性】
技术研发人员:刘晓丽王泽众赵小丽李宗泽韩利涛朱元至赵世航魏楠娄延岳张诚明李东
申请(专利权)人:河南农业职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1