本发明专利技术提供一种保护隐私的药物临床应用频谱统计方法,包括:查询方获取目标药物成分和分组项,向样本方下发局部统计任务;样本方接收并执行查询方下发的局部统计任务,将局部统计任务的结果返回至查询方;查询方对局部统计任务的结果进行聚合处理,得到全局统计结果。根据本发明专利技术示例性实施例的保护隐私的药物临床应用频谱统计方法及装置,通过联邦学习的方式通过局部统计和全局聚合的方式得到分析结果,避免原始诊疗记录隐私信息的泄露;样本方对局部统计结果通过添加差分隐私噪声,避免了查询方对样本方的差分攻击。了查询方对样本方的差分攻击。了查询方对样本方的差分攻击。
【技术实现步骤摘要】
一种保护隐私的药物临床应用频谱统计方法和装置
[0001]本专利技术涉及隐私计算领域,尤其涉及一种保护隐私的药物临床应用频谱统计方法和装置。
技术介绍
[0002]对采用某一类药物的历史临床应用病例进行频谱分布分析,有助于药物研发机构调整研发决策,提高药品的市场竞争力。目标药物在临床应用中的分布分析依赖于大量真实的临床病例,这些病例一方面分散在不同的医院内,导致单个医院的病例样本数量有限不足以支撑分布分析的有效性;另一方面,临床诊断病例涉及到病人的隐私,医院出于隐私保护的目的禁止共享这些病例。
[0003]目前,药品研发机构无法直接访问这部分数据,只能侧面形式了解。故药品研发机构对所研发的药品在临床手术的应用情况了解比较局限和片面,会影响其研发投入、市场决策。如何在隐私保护下对各医院的处方和手术记录进行合规的术式分布分析,对确认后续研究的目标疾病以及研究应该有哪些分层具有重要意义。
[0004]因此,如何提供一种有效保护病例隐私的药物临床应用频谱分析方法,成为亟待解决的技术问题。
技术实现思路
[0005]有鉴于此,本专利技术主要解决的是如何在不获取医疗机构诊断数据的情况下,对相关病例的用药进行统计分析,得到药物的分布谱;本专利技术采用差分联邦学习的方法进行分布式统计,从而对多家医院的手术用药记录进行局部计算全局汇总,并未泄露原始诊疗记录。该专利技术可以辅助研发机构了解药品在真实世界中用药情况是什么样的,确认后续研究的目标疾病。
[0006]一方面,本专利技术提供一种保护隐私的药物临床应用频谱统计方法,包括:S1:查询方获取目标药物成分和分组项,向样本方下发局部统计任务;S2:样本方接收并执行查询方下发的局部统计任务,将局部统计任务的结果返回至查询方;S3:查询方对局部统计任务的结果进行聚合处理,得到全局统计结果。
[0007]进一步地,步骤S2中所述样本方接收并执行查询方下发的局部统计任务,包括:S21:查询包含目标药物成分、分组项的病例信息,得到查询结果;S22:按照分组项对所述查询结果进行分组,得到分组项集合,统计每个分组项的真实计数值,得到真实计数值集合;S23:对真实计数值进行差分隐私处理,得到添加噪声后的噪声计数值集合;S24:将所述分组项集合和对应的所述噪声计数值集合作为局部统计任务的结果,返回给查询方。
[0008]进一步地,步骤S22中,按照分组项对所述查询结果进行分组,得到分组项集合,采
用以下方式表示:式中,表示样本方t的分组项集合,t表示样本方序数,m表示分组ID,表示样本方t中第m个分组项。
[0009]进一步地,步骤S22中,真实计数值集合采用以下方式表示:式中, 表示样本方t的真实计数值集合,t表示样本方序数,m表示分组ID, 表示样本方t中第i个分组项对应的真实计数值。
[0010]进一步地,步骤S23中,对真实计数值进行差分隐私处理,包括:遍历所有分组项对应的真实计数值,对每一个真实计数值加上一个从拉普拉斯分布L(0, 1/ε)采样的随机噪声值。
[0011]进一步地,步骤S23中,按以下方法得到添加噪声后的噪声计数值:式中,为添加噪声后样本方t的噪声计数值集合,为从拉普拉斯分布L(0, 1/ε)采样的随机噪声值,1/ε为拉普拉斯分布的尺度参数。
[0012]进一步地,步骤S3中,查询方对局部统计任务的结果进行聚合处理,包括:遍历所有样本方局部统计任务的结果。
[0013]进一步地,步骤S3中,查询方对局部统计任务的结果进行聚合处理,按以下方法进行:式中,k为分组项ID,X
k
为第k个分组项的全局计数值, 为样本方t中真实计数值集合中第k个真实计数值添加噪声后的噪声计数值,表示样本方t的分组项集合。
[0014]另一方面,本专利技术提供一种基于差分联邦统计的药物临床应用分布分析装置,包括:查询模块,包括任务调度单元和聚合统计单元,其中,任务调度单元用于获取目标药物成分和分组项,向样本方下发局部统计任务;聚合统计单元用于;样本模块,包括样本库单元和差分统计单元,其中,差分统计单元用于从样本库单元中查询包含目标药物成分、分组项的病例信息,得到查询结果;按照分组项对所述查询结果进行分组,统计每个分组内的病例数目和每个分组对应的真实计数值;对真实计数值进行差分隐私处理,得到添加噪声后的噪声计数值;将所述分组项和对应的所述噪声计数值作为局部统计结果,返回给查询方。
[0015]最后,本专利技术还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现所述方法的步骤。
[0016]本专利技术保护隐私的药物临床应用频谱统计方法及装置,具有以下有益效果:
1)通过联邦学习的方式通过局部统计和全局聚合的方式得到分析结果,避免原始诊疗记录隐私信息的泄露;2)样本方对局部统计结果通过添加差分隐私噪声,避免了查询方对样本方的差分攻击。
附图说明
[0017]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0018]图1为本专利技术示例性第一实施例保护隐私的药物临床应用频谱统计方法的流程图。
[0019]图2为本专利技术示例性第二实施例保护隐私的药物临床应用频谱统计方法的流程图。
[0020]图3为本专利技术示例性第四实施例基于差分联邦统计的药物临床应用分布分析装置的框架图。
[0021]图4为本专利技术示例性第五实施例基于差分联邦统计的药物临床应用分布分析应用时的框架图。
具体实施方式
[0022]下面结合附图对本专利技术实施例进行详细描述。
[0023]需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0024]需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
[0025]图1为根据本专利技术示例性第一实施例的一种保护隐私的药物临床应用频谱统计方法的流程图,如图1所示,本实施例所述方法,包括:S1:查询方获取目标药物成分和分组项,向样本方下发局部统计任务;S2:样本方接收并执行查询方下发的局部统计任务,将局部统计任务的结果返回至查询方;S3:查询本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种保护隐私的药物临床应用频谱统计方法,其特征在于,所述方法包括:S1:查询方获取目标药物成分和分组项,向样本方下发局部统计任务;S2:样本方接收并执行查询方下发的局部统计任务,将局部统计任务的结果返回至查询方;S3:查询方对局部统计任务的结果进行聚合处理,得到全局统计结果。2.根据权利要求1所述的保护隐私的药物临床应用频谱统计方法,其特征在于,步骤S2中所述样本方接收并执行查询方下发的局部统计任务,包括:S21:查询包含目标药物成分、分组项的病例信息,得到查询结果;S22:按照分组项对所述查询结果进行分组,得到分组项集合,统计每个分组项的真实计数值,得到真实计数值集合;S23:对真实计数值进行差分隐私处理,得到添加噪声后的噪声计数值集合;S24:将所述分组项集合和对应的所述噪声计数值集合作为局部统计任务的结果,返回给查询方。3.根据权利要求2所述的保护隐私的药物临床应用频谱统计方法,其特征在于,步骤S22中,按照分组项对所述查询结果进行分组,得到分组项集合,采用以下方式表示:式中,表示样本方t的分组项集合,t表示样本方序数,m表示分组ID, 表示样本方t中第m个分组项。4.根据权利要求3所述的保护隐私的药物临床应用频谱统计方法,其特征在于,步骤S22中,真实计数值集合采用以下方式表示:式中,表示样本方t的真实计数值集合,t表示样本方序数,m表示分组ID,表示样本方t中第i个分组项对应的真实计数值。5.根据权利要求4所述的保护隐私的药物临床应用频谱统计方法,其特征在于,步骤S23中,对真实计数值进行差分隐私处理,包括:遍历所有分组项对应的真实计数值,对每一个真实计数值加上一个从拉普拉斯分布L(0, 1/ε)采样的随机噪声值,1/ε为拉普拉斯分布...
【专利技术属性】
技术研发人员:陆林,何德峰,窦书明,张晓娟,余文峰,黄飞,
申请(专利权)人:中电云数智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。