临床数据挖掘方法、装置、电子设备和存储介质制造方法及图纸

技术编号:30894872 阅读:14 留言:0更新日期:2021-11-22 23:36
本发明专利技术提供一种临床数据挖掘,方法、装置、电子设备和存储介质,其中方法包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。本发明专利技术提供的方法、装置、电子设备和存储介质,从大量临床试验中筛选出可用于创新药物临床开发策略、市场竞争格局分析有实际价值的目标临床试验及其试验数据,避免了直接使用原始临床试验数据做主流趋势判断可能带来的方向偏颇。做主流趋势判断可能带来的方向偏颇。做主流趋势判断可能带来的方向偏颇。

【技术实现步骤摘要】
临床数据挖掘方法、装置、电子设备和存储介质


[0001]本专利技术涉及数据挖掘
,尤其涉及一种临床数据挖掘方法、装置、电子设备和存储介质。

技术介绍

[0002]创新药物开发需要长期投入大量的人力、物力和财力,创新药物临床开发策略、市场竞争格局以及项目估值具有非常重要的现实意义。一般地,临床开发策略、市场竞争格局及项目估值需要深入调研多个关键信息,如流行病学、临床指南、创新药管线、临床试验、临床数据等,其中临床试验和临床数据调研是一个无法避开的关键环节。现阶段,临床试验调研可以借助clinical trials等官方登记平台或商业化数据库,但是这些调研手段存在以下局限性:
[0003]官方登记平台记录的数据并不全面,如缺乏临床试验结果信息等,需要从其他数据源中如论文、资讯等信息中获取,多方采集的数据量庞大且数据类型多,直接使用采集所得的数据进行数据调研分析,需要付出大量人力成本和时间成本,且由于没有有效的针对核心临床数据的挖掘方法和标准,做主流趋势判断可能带来方向偏颇。

技术实现思路

[0004]本专利技术提供一种临床数据挖掘方法、装置、电子设备和存储介质,用以解决现有技术中数据量庞大不利于进行调研分析的问题。
[0005]本专利技术提供一种临床数据挖掘方法,包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
[0006]根据本专利技术提供的一种临床数据挖掘方法,所述预设挖掘规则包括如下规则中的至少一种:试验阶段挖掘规则,用于挖掘预设临床试验阶段下注册申报的临床试验;招募人数挖掘规则,用于挖掘招募人数大于对应适应症招募人数阈值的临床试验;试验类型挖掘规则,用于挖掘目标试验类型下的临床试验;指标类型挖掘规则,用于挖掘目标指标类型下的临床试验。
[0007]根据本专利技术提供的一种临床数据挖掘方法,所述基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,包括:基于所述试验阶段挖掘规则中的预设临床试验阶段,以及所述各临床试验的临床试验阶段和注册申报状态,对所述各临床试验的试验数据进行筛选;所述临床试验阶段包含在所述试验数据内,所述注册申报状态是基于所述试验数据或者所述临床试验文本确定的。
[0008]根据本专利技术提供的一种临床数据挖掘方法,所述注册申报状态是基于对应临床试验的相关公告文本确定的,所述相关公告文本是基于如下步骤确定的:基于预先设定的药品名称和原研企业名称的关联关系,确定任一临床试验的药品名称对应的原研企业名称;
基于所述任一临床试验的原研企业名称,以及所述任一临床试验的试验数据中的标识信息,从所述临床试验文本中提取所述相关公告文本。
[0009]根据本专利技术提供的一种临床数据挖掘方法,所述招募人数挖掘规则中,任一适应症的招募人数阈值是基于所述任一适应症下的各临床试验的试验招募人数确定的;所述适应症和试验招募人数包含在所述试验数据内。
[0010]根据本专利技术提供的一种临床数据挖掘方法,所述基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据,包括:基于当前挖掘规则,对上一临床试验集合进行筛选,得到当前临床试验集合;所述当前挖掘规则即基于挖掘规则执行顺序,从所述试验阶段挖掘规则、所述招募人数挖掘规则、所述试验类型挖掘规则或所述指标类型挖掘规则中确定的,首个挖掘规则的上一临床试验集合包括所述各临床试验的试验数据,最尾的临床试验集合包括所述目标临床试验及其试验数据。
[0011]根据本专利技术提供的一种临床数据挖掘方法,所述得到目标临床试验及其试验数据,之后还包括:对各目标临床试验的试验数据进行标准化处理,所述标准化处理包括适应症信息、药品信息、发起人信息、试验日期、试验地区、招募人数、试验方案、试验状态中的至少一种的标准化。
[0012]本专利技术还提供一种临床数据挖掘装置,包括:采集单元、提取单元和筛选单元。其中,采集单元用于采集临床试验文本;提取单元用于从所述临床试验文本中提取各临床试验的试验数据;筛选单元用于基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
[0013]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述临床数据挖掘方法的步骤。
[0014]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述临床数据挖掘方法的步骤。
[0015]本专利技术提供的临床数据挖掘方法、装置、电子设备和存储介质,通过基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的预设挖掘规则,从大量临床试验中筛选出可用于创新药物临床开发策略、市场竞争格局分析有实际价值的目标临床试验及其试验数据,避免了直接使用原始临床试验数据做主流趋势判断可能带来的方向偏颇,无需付出大量时间和人力成本,即可有效实现目标临床数据的挖掘,提高了数据挖掘效率和可靠性。
附图说明
[0016]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本专利技术提供的临床数据挖掘方法的流程示意图;
[0018]图2是本专利技术提供的临床数据挖掘方法中步骤130一个实施例的流程示意图;
[0019]图3是本专利技术提供的临床数据挖掘装置的结构示意图;
[0020]图4是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0021]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]图1是本专利技术提供的临床数据挖掘方法的流程示意图,如图1所示,依据本专利技术实施例提供的临床数据挖掘方法得到的目标临床试验及其试验数据,可以应用在创新药物临床开发策略的制定、预测目前及未来的市场竞争格局及项目估值。该方法包括以下步骤:
[0023]步骤110,采集临床试验文本。
[0024]在此,临床试验文本是指含有临床试验的相关信息的文本数据,临床试验文本具体可以包含多个文本,其中单个文本可以包含针对单个临床试验相关信息的文本数据,也可以包含针对多个临床试验相关信息的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种临床数据挖掘方法,其特征在于,包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。2.根据权利要求1所述的临床数据挖掘方法,其特征在于,所述预设挖掘规则包括如下规则中的至少一种:试验阶段挖掘规则,用于挖掘预设临床试验阶段下注册申报的临床试验;招募人数挖掘规则,用于挖掘招募人数大于对应适应症招募人数阈值的临床试验;试验类型挖掘规则,用于挖掘目标试验类型下的临床试验;指标类型挖掘规则,用于挖掘目标指标类型下的临床试验。3.根据权利要求2所述的临床数据挖掘方法,其特征在于,所述基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,包括:基于所述试验阶段挖掘规则中的预设临床试验阶段,以及所述各临床试验的临床试验阶段和注册申报状态,对所述各临床试验的试验数据进行筛选;所述临床试验阶段包含在所述试验数据内,所述注册申报状态是基于所述试验数据或者所述临床试验文本确定的。4.根据权利要求3所述的所述的临床数据挖掘方法,其特征在于,所述注册申报状态是基于对应临床试验的相关公告文本确定的,所述相关公告文本是基于如下步骤确定的:基于预先设定的药品名称和原研企业名称的关联关系,确定任一临床试验的药品名称对应的原研企业名称;基于所述任一临床试验的原研企业名称,以及所述任一临床试验的试验数据中的标识信息,从所述临床试验文本中提取所述相关公告文本。5.根据权利要求2所述的临床数据挖掘方法,其特征在于,所述招募人数挖掘规则中,任一适应症的招募人数阈值是基于所述任一适应症下的各临床试验的试验招募人数确定的...

【专利技术属性】
技术研发人员:蒋建华柏智强秦云贺周立运
申请(专利权)人:上海药慧信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1