一种治疗方案结构化数据库的构建方法和应用技术

技术编号:32431749 阅读:26 留言:0更新日期:2022-02-24 18:46
本发明专利技术公开了一种治疗方案结构化数据库的构建方法和应用,通过建立治疗方案分词模型、药物单体数据库、药物组合方案数据库、治疗方案时序逻辑数据库、治疗方案

【技术实现步骤摘要】
一种治疗方案结构化数据库的构建方法和应用


[0001]本专利技术涉及医疗信息处理和医学文献数据挖掘的
,特别是涉及一种治疗方案结构化数据库的构建方法和应用。

技术介绍

[0002]医疗方案是医生根据患者的具体情况,制定适合的治疗方法对患者进行治疗的方案。
[0003]目前,尚无相关文献或报道公开关于结构化治疗方案方面的数据,与治疗方案相关的专利文献也为数不多,例入:公开日为2020年4月21日,公开号为CN111046649A的中国专利技术专利申请文献公开了一种文本分割方法和装置;公开日为2020年6月2日,公开号为CN111223543A的中国专利技术专利申请文献公开了一种治疗方案智能指导的方法、系统和设备,通过建立治疗方案数据库;公开日为2017年1月11日,公开号为CN106326645A的中国专利技术专利申请文献公开了一种治疗方案信息支持管理系统;公开日为2019年6月7日,公开号为CN109859851A的中国专利技术专利申请文献公开了一种治疗方案推荐方法和装置。上述专利文献涉及的技术方案,均仅仅是使用现有的公开药品数据库、药品说明书、器械操作规范等公开数据,通过信息提取手段对其中部分信息进行展示,未涉及治疗方案本身的结构化和图形化展示等。
[0004]随着当前医疗领域信息化的不断深入,将病案等真实世界数据进行电子化和结构化成为医疗数据研究的迫切需求。治疗方案作为其中一种数据类型,也急需一种结构化程度高,调取方便的数据库进行数据存储。
[0005]在实际治疗中,特别是在慢性疾病治疗过程中,治疗方案具有一定的复杂性,尤其是长期的组合治疗方案具有显著的复杂性。医生在开具或调整处方过程中,往往需要花费大量精力用于特定治疗药物的调取、药物剂量的调整以及药物使用时序性的说明。在中国医疗服务资源匮乏的现状下,通过建立来自指南、标准教科书等来源的已知治疗方案的数据库,完善治疗方案、疾病类型、方案疗效证据,这三者之间的映射关系,从而调取适用的治疗方案组合进行图形化展示,有助于提高医生的工作效率。
[0006]除此以外,随着现代生物医学各研究领域的长足发展,每天都有大量新的治疗方案疗效以及不同治疗方案比较的报道,医学研究者和医务工作者需要每天阅读大量的专业文献,才能跟上现代医学研究的发展速度。通过人工智能自然语言分词等自动化辅助技术,不断扩充结构化治疗方案数据库,可以解决医务工作者有限的学习时间与海量数据查阅的矛盾。

技术实现思路

[0007]本专利技术目的在于提供一种方案结构化数据库的构建方法和系统,该数据库为临床研究前沿文献、真实世界病案数据、指南以及标准教材等不同来源、不同结构的治疗方案提供标准化、结构化的描述逻辑和存储方法,并通过建立治疗方案-疾病类型-疗效证据之间
的映射关系,以及前端模糊检索、方案调取以及图形界面的个体化方案调整等功能,为医疗工作者和患者输出针对特定疾病的定制化、可视化、图形化的合理治疗方案,同时提供治疗方案的疗效证据,提高医疗质量和效率。
[0008]本专利技术的技术方案如下:一种治疗方案结构化数据库的构建方法,其特征在于,具体的构建方案如下:(1)利用自然语言分词技术,在相应训练语料中选择需和治疗方案建立映射关系的信息进行分词和词性标注,建立治疗方案分词模型,对治疗方案进行分词和词性标注。
[0009]这里的自然语言分词模型至少包括Mecab中文分词模型、jieba分词模型、WMSeg模型、LTP模型、机械分词算法模型、n-gram模型、HMM(隐马尔可夫)模型、CRF(条件随机场)模型以及深度神经网络模型等。
[0010](2)建立药物单体子数据库,对药物单体子数据库中的药品中文通用名称、药品英文通用名称、商品名、别名、常见不良反应、禁忌症、给药部位、给药方式、用药剂量、剂量单位、给药频率等结构化模块进行与步骤(1)对应的词性标注,存储药品单体结构化信息,建立给定药物的特定用量和给药时间与特定疾病和特定治疗阶段的映射关系,建立药物单体数据库。
[0011](3)建立药物组合方案子数据库,对药物组合方案子数据库中的组合方案通用名称、组合方案缩写词、药品组合方式等结构化模块进行与步骤(1)对应的词性标注,以步骤(2)建立的药物单体数据库为基础,在特定疾病和特定治疗阶段的映射条件下,调取药物单体数据库中的特定药品,进行组合,并与药物组合方案名称建立映射关系,建立药物组合方案数据库。
[0012](4)建立治疗方案时序逻辑子数据库,对治疗方案时序逻辑子数据库中的治疗频率、治疗周期、时间逻辑词、关系逻辑词等结构化模块进行与步骤(1)对应的词性标注,写入同一治疗方案下,不同药物单体、药物组合方案的相对时序逻辑,为治疗方案数据库增加时间维度,建立治疗方案时序逻辑数据库;所述治疗方案继承步骤(2)和步骤(3)中的特定疾病和特定治疗阶段的映射关系,即表明此处的治疗方案时序逻辑数据库在建立时序逻辑后,这种有时序逻辑的治疗方案继续使用从步骤(2)-(3)中被调取药物或药物组合方案的所关联的特定疾病和特定治疗阶段的映射关系。
[0013](5)继承步骤(3)-步骤(4)中对于特定疾病和特定治疗阶段的映射关系,提取治疗方案来源数据中关于该治疗方案疗效分析或疗效对比数据,与该治疗方案建立映射关系,建立治疗方案-疾病-疗效证据映射关系数据库。
[0014]从而,完成治疗方案结构化数据库的建立。
[0015]根据上述数据库的建立过程,步骤(1)的具体建立方式为:首先,通过公共的药品数据库、药物商品名/别名数据库、药品说明书等,以及自建药物组合方案缩写语料库(例如TP方案、FOLFOX方案等),为分词模型提供药品名称和药物组合方案缩写训练语料;通过自建给药剂量和剂量单位语料库(2mg/kg,5units,10mg,5mg/m^2等),自建中英文对照给药部位语料库(全身治疗,病灶局部给药等),自建中英文对照给药方式语料库(皮下注射、静脉滴注、口服等),自建给药频率语料库(qd,bid,tid等),自建给药时间语料库(day1; day1-7; day 1, 8等),自建中英文对照不良反应和禁忌症数据库(过敏、孕妇禁用等),以及自建治疗频率和治疗周期(例如,治疗频率:qw,q2w,qm等;治疗周
期:6 cycle,3 cycle等)等,为分词模型提供治疗方案其他信息训练语料;通过ICD-10标准疾病名称,与ICD-10标准疾病名称建立映射关系的自建中英文对照疾病名称(如肺癌、乳腺癌、高血压、糖尿病以及其常见别名等),以及自建中英文对照治疗阶段(如维持治疗、初始治疗、诱导化疗等)等,为分词模型提供需与治疗方案建立映射关系的其他信息训练语料。
[0016]然后,利用结巴分词技术等自然语言分词模型,对来自临床研究前沿文献、真实世界病案数据、指南以及标准教材等的治疗方案以及需建立映射关系的信息进行分词和词性标注,为后续步骤的结构化治疗方案数据库建设提供数据内容。
[0017]步骤(2)中进行词性标注时,可通过人工、人工智能自然语言读取辅助等手段,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种治疗方案结构化数据库的构建方法,其特征在于,具体的构建方案如下:(1)利用自然语言分词技术,在相应训练语料中选择需和治疗方案建立映射关系的信息进行分词和词性标注,建立治疗方案分词模型,对治疗方案进行分词和词性标注;(2)建立药物单体子数据库,对药物单体子数据库中的结构化模块进行与步骤(1)对应的词性标注,存储药品单体结构化信息,建立给定药物的特定用量和给药时间与特定疾病和特定治疗阶段的映射关系,建立药物单体数据库;其中,所述药物单体子数据库中的结构化模块至少包括药品中文通用名称、药品英文通用名称、商品名、别名、常见不良反应、禁忌症、给药部位、给药方式、用药剂量、剂量单位、给药频率;(3)建立药物组合方案子数据库,对药物组合方案子数据库中的结构化模块进行与步骤(1)对应的词性标注,以步骤(2)建立的药物单体数据库为基础,在特定疾病和特定治疗阶段的映射条件下,调取药物单体数据库中的特定药品,进行组合,并与药物组合方案名称建立映射关系,建立药物组合方案数据库;其中,所述药物组合方案子数据库中的结构化模块至少包括组合方案通用名称、组合方案缩写词、药品组合方式;(4)建立治疗方案时序逻辑子数据库,对治疗方案时序逻辑子数据库中的结构化模块进行与步骤(1)对应的词性标注,写入同一治疗方案下,不同药物单体、药物组合方案的相对时序逻辑,为治疗方案数据库增加时间维度,建立治疗方案时序逻辑数据库;所述治疗方案继承步骤(2)和步骤(3)中的特定疾病和特定治疗阶段的映射关系;其中,所述治疗方案时序逻辑子数据库中的结构化模块至少包括治疗频率、治疗周期、时间逻辑词、关系逻辑词;(5)继承步骤(3)-步骤(4)中对于特定疾病和特定治疗阶段的映射关系,提取治疗方案来源数据中关于该治疗方案疗效分析或疗效对比数据,与该治疗方案建立映射关系,建立治疗方案-疾病-疗效证据映射关系数据库;从而,完成治疗方案结构化数据库的建立。2.根据权利要求1所述的治疗方案结构化数据库的构建方法,其特征在于,根据治疗方案结构化数据库的建立过程,步骤(1)的具体建立方式为:首先,通过公共的药品数据库、药物商品名/别名数据库、药品说明书等,以及自建药物组合方案缩写语料库,为分词模型提供药品名称和药物组合方案缩写训练语料;通过自建给药剂量和剂量单位语料库,自建中英文对照给药部位语料库,自建中英文对照给药方式语料库,自建给药频率语料库,自建给药时间语料库,自建中英文对照不良反应和禁忌症数据库,以及自建治疗频率和治疗周期,为分词模型提供治疗方案其他信息训练语料;通过ICD-10标准疾病名称,与ICD-10标准疾病名称建立映射关系的自建中英文对照疾病名称,以及自建中英文对照治疗阶段,为分词模型提供需与治疗方案建立映射关系的其他信息训练语料;然后,利用自然语言分词模型,对各类来源的治疗方案以及需建立映射关系的信息进行分词和词性标注,为后续步骤的结构化治疗方案数据库建设提供数据内容。3.根据权利要求2所述的治疗方案结构化数据库的构建方法,其特征在于,采用的自然语言分词模型至少包括Mecab中文分词模型、jieba分词模型、WMSeg模型、LTP模型、机械分词算法模型、n-gram模型、HMM模型、CRF 模型以及深度神经网络模型等。4.根据权利要求1所述的治疗方案结构化数据库的构建...

【专利技术属性】
技术研发人员:闾磊黄甫毅樊淼淼高阳任柯星何跃东
申请(专利权)人:四川医枢科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1