临床诊疗数据对接至EDC系统的方法、装置、设备及介质制造方法及图纸

技术编号:37553108 阅读:7 留言:0更新日期:2023-05-15 07:38
本公开涉及一种临床诊疗数据对接至EDC系统的方法、装置、设备及介质,涉及临床数据处理领域,该方法包括:获取来自医院信息系统的临床诊疗电子化数据并脱敏处理;将脱敏后的临床诊疗电子化数据映射处理为预设数据模型下的第一数据;从上述第一数据中获取匹配于预设表单的第一目标信息;对临床诊疗数据源文件进行OCR识别,得到识别数据并脱敏处理;从脱敏后的识别数据中获取匹配于上述预设表单的第二目标信息;对上述第一目标信息和上述第二目标信息进行交互验证和整合处理,得到处理结果;将上述处理结果映射存储至目标EDC系统。无需人工录入数据至EDC系统,实现数据的智能化采集和处理,提升医院内部数据对接至EDC系统的效率。率。率。

【技术实现步骤摘要】
临床诊疗数据对接至EDC系统的方法、装置、设备及介质


[0001]本公开涉及数据处理
,尤其涉及一种临床诊疗数据对接至EDC系统的方法、装置、设备及介质。

技术介绍

[0002]电子数据捕获系统(EDC,Electronic Data Capture System),是适用于临床试验数据采集和传输的平台软件,国内外均有对应的EDC软件产品,不同厂商的EDC软件产品的功能具有差异,目前国外厂商的EDC产品主要占据主流国内市场。
[0003]临床试验数据的采集是药物临床研究中的核心内容,真实、准确、及时、规范的数据采集能够显著提高临床试验的质量,缩短研究周期。对于临床试验项目而言,研究者需要依据临床试验方案协议进行受试者研究数据收集,对应设计的数据采集表格称之为病历报告表(CRF,Case Report Form)。在传统模式中,临床试验主要依靠纸质的病例报告表来完成数据的采集和管理过程。目前临床研究机构大多采用EDC系统来进行数据管理,主流的EDC系统不仅具有多种形式的数据采集功能,还可以根据项目研究需求来定制各种形式的项目表单。例如,目前大多数发达国家的临床试验中已经广泛采用EDC系统来设计电子版CRF(eCRF)并替代传统的纸质版的CRF。
[0004]目前,各个医院内受试者对应的临床试验数据大多是由临床协调员(CRC,Clinical Research Coordinator)从原始病历中采集后手动录入EDC系统中。然而,这种方式对应的工作量巨大,数据录入效率低,而且录入过程中容易出错,耗费较多的人力和时间成本。

技术实现思路

[0005]为了解决或者至少部分地解决人工录入临床数据至EDC系统而导致的录入效率低且容易出错的技术问题,本公开的实施例提供了一种临床诊疗数据对接至EDC系统的方法、装置、设备及介质。
[0006]第一方面,本公开的实施例提供了一种临床诊疗数据对接至EDC系统的方法。上述方法包括:获取来自医院信息系统的临床诊疗电子化数据并脱敏处理;将脱敏后的临床诊疗电子化数据映射处理为预设数据模型下的第一数据;从上述第一数据中获取匹配于预设表单的第一目标信息;对临床诊疗数据源文件进行OCR(光学字符识别)识别,得到识别数据并脱敏处理;从脱敏后的识别数据中获取匹配于上述预设表单的第二目标信息;对上述第一目标信息和上述第二目标信息进行交互验证和整合处理,得到处理结果;将上述处理结果映射存储至目标EDC系统。
[0007]在一些实施例中,对上述第一目标信息和上述第二目标信息进行交互验证和整合处理,得到处理结果,包括:对上述第一目标信息和上述第二目标信息进行字段匹配,得到匹配字段和对应的第一值、第二值;上述第一值为上述第一目标信息中匹配字段的对应取值,上述第二值为上述第二目标信息中匹配字段的对应取值;根据上述匹配字段的类型,确
定上述第一值和上述第二值之间的吻合度;在上述第一值和上述第二值之间的吻合度小于设定阈值的情况下,获取可信度打标界面的用户标记指令;其中上述可信度打标界面用于呈现:上述临床诊疗数据源文件、上述匹配字段、上述第一值、上述第二值以及用于对上述第一值和第二值进行可信度标记的功能模块;根据上述用户标记指令,生成上述匹配字段的目标值。
[0008]在一些实施例中,上述用户标记指令包含:用户标识和用户标记信息;根据上述用户标记指令,生成上述匹配字段的目标值,包括:根据预设的用户身份和权限分配信息,对上述用户标识对应的身份进行标记权限的校验;在上述用户标识校验通过的情况下,根据上述用户标记信息,生成上述匹配字段的目标值。
[0009]在一些实施例中,对上述第一目标信息和上述第二目标信息进行交互验证和整合处理,得到处理结果,还包括:根据上述第一目标信息中的第一独有字段和对应的第一独有值,生成第一结果;根据上述第二目标信息中的第二独有字段和对应的第二独有值的用户复核结果,生成第二结果;对上述第一结果、上述第二结果、上述匹配字段和对应的目标值进行整合,得到上述处理结果。
[0010]在一些实施例中,将上述处理结果映射存储至目标EDC系统包括:获取上述处理结果对应的数据结构层级;根据上述数据结构层级,确定上述目标EDC系统中的匹配数据结构层级;将相同层级字段的数据从上述处理结果映射存储至上述匹配数据结构的对应层级下。
[0011]在一些实施例中,从上述第一数据中获取匹配于预设表单的第一目标信息,包括:根据字段映射字典,将上述预设表单中的预设字段在上述第一数据中进行第一匹配;针对上述预设字段中执行上述第一匹配成功的第一预设字段,根据上述第一预设字段和对应的第一目标值生成第一目标信息;针对上述预设字段中执行上述第一匹配失败的第二预设字段,将上述第二预设字段添加至存疑数据集;根据模糊匹配算法,对上述存疑数据集中的第二预设字段在上述第一数据中进行第二匹配;针对上述第二预设字段中执行上述第二匹配成功的第三预设字段,根据上述第三预设字段和对应的第二目标值生成第一目标信息;基于上述第三预设字段和上述第一数据中对应的第一记录字段构建第一映射对,并将上述第一映射对存储至上述字段映射字典;针对上述第二预设字段中执行上述第二匹配失败的第四预设字段,将上述第四预设字段添加至待匹配列表,上述待匹配列表中的字段由用户进行映射关系配置后添加至上述字段映射字典中。
[0012]在一些实施例中,从脱敏后的识别数据中获取匹配于上述预设表单的第二目标信息,包括:根据字段映射字典,将上述预设表单中的预设字段在脱敏后的识别数据中进行第三匹配;针对上述预设字段中执行上述第三匹配成功的第五预设字段,根据上述第五预设字段和对应的第三目标值生成第二目标信息;针对上述预设字段中执行上述第三匹配失败的第六预设字段,将上述第六预设字段添加至存疑数据集;根据模糊匹配算法,对上述存疑数据集中的第六预设字段在上述脱敏后的识别数据中进行第四匹配;针对上述第六预设字段中执行上述第四匹配成功的第七预设字段,根据上述第七预设字段和对应的第四目标值生成第二目标信息;基于上述第七预设字段和上述脱敏后的识别数据中对应的第二记录字段构建第二映射对,并将上述第二映射对存储至上述字段映射字典;针对上述第六预设字段中执行上述第四匹配失败的第八预设字段,将上述第八预设字段添加至待匹配列表,上
述待匹配列表中的字段由用户进行映射关系配置后添加至上述字段映射字典中。
[0013]在一些实施例中,获取来自医院信息系统的临床诊疗电子化数据,包括:对数据采集服务器的数据库进行访问,得到上述医院信息系统的临床诊疗电子化数据;其中上述数据采集服务器部署于医院本地,上述数据采集服务器与上述医院信息系统对应的服务器之间处于物理隔离状态且通过网络接口进行数据交互,数据采集服务器将医院信息系统的临床诊疗电子化数据采集至上述数据库中。
[0014]第二方面,本公开的实施例提供了一种数据处理的装置。上述装置包括:数据获取模块、数据脱敏模块、映射处理模块、第一匹配模块、OCR识别模块、第二匹配模块、验证和整合模块、以及上传模块。上述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种临床诊疗数据对接至EDC系统的方法,其特征在于,包括:获取来自医院信息系统的临床诊疗电子化数据并脱敏处理;将脱敏后的临床诊疗电子化数据映射处理为预设数据模型下的第一数据;从所述第一数据中获取匹配于预设表单的第一目标信息;对临床诊疗数据源文件进行OCR识别,得到识别数据并脱敏处理;从脱敏后的识别数据中获取匹配于所述预设表单的第二目标信息;对所述第一目标信息和所述第二目标信息进行交互验证和整合处理,得到处理结果;将所述处理结果映射存储至目标EDC系统。2.根据权利要求1所述的方法,其特征在于,对所述第一目标信息和所述第二目标信息进行交互验证和整合处理,得到处理结果,包括:对所述第一目标信息和所述第二目标信息进行字段匹配,得到匹配字段和对应的第一值、第二值;所述第一值为所述第一目标信息中匹配字段的对应取值,所述第二值为所述第二目标信息中匹配字段的对应取值;根据所述匹配字段的类型,确定所述第一值和所述第二值之间的吻合度;在所述第一值和所述第二值之间的吻合度小于设定阈值的情况下,获取可信度打标界面的用户标记指令;其中所述可信度打标界面用于呈现:所述临床诊疗数据源文件、所述匹配字段、所述第一值、所述第二值以及用于对所述第一值和第二值进行可信度标记的功能模块;根据所述用户标记指令,生成所述匹配字段的目标值。3.根据权利要求2所述的方法,其特征在于,所述用户标记指令包含:用户标识和用户标记信息;根据所述用户标记指令,生成所述匹配字段的目标值,包括:根据预设的用户身份和权限分配信息,对所述用户标识对应的身份进行标记权限的校验;在所述用户标识校验通过的情况下,根据所述用户标记信息,生成所述匹配字段的目标值。4.根据权利要求2所述的方法,其特征在于,对所述第一目标信息和所述第二目标信息进行交互验证和整合处理,得到处理结果,还包括:根据所述第一目标信息中的第一独有字段和对应的第一独有值,生成第一结果;根据所述第二目标信息中的第二独有字段和对应的第二独有值的用户复核结果,生成第二结果;对所述第一结果、所述第二结果、所述匹配字段和对应的目标值进行整合,得到所述处理结果。5.根据权利要求1所述的方法,其特征在于,将所述处理结果映射存储至目标EDC系统,包括:获取所述处理结果对应的数据结构层级;根据所述数据结构层级,确定所述目标EDC系统中的匹配数据结构层级;将相同层级字段的数据从所述处理结果映射存储至所述匹配数据结构的对应层级下。6.根据权利要求1所述的方法,其特征在于,从所述第一数据中获取匹配于预设表单的
第一目标信息,包括:根据字段映射字典,将所述预设表单中的预设字段在所述第一数据中进行第一匹配;针对所述预设字段中执行所述第一匹配成功的第一预设字段,根据所述第一预设字段和对应的第一目标值生成第一目标信息;针对所述预设字段中执行所述第一匹配失败的第二预设字段,将所述第二预设字段添加至存疑数据集;根据模糊匹配算法,对所述存疑数据集中的第二预设字段在所述第一数据中进行第二匹配;针对所述第二预设字段中执行所述第二匹配成功的第三预设字段,根据所述第三预设字段和对应的第二目标值生成第一目标信息;基于所述第三预设字段和所述...

【专利技术属性】
技术研发人员:王铮严志华白迪王世军周良申徐佳明包骏骏
申请(专利权)人:杭州璞睿生命科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1