一种临床科研数据的采集方法及系统技术方案

技术编号:39315440 阅读:7 留言:0更新日期:2023-11-12 15:59
本发明专利技术公开了一种临床科研数据的采集方法及系统包括以下具体步骤:S1:大数据联通输送:与多个临床科研院的数据库进行连接,实现大数据的联通互传;S2:数据查重处理:对输送的大数据进行查重处理;S3:重点字符提取:对查重处理后的数据集中的每组数据进行重点字符提取;S4:标签转化:将提取的重点字符转化为标签;S5:多模板整合:设计不同重心、不同格式的模板备用,并将标签类别与模板类别统一;S6:多模板数据统一分析;S7:数据反向选择;本发明专利技术公开的临床科研数据的采集方法及系统具有精细化、需求化的提高大数据的分析效果,提高数据提供的准确性和速率,利于提高人们的工作效率的效果。的效果。的效果。

【技术实现步骤摘要】
一种临床科研数据的采集方法及系统


[0001]本专利技术涉及科研数据采集
,尤其涉及一种临床科研数据的采集方法及系统。

技术介绍

[0002]临床评价的定义是采用科学合理的方法对临床数据进行分析评价,以确认医疗器械在其适用范围下的安全性、临床性能和/或有效性的持续进行的活动。临床科研数据是围绕科研问题从原始的医疗(电子病历)数据或其他来源数据中采集加工的病例特征数据。
[0003]一般的科研数据采集系统仅起到对大数据的采集,但其所产生的数据并未经过严格的数据质量控制,导致在使用系统进行数据查询时,其给出的结果不够理想化,若需要对数据进行不同角度的分析和理解,仅能将查出的大数据进行人工对比,才能获得自己想要的数据与效果。

技术实现思路

[0004]本专利技术公开一种临床科研数据的采集方法及系统,旨在解决所产生的数据并未经过严格的数据质量控制,导致在使用系统进行数据查询时,其给出的结果不够理想化的技术问题。
[0005]为了实现上述目的,本专利技术采用了如下技术方案:
[0006]一种临床科研数据的采集方法,包括以下具体步骤:
[0007]S1:大数据联通输送:与多个临床科研院的数据库进行连接,实现大数据的联通互传;
[0008]S2:数据查重处理:对输送的大数据进行查重处理;
[0009]S3:重点字符提取:对查重处理后的数据集中的每组数据进行重点字符提取;
[0010]S4:标签转化:将提取的重点字符转化为标签;
[0011]S5:多模板整合:设计不同重心、不同格式的模板备用,并将标签类别与模板类别统一,通过选择模板和搜索字符自动匹配相应数据至模板中;
[0012]S6:多模板数据统一分析:将选定的同一搜索字符的多个模板数据进行整合分析,并给出分析不同类别的结果;
[0013]S7:数据反向选择:改变部分分析出的结果类别数据,并根据改变后的数据在该模板涉及的数据集中进行定位并呈现;
[0014]所述S2,数据查重处理中,利用逐层对比的方式来对每组数据进行分析,以时间、病患名称等类别为首层并层层对比;
[0015]所述S4,标签转化中,重点字符转化为的标签与该数据组持续绑定,并设置为隐藏状态。
[0016]通过设计不同类别、规格的模板,并对数据进行整合,例如:以重心为年龄、性别和疾病类型为重心的模板为例,以年龄、性别和疾病类型作为主类别,可以是否经受过特定治
疗、疗程时间、疗程效果等为次类别,在对模板内容进行填充时,会以主类别为重心进行快速搜索,并自动分析和填充次类别内容,那么直接呈现的模板内容就已完全满足用户的需求,另外,当反向选择时,以疗程时间为例,可将时间段缩短至1

3个月,由此,可在构成模板的所有数据中快速呈现疗程1

3个月的数据提取出来,从而起到可直接获得到所需数据,精细化、需求化提高大数据的分析效果,提高数据提供的准确性和速率,利于提高人们的工作效率。
[0017]一种临床科研数据的采集系统,包括大数据采集单元、数据整合单元、数据排序单元、特殊数据处理单元和多模板整合单元,所述大数据采集单元是与多个临床科研院的数据库进行连接,并向系统内输送数据,所述数据整合单元是对输送的数据进行分类、整理和合并,所述数据排序单元用于将数据集中的多组数据进行排序处理,所述特殊数据处理单元用于在大数据中区分出特殊数据组,并进行标注,所述多模板整合单元用于设立不同重点的多个模板,并以选定的模板格式显示数据;
[0018]所述大数据采集单元包括数据采集模块、中转数据库、查重模块、重复比例分析模块、类别标签匹配模块和同标签数据统计模块;
[0019]所述数据排序单元包括标签读取模块、字符统计模块和数据组排序模块;
[0020]所述特殊数据处理单元包括通标签字符分析模块、特殊字符突出模块和标记模块;
[0021]所述多模板整合单元包括模板设计模块、数据匹配模块和多模板数据整合模块;
[0022]所述数据采集模块用于向系统内传输大数据,所述中转数据库用于提供大数据的暂时存储空间,所述查重模块用于分析大数据内每组数据的字符,并将超出设定的重复阈值的数据删除,仅保留字符最多的一组数据,所述重复比例分析模块是用于分析已经删除的数据组数量,并计算重复比例,所述类别标签匹配模块用于提取出每组数据中的标签,并将标签与数据组进行绑定,所述同标签数据统计模块用于统计同一种标签的数据数量。
[0023]通过设置有大数据采集模块,在对大数据进行采集后,通过中转数据库的设置,在中转数据库中对数据进行临时存储,并通过查重模块在中转数据库中对所有数据进行查重处理,从而实现对大数据的自动清理,使真正进入到系统统计内的数据提前进行有效瘦身,降低无效数据填充率,进一步提高数据在系统内的分析效率,同时通过类别标签匹配模块对每组数据进行标签化,例如以数据中的病患姓名、年龄、性别、病种、病种数量类进行精细划分,并以类别内容作为标签,并使标签一直隐藏跟随数据,也便于后续数据排序和模板整合的效率,进一步提高数据分析效率和呈现速度。
[0024]在一个优选的方案中,所述标签读取模块用于读取数据中匹配的标签,所述字符统计模块用于统计每个同种类的标签所涉及的所有数据组内的字符数量,所述数据组排序模块是基于统计的字符数量和特殊数据处理单元分析出的数据特殊程度来对多个数据组进行排序,以较为特殊、字符丰富的数据优先,所述同标签字符分析模块用于分析同一标签内的数据组的字符内容,所述特殊字符突出模块用于将明显差异的特殊字符进行突出,所述标记模块用于截取特殊字符的重点内容,并标记在该数据组上显示,所述模板设计模块用于设计不同类别、规格的模板,所述数据匹配模块用于将相应的数据按照模板规格进行匹配填充,所述多模板数据整合模块用于将同一搜索字符的所有模板内容进行统一分析。
[0025]通过设置有数据排序单元和特殊数据处理单元,其中数据排序单元中,是以每组
数据的字符数以及内容是否特殊来对数据进行排列,由此,当在系统内查询科研数据时,呈现的界面以内容丰富和案例较为特殊的数据为先,能快速找到有用的数据,提高应用率,另外,特殊数据处理单元中,通过将分析出的与其他数据有明显差异的特殊字符进行精简并标注,利于在搜索界面中快速获取到数据的差异特征,进一步提高查找有效数据的速度。
[0026]由上可知,一种临床科研数据的采集方法,包括以下具体步骤:
[0027]S1:大数据联通输送:与多个临床科研院的数据库进行连接,实现大数据的联通互传;
[0028]S2:数据查重处理:对输送的大数据进行查重处理;
[0029]S3:重点字符提取:对查重处理后的数据集中的每组数据进行重点字符提取;
[0030]S4:标签转化:将提取的重点字符转化为标签;
[0031]S5:多模板整合:设计不同重心、不同格式的模板备用,并将标签类别与模板类别统一,通过选择模板和搜索字符自动匹配相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种临床科研数据的采集方法,其特征在于,包括以下具体步骤:S1:大数据联通输送:与多个临床科研院的数据库进行连接,实现大数据的联通互传;S2:数据查重处理:对输送的大数据进行查重处理;S3:重点字符提取:对查重处理后的数据集中的每组数据进行重点字符提取;S4:标签转化:将提取的重点字符转化为标签;S5:多模板整合:设计不同重心、不同格式的模板备用,并将标签类别与模板类别统一,通过选择模板和搜索字符自动匹配相应数据至模板中;S6:多模板数据统一分析:将选定的同一搜索字符的多个模板数据进行整合分析,并给出分析不同类别的结果;S7:数据反向选择:改变部分分析出的结果类别数据,并根据改变后的数据在该模板涉及的数据集中进行定位并呈现。2.根据权利要求1所述的一种临床科研数据的采集方法,其特征在于,所述S2,数据查重处理中,利用逐层对比的方式来对每组数据进行分析,以时间、病患名称等类别为首层并层层对比。3.根据权利要求1所述的一种临床科研数据的采集方法,其特征在于,所述S4,标签转化中,重点字符转化为的标签与该数据组持续绑定,并设置为隐藏状态。4.一种临床科研数据的采集系统,应用于权利要求1所述的一种临床科研数据的采集方法,包括大数据采集单元、数据整合单元、数据排序单元、特殊数据处理单元和多模板整合单元,其特征在于,所述大数据采集单元是与多个临床科研院的数据库进行连接,并向系统内输送数据,所述数据整合单元是对输送的数据进行分类、整理和合并,所述数据排序单元用于将数据集中的多组数据进行排序处理,所述特殊数据处理单元用于在大数据中区分出特殊数据组,并进行标注,所述多模板整合单元用于设立不同重点的多个模板,并以选定的模板格式显示数据;所述大数据采集单元包括数据采集模块、中转数据库、查重模块、重复比例分...

【专利技术属性】
技术研发人员:翟启超王晶晶
申请(专利权)人:北京新唯医药科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1