System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种基于网络的学科情报数据采集分析系统及其方法,具体地说,是一种能够从多个信息源网站获取、处理、分析和展示学科情报数据的系统及其方法,适用于医院和科研院所的学科建设和发展规划。
技术介绍
1、随着社会的进步和科技的发展,医学领域的学科建设和发展面临着越来越多的挑战和机遇,如何提升医院的学科水平和竞争力,成为医院管理者和学者关注的重要问题。为了有效地进行学科建设和发展,需要对学科的现状、趋势、优势、劣势等进行全面、准确、及时的了解和分析,同时需要分析和对比行业中优秀学科画像,以便制定合理的学科规划和发展策略。然而,目前的学科情报数据分散在多个不同的信息源网站上,如医院综合排名和专科排名网站、专业委员会网站、学术刊物论文数据库等,这些网站的内容更新频率、格式、结构、质量等各不相同,给数据的获取、处理、分析和展示带来了很大的困难和挑战。因此,急需一种能够从多个信息源网站获取、处理、分析和展示学科情报数据的系统及其方法,以满足医院的学科建设和发展的需求。
2、对比文件cn106776755a公开了一种面向对象式的情报管理系统,其包括云数据平台、情报过滤模块、情报去冗模块、情报分类模块、资料库、情报分析模块、情报编辑模块、情报库、情报推送模块、监控主机及手持移动终端;该情报管理系统面向普通施工作业人员,通过在作业人员外出作业之前,由专业技术人员完成情报搜索和情报编辑过程,获得最优的操作方法和过程并将其传送到作业人员的手持移动终端,使得作业人员不需要具有任何图书情报专业知识,也使得作业人员可将手持移动终端携带至网络
3、对比文件cn115994693a一种基于学科评估报告的可视化分析系统,包括数据可视化模块,数据可视化模块通过网络传输节点与数据预处理模块实现连接,同时数据可视化模块与客户端模块相连接,且客户端模块包括后台管理客户端以及学科评价客户端。本专利技术借助功能强大的可视化数据分析平台,可辅助人工操作将数据进行关联分析,对网络数据、文本数据、多维数据以及时间序列数据进行分析,并做出完整的分析图表,图表中包含所有事件的相关信息,也完整展示数据分析的过程和数据链走向,供相关人员调阅。此对比文件的目的是为了解决现有技术中存在数据结构有可能不统一,通常以人工分析为主,加上分析过程的非结构性和不确定性,所以不易形成固定的分析流程或模式,很难将数据调入应用系统中进行分析挖掘的缺点,而提出的一种基于学科评估报告的可视化分析系统,该文件中未指明学科评估报告的含义。且文件cn115994693a描述的系统对数据没有针对性,更通用而泛化;无法对数据进行准备处理。
技术实现思路
1、本专利技术的目的是提供一种基于网络的学科情报数据采集分析系统及其方法,该系统能够从多个网络信息源网站获取、处理、分析和展示学科情报数据,包括学科建设现况、业内顶尖人才和行业重点资讯等,该方法能够实现对学科情报数据的有效获取、处理、分析和展示,为医院的学科建设和发展提供量化的决策支持。
2、为了实现上述目的,本专利技术采用以下技术方案:
3、一种基于网络的学科情报数据采集分析系统,包括以下内容:
4、包含数据采集模块、数据存储模块、数据预处理模块、数据处理模块、数据分析模块、数据展示模块、云端服务主机及显示终端,其中,所述各模块紧密连接,以确保高效而无缝的信息流,所述数据存储模块存储不同阶段的数据,包含数据湖模块、情报数据库模块和统计分析结果库模块,所述数据采集模块负责从各种网络资源或者其他外部数据源中采集学科情报原始数据,所述数据采集模块和所述数据湖模块紧密相连,所述数据采集模块将采集的原始情报数据按照数据源格式完整地存储到数据湖模块中,所述数据湖模块与数据预处理模块紧密相连,所述预处理模块包含三个子模块,分别是数据抽取子模块、数据清洗子模块和数据转换子模块,所述数据抽取子模块从所述数据湖模块中自动抽取情报数据,所述抽取子模块输出的数据流入所述数据清洗子模块,所述数据清洗子模块对抽取来的数据进行清洗,以确保数据的质量,所述清洗过程包括数据格式检查、数据去噪和数据标准化等,所述清洗过的数据输入到所述数据转换子模块,所述数据转换子模块对清洗后的数据进行转换,数据转换包括但不限于数据特征提取和数据格式转换,所述数据转换子模块转换的数据流入所述情报数据存储模块,成为情报数据库初始版本,所述情报数据存储模块与所述情报数据处理模块紧密相连,所述情报数据处理模块包含情报数据归纳融合算法子模块、数据补充子模块和数据验证子模块,所述情报数据归纳融合算法子模块从所述情报数据库初始版本中提取分析所需要的数据进行多维融合处理,所述情报数据归纳融合算法子模块输出的数据可以由所述数据补充子模块进行数据补充,以获得分析所需要的完整数据,所述数据补充子模块既可以从所述情报数据初始版本中进行选择添加,也可以从外部导入,所述数据整合子模块和数据补充子模块输出的数据需要经过所述数据验证子模块进行质量确认,所述数据验证子模块的输出结果流入所述情报数据存储模块,成为情报数据最终版本,所述情报数据库初始版本和情报数据库最终版本都需要和所述元数据子模块关联,所述元数据子模块定义和管理元数据,元数据可以描述情报信息对象的属性、内容、主题、来源、格式、时间和空间等信息,所述情报数据库初始版本和情报数据库最终版本都需要和所述备份子模块相连以进行数据备份,所述情报数据库最终版本输入到所述数据统计分析模块,所述数据统计分析模块对所述情报数据库最终版本进行深度分析和统计,提供对学科领域的全面洞察和关键信息的提取,所述数据统计分析模块与所述数据展示模块紧密相连,所述数据展示模块展示所述数据统计分析模块的统计分析结果,所述数据展示模块以图形化或其他易于理解的形式呈现数据分析结果。所述所有模块连接所述云端服务主机,所述云端服务主机作为系统的基础架构,连接所有所述模块,提供数据存储和计算服务,整体的系统协调和任务调度,处理用户请求,所述显示终端,提供用户与系统交互的界面,允许用户查询,配置参数和查看数据分析结果,所述显示终端与所述服务主机相连接,通过用户输入触发系统的各个模块执行相应的任务。
5、具体包括如下模块:
6、(1)数据采集模块,用于从预设的信息源网站采集学科情报数据,包括医院综合排名和专科排名数据、专家信息数据和行业重点资讯数据,也可以通过网络访问的各类公开权威网站或者授权访问的网站,所述权本文档来自技高网...
【技术保护点】
1.一种基于网络的学科情报数据采集分析系统,其特征在于,包含数据采集模块、数据存储模块和数据预处理模块、数据处理模块、数据分析模块和数据展示模块;其中,所述数据存储模块包含数据湖模块、情报数据库模块和统计分析结果数据库模块,
2.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于:数据采集模块采集的数据源包括政策指南、行业资讯、医院权威排名、医院官网、行业人才信息以及医院科研、临床以及绩效数据,能提供学科情报分析所需要的完整数据。
3.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于:所述数据清洗子模块包括数据格式检查、数据去噪和数据标准化。
4.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于:所述数据转换子模块包括数据特征提取和数据格式转换。
5.根据权利要求4所述的一种基于网络的学科情报数据采集分析系统,其特征在于,所述数据抽取子模块,能够从获取的各种格式的原始情报信息中,通过自然语言处理以及光学字符识别方式,抽取出格式化的情报信息。
6.根据权利要求
7.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于,所述数据展示模块提供多层次、多维度的数据展示,以便用户从不同角度深入了解数据,图表、可视化工具和报告综合形式都可以用于呈现复杂的分析结果。
8.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于,所述数据处理模块中的情报数据归纳融合算法包括数据映射阶段、归纳融合阶段和提取阶段;
9.一种基于权利要求1~8所述的一种基于网络的学科情报数据采集分析系统的计算机系统,其特征在于,在权利要求1~8基础上,还包括云端服务主机及显示终端,所述系统的所有模块连接所述云端服务主机,所述云端服务主机作为系统的基础架构,连接所有模块,提供数据存储和计算服务,整体的系统协调和任务调度,处理用户请求,所述显示终端,提供用户与系统交互的界面,允许用户查询,配置参数和查看数据分析结果,所述显示终端与所述服务主机相连接,通过用户输入触发系统的各个模块执行相应的任务。
...【技术特征摘要】
1.一种基于网络的学科情报数据采集分析系统,其特征在于,包含数据采集模块、数据存储模块和数据预处理模块、数据处理模块、数据分析模块和数据展示模块;其中,所述数据存储模块包含数据湖模块、情报数据库模块和统计分析结果数据库模块,
2.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于:数据采集模块采集的数据源包括政策指南、行业资讯、医院权威排名、医院官网、行业人才信息以及医院科研、临床以及绩效数据,能提供学科情报分析所需要的完整数据。
3.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于:所述数据清洗子模块包括数据格式检查、数据去噪和数据标准化。
4.根据权利要求1所述的一种基于网络的学科情报数据采集分析系统,其特征在于:所述数据转换子模块包括数据特征提取和数据格式转换。
5.根据权利要求4所述的一种基于网络的学科情报数据采集分析系统,其特征在于,所述数据抽取子模块,能够从获取的各种格式的原始情报信息中,通过自然语言处理以及光学字符识别方式,抽取出格式化的情报信息。
6.根据权利要求5所述的一种基于网络的...
【专利技术属性】
技术研发人员:孙斌,谢泽宁,刘逸杰,林靖生,
申请(专利权)人:上海交通大学医学院附属瑞金医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。