基于语义的家庭医疗咨询决策支持方法技术

技术编号:26973788 阅读:30 留言:0更新日期:2021-01-06 00:07
本发明专利技术公开了一种基于语义的家庭医疗咨询决策支持方法,针对互联网中医学数据异构多源、传统中文分词方法无法识别医学术语的问题,利用语义技术构建面向疾病的医学知识模型,明确诊疗方案中的关键信息要素,为中文分词提供疾病自定义词典,基于分词结果统计疾病相关命名实体的词频,最终形成面向疾病的家庭医疗咨询决策支持,本发明专利技术提出的方法能够作为院内数据挖掘的补充和扩展,为建立医学大数据科研辅助分析平台提供基础。

【技术实现步骤摘要】
基于语义的家庭医疗咨询决策支持方法
本专利技术涉及家庭医疗
,具体涉及一种基于语义的家庭医疗咨询决策支持方法。
技术介绍
近年来,随着公众健康意识的增强、政策红利的驱动以及老龄化问题日益凸显,家庭医疗保健场景变得越来越普及。然而医学知识的欠缺,使得家庭医疗很难真正大范围的普及,这也是造成“有病就去大医院”、“小病大看”等就医习惯的根本原因。通常情况下,临床实践大多以经验和推论为主,随着信息技术在医疗领域的深入发展,电子病历系统在各个医疗机构中已经普及,临床经验以文档或结构化数据的形式被存储起来。目前已有很多研究致力于从健康医疗数据中总结经验,辅助临床的决策支持。健康医疗数据分为院内数据与院外数据两种类型。院内数据由电子病历系统等院内医疗信息系统采集并存储,也是目前医学数据研究的主要对象,其在质量和规模上具有竞争力。但是院内数据的缺点体现在其隐私安全问题和信息壁垒问题上。因此,基于院内数据分析的结果主要服务于本地机构的临床决策支持。而院外数据以前主要集中在智能硬件设备的检测数据和政府收集的个人健康档案。随着互联网技术在日常医疗场景中的渗透,人们越来越习惯于在互联网上求助和分享临床经验,因此互联网上积累了大量的、开放的网络医学数据。例如丁香园、知乎和微医等国内网站的流量快速增长,在搜索引擎中检索高血压、糖尿病等常见疾病,搜索结果都已经超过了1亿条。可以看出当前的网络数据规模庞大、增长快速,且其数据的开放性能够更加便捷地服务于公众。目前互联网上的医学数据以文本形式为主,来源复杂且缺乏整合,质量参差不一。由于医学术语繁多复杂,采用传统的中文分词方法根本无法从本文中发现医学关键信息。那么如何从网络文本中挖掘出有效信息并进行知识表达,从而使公众获取有效的医学知识是家庭医疗中亟待解决的问题。
技术实现思路
针对上述存在的问题,本专利技术旨在提供一种基于语义的家庭医疗咨询决策支持方法,通过探索基于互联网医学数据的临床决策支持方法,为公众在家庭治疗和日常保健中提供决策参考。为了实现上述目的,本专利技术引入了语义技术构建医学知识模型,明确了诊疗方案中的关键信息要素以支撑中文分词,最终从文本中提炼出可为公众提供决策参考的诊疗建议,为此本专利技术所采用的技术方案如下:基于语义的家庭医疗咨询决策支持方法,其特征在于,包括以下步骤:步骤1:通过Python的主题网络爬虫获取互联网上的某种疾病的医学数据,并将对应的网页内容保存到本地;步骤2:基于语义技术构建疾病知识图谱,得到疾病诊疗过程中的关键要素,并生成自定义词典;步骤3:基于所述自定义词典,利用Jieba库对网页文本进行中文分词,统计关键词词频,计算诊疗环节各种诊疗手段的概率分布;步骤4:根据诊疗环节中各种诊疗手段的概率分布,确定该诊疗环节采用何种诊疗手段,最终用于辅助决策。进一步地,步骤1的具体操作步骤包括:步骤11:通过预设主题关键词和待爬取的URL列表作为种子,通过检索关键词得到相应的结果页面;步骤12:针对所述结果页面的异构网页组织形式,将网页分为静态页面和动态页面;步骤13:如果待爬取的页面为静态页面,则利用Python中的BeautifulSoup和lxml来进行网页解析,提取目标URL;如果待爬取的页面为动态页面先通过Selenium对象模拟浏览器的页面交互操作,进而获取动态页面的数据,再利用Python中的BeautifulSoup库进行页面解析,提取目标URL;步骤14:将得到的网页结果以HTML文本形式保存到本地。进一步地,步骤2中的具体操作步骤为:步骤21:基于本体编辑工具Protégé构建疾病Disease、诊断Diagnosis和诊疗方案CarePlan对应的类,得到本体模型;步骤22:基于本体模型添加疾病、诊断、诊疗方案的实例和属性,并对各个属性赋值以建立实例间的关系;步骤23:提取实例中的rdfs:label和rdfs:comment属性值,将其导出最终生成自定义词典。进一步地,步骤3的具体操作步骤包括:步骤31:对得到的网页文本进行预处理,通过正则表达式提取所有的中文文本并过滤掉<head>、<script>等网页标签;步骤32:利用Jieba精准模式对所述中文文本进行分词,设定分词的自定义词典为步骤23中生成的词典;步骤33:利用Jieba中的中文停用词表进行停用词过滤,并将处理结果保存到网页文本文件中;步骤34:基于中文分词结果,利用统计学的方法统计疾病相关医学术语出现的频次;步骤35:依据计算出的词频得到诊疗环节不同诊疗手段的概率分布。进一步地,步骤34中所述的统计各种医学术语出现的频次的词频计算表达式为:其中,n为某诊疗环节的不同诊疗手段数量,m为某种诊疗手段在互联网数据中的不同种表达方式,且Xi,j(i=1,2,...,m;j=1,2,...,n)为每种表达方式在互联网数据中出现的频次。本专利技术的有益效果包括:第一,本专利技术中的方法通过构建疾病知识图谱明确关键诊疗环节,为中文文本分词提供自定义词典,根据分词结果统计关键诊疗环节在互联网医学数据中的频次,最终为家庭医疗场景提供临床决策支持;第二,本专利技术中的方法将网络爬虫技术、语义技术、分词和统计方法相结合,从互联网数据中发现诊疗规律、提炼治疗路径,提出了一种基于互联网医学数据辅助诊疗的技术方法,是对院内数据挖掘的有效补充和拓展;第三,本专利技术中的方法与医学指南相结合,有助于补充和细化指南标准路径中的诊疗环节,为医学指南在家庭医疗场景中的推广应用打下基础。综上所述,通过本专利技术提出的基于语义的家庭医疗咨询决策支持方法,能够针对互联网医疗数据进行挖掘并提供临床决策支持,是对院内数据的有效补充和拓展,为建立医学大数据科研辅助分析引擎打下基础,将在家庭医疗领域发挥重要的作用。附图说明图1为疾病类中名称为AcuteAppendicitis的实例;图2为基于疾病知识图谱的文本分词和知识发现过程示意图;图3为面向湿疹疾病的家庭医疗咨询决策支持过程示意图;图4为湿疹知识图谱中诊疗方案实例与药物实例的关联示意图;图5为实施例中按类统计每种药物的词频示意图;图6为湿疹护肤品牌的频次统计结果图。具体实施方式为了使本领域的普通技术人员能更好的理解本专利技术的技术方案,下面结合附图和实施例对本专利技术的技术方案做进一步的描述。院内数据可以直接从电子病历系统的数据库中导出结构化数据,面向多源异构系统时采用语义技术进行数据的标准化和统一化处理,语义技术在院内数据分析领域已有大量的研究经验。而面向互联网中的医学数据,涉及到数据获取、整合和分析,整个过程更加复杂。首先需要明确数据来源并主动获取:基于语义的家庭医疗咨询决策支持方法,包括以下步骤:步骤1:通过Python的主题网络爬虫获取互联网上的某种疾病的本文档来自技高网
...

【技术保护点】
1.基于语义的家庭医疗咨询决策支持方法,其特征在于,包括以下步骤:/n步骤1:通过Python的主题网络爬虫获取互联网上的某种疾病的医学数据,并将对应的网页内容保存到本地;/n步骤2:基于语义技术构建疾病知识图谱,得到疾病诊疗过程中的关键要素,并生成自定义词典;/n步骤3:基于所述自定义词典,利用Jieba库对网页文本进行中文分词,统计关键词词频,计算诊疗环节各种诊疗手段的概率分布;/n步骤4:根据诊疗环节中各种诊疗手段的概率分布,确定该诊疗环节采用何种诊疗手段,最终用于辅助决策。/n

【技术特征摘要】
1.基于语义的家庭医疗咨询决策支持方法,其特征在于,包括以下步骤:
步骤1:通过Python的主题网络爬虫获取互联网上的某种疾病的医学数据,并将对应的网页内容保存到本地;
步骤2:基于语义技术构建疾病知识图谱,得到疾病诊疗过程中的关键要素,并生成自定义词典;
步骤3:基于所述自定义词典,利用Jieba库对网页文本进行中文分词,统计关键词词频,计算诊疗环节各种诊疗手段的概率分布;
步骤4:根据诊疗环节中各种诊疗手段的概率分布,确定该诊疗环节采用何种诊疗手段,最终用于辅助决策。


2.根据权利要求1所述的基于语义的家庭医疗咨询决策支持方法,其特征在于:步骤1的具体操作步骤包括:
步骤11:通过预设主题关键词和待爬取的URL列表作为种子,通过检索关键词得到相应的结果页面;
步骤12:针对所述结果页面的异构网页组织形式,将网页分为静态页面和动态页面;
步骤13:如果待爬取的页面为静态页面,则利用Python中的BeautifulSoup和lxml来进行网页解析,提取目标URL;如果待爬取的页面为动态页面先通过Selenium对象模拟浏览器的页面交互操作,进而获取动态页面的数据,再利用Python中的BeautifulSoup库进行页面解析,提取目标URL;
步骤14:将得到的网页结果以HTML文本形式保存到本地。


3.根据权利要求1所述的基于语义的家庭医疗咨询决策支持方法,其特征在于:步骤2中的具体操作步骤为:
步骤21:基于本体编辑...

【专利技术属性】
技术研发人员:王华琼钱归平杨帆
申请(专利权)人:浙江传媒学院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1