一种生物医学文献类型的自动判定方法及系统技术方案

技术编号:31706052 阅读:17 留言:0更新日期:2022-01-01 11:08
本发明专利技术提供一种生物医学文献类型的自动判定方法及系统,其方法包括:确定待判定的生物医学文献;将所述待判定的生物医学文献输入至文献类型判定模型,得到所述文献类型判定模型输出的生物医学文献类型判定结果;其中,所述文献类型判定模型是基于文献数据集的标注样本训练得到的。本发明专利技术通过排除无关的文献类型,缩小临床医生筛选文献的数量,同时还可以使临床医生对证据质量做出估计,从而快速、准确的做出医疗决策。确的做出医疗决策。确的做出医疗决策。

【技术实现步骤摘要】
一种生物医学文献类型的自动判定方法及系统


[0001]本专利技术涉及医学数据处理
,尤其涉及一种生物医学文献类型的自动判定方法及系统。

技术介绍

[0002]近年来,循证医学在辅助医疗决策和医学研究的过程中得到了广泛应用。循证医学的核心思想是应用当前所能获得的最佳研究证据,结合临床医生的个人专业技能和临床经验,考虑患者的价值观和偏好为患者制订治疗方案。这些最佳研究证据通过检索PubMed、Cochrane Library、Web of Science、Embase、中国生物医学文献数据库(CBM)、CNKI、万方数据库、中文科技期刊数据库(VIP)等中英文数据库获得。但是随着医学的发展,发表的生物医学研究文献数量越来越多,这极大地增加了从业人员筛选与所研究问题密切相关文献的难度。同时,所选择的文献应具有良好的证据水平,生物医学文献的证据水平受到许多因素的影响,如文献的类型和研究的样本量等。其中生物医学文献的类型包括系统评价(SR),随机对照试验(RCT),病例报告等。尽管它们都可以提供某个方面的证据,但是它们的证据水平差异却很大。那么对于如何快速准确的获取最佳证据,及时制定出最佳治疗方案,临床医生面对着巨大的挑战。
[0003]对于生物医学文献类型的判定,传统的方法是通过包含文本字符串和数据库标签的组合的方式进行过滤,该方法可以判定部分文献的类型,但剩余文献需要人工判定。随着机器学习和深度学习的发展,自然语言处理(NLP)中的文本分类任务已经被广泛研究。基于机器学习的NLP技术,尽管提高了准确率,但模型不能学习规则外的复杂语义,训练集质量对模型性能影响较大。而基于卷积神经网络、循环神经网络的NLP技术,通过对词向量进行学习,可以表征更加抽象、复杂的文本语义,进一步提高模型的性能,提升准确率。但是卷积神经网络更倾向于捕捉局部语义信息,而循环神经网络则没有同时考虑上下文语义,且存在长期依赖问题。

技术实现思路

[0004]本专利技术实施例提供一种生物医学文献类型的自动判定方法及系统,用以解决目前生物医学文献类型判定存在上述部分或全部的问题。
[0005]第一方面,本专利技术实施例提供一种生物医学文献类型的自动判定方法,包括:
[0006]确定待判定的生物医学文献;
[0007]将所述待判定的生物医学文献输入至文献类型判定模型,得到所述文献类型判定模型输出的生物医学文献类型判定结果;
[0008]其中,所述文献类型判定模型是基于文献数据集的标注样本训练得到的。
[0009]优选地,所述文献类型判定模型包括规则判定器和判定模型;
[0010]将所述待判定的生物医学文献输入至文献类型判定模型,得到所述文献类型判定模型输出的生物医学文献类型判定结果,包括:
[0011]将所述待判定的生物医学文献输入所述规则判定器,基于构建的规则词典判定是否直接输出文献类型:若是,则直接输出生物医学文献类型判定结果;否则,将所述待判定的生物医学文献传送至所述判定模型,输出生物医学文献类型判定结果;
[0012]其中,所述规则词典是基于医学文献知识库进行文献数据筛选提炼出具有相同或相似规则特征的文献类别指标后确定各个文献类型得到的。
[0013]优选地,所述判定模型是基于所述文献数据集的标注样本对损失函数进行迭代训练得到的;其中,所述损失函数的公式如下:
[0014][0015]式中,W为各文献类别的权重占比,p(x
i
)为样本数据集中类别x
i
的目标概率分布,q(x
i
)为预测概率分布,ε为平滑系数,n为样本数据类别总数。
[0016]优选地,所述规则判定器包括判别单元、优化单元和结果收集单元;
[0017]将所述待判定的生物医学文献输入所述规则判定器,基于构建的规则词典判定是否直接输出文献类型,包括:
[0018]将所述待判定的生物医学文献输入所述判别单元,基于代码逻辑并结合所述规则词典输出类别判定结果;
[0019]将所述类别判定结果输入所述结果收集单元,输出格式化的类型判定结果,以判定是否直接输出文献类型;
[0020]其中,所述优化单元对所述判别单元和所述结果收集单元进行判别过程的时间优化和资源配置优化。
[0021]第二方面,本专利技术实施例提供一种生物医学文献类型的自动判定系统,包括:
[0022]文献确定单元,用于确定待判定的生物医学文献;
[0023]文献类型判定单元,用于将所述待判定的生物医学文献输入至文献类型判定模型,得到所述文献类型判定模型输出的生物医学文献类型判定结果;
[0024]其中,所述文献类型判定模型是基于文献数据集的标注样本训练得到的。
[0025]优选地,所述文献类型判定单元包括规则判定器和判定模块;
[0026]所述规则判定器,用于输入所述待判定的生物医学文献,并基于构建的规则词典判定是否直接输出文献类型:若是,则直接输出生物医学文献类型判定结果;否则,将所述待判定的生物医学文献传送至所述判定模型,输出生物医学文献类型判定结果;
[0027]其中,所述规则词典是基于医学文献知识库进行文献数据筛选提炼出具有相同或相似规则特征的文献类别指标后确定各个文献类型得到的。
[0028]优选地,所述判定模块是基于所述文献数据集的标注样本对损失函数进行迭代训练得到的;其中,所述损失函数的公式如下:
[0029][0030]式中,W为各文献类别的权重占比,p(x
i
)为样本数据集中类别x
i
的目标概率分布,q(x
i
)为预测概率分布,ε为平滑系数,n为样本数据类别总数。
[0031]优选地,所述规则判定器包括判别单元、优化单元和结果收集单元;
[0032]所述判别单元,用于输入所述待判定的生物医学文献,并基于代码逻辑并结合所述规则词典输出类别判定结果;
[0033]所述结果收集单元,用于输入所述类别判定结果,输出格式化的类型判定结果,以判定是否直接输出文献类型;
[0034]所述优化单元,用于对所述判别单元和所述结果收集单元进行判别过程的时间优化和资源配置优化。
[0035]第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一方面所提供的任一项所述生物医学文献类型的自动判定方法的步骤。
[0036]第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面所提供的任一项所述生物医学文献类型的自动判定方法的步骤。
[0037]本专利技术实施例提供的一种生物医学文献类型的自动判定方法及系统,通过将生物医学文献输入至文献类型判定模型,得到所述文献类型判定模型输出的生物医学文献类型判定结果;所述文献类型判定模型是基于文献数据集的标注样本训练得到的。本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生物医学文献类型的自动判定方法,其特征在于,包括:确定待判定的生物医学文献;将所述待判定的生物医学文献输入至文献类型判定模型,得到所述文献类型判定模型输出的生物医学文献类型判定结果;其中,所述文献类型判定模型是基于文献数据集的标注样本训练得到的。2.根据权利要求1所述的生物医学文献类型的自动判定方法,其特征在于,所述文献类型判定模型包括规则判定器和判定模型;将所述待判定的生物医学文献输入至文献类型判定模型,得到所述文献类型判定模型输出的生物医学文献类型判定结果,包括:将所述待判定的生物医学文献输入所述规则判定器,基于构建的规则词典判定是否直接输出文献类型:若是,则直接输出生物医学文献类型判定结果;否则,将所述待判定的生物医学文献传送至所述判定模型,输出生物医学文献类型判定结果;其中,所述规则词典是基于医学文献知识库进行文献数据筛选提炼出具有相同或相似规则特征的文献类别指标后确定各个文献类型得到的。3.根据权利要求2所述的生物医学文献类型的自动判定方法,其特征在于,所述判定模型是基于所述文献数据集的标注样本对损失函数进行迭代训练得到的;其中,所述损失函数的公式如下:式中,W为各文献类别的权重占比,p(x
i
)为样本数据集中类别x
i
的目标概率分布,q(x
i
)为预测概率分布,ε为平滑系数,n为样本数据类别总数。4.根据权利要求2所述的生物医学文献类型的自动判定方法,其特征在于,所述规则判定器包括判别单元、优化单元和结果收集单元;将所述待判定的生物医学文献输入所述规则判定器,基于构建的规则词典判定是否直接输出文献类型,包括:将所述待判定的生物医学文献输入所述判别单元,基于代码逻辑并结合所述规则词典输出类别判定结果;将所述类别判定结果输入所述结果收集单元,输出格式化的类型判定结果,以判定是否直接输出文献类型;其中,所述优化单元对所述判别单元和所述结果收集单元进行判别过程的时间优化和资源配置优化。5.一种生物医学文献类型的自动判定系统,其特征在于,包括:文献确定单元,用于确定待判定的生物医学文献;文献类型判定单...

【专利技术属性】
技术研发人员:任丽军王则远刘鹏周旻
申请(专利权)人:灵犀量子北京医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1