一种生物医学文献类型的自动判定方法及系统技术方案

技术编号：31706052 阅读：17 留言：0更新日期：2022-01-01 11:08

本发明专利技术提供一种生物医学文献类型的自动判定方法及系统，其方法包括：确定待判定的生物医学文献；将所述待判定的生物医学文献输入至文献类型判定模型，得到所述文献类型判定模型输出的生物医学文献类型判定结果；其中，所述文献类型判定模型是基于文献数据集的标注样本训练得到的。本发明专利技术通过排除无关的文献类型，缩小临床医生筛选文献的数量，同时还可以使临床医生对证据质量做出估计，从而快速、准确的做出医疗决策。确的做出医疗决策。确的做出医疗决策。

全部详细技术资料下载

【技术实现步骤摘要】
一种生物医学文献类型的自动判定方法及系统

[0001]本专利技术涉及医学数据处理
，尤其涉及一种生物医学文献类型的自动判定方法及系统。

技术介绍

[0002]近年来，循证医学在辅助医疗决策和医学研究的过程中得到了广泛应用。循证医学的核心思想是应用当前所能获得的最佳研究证据，结合临床医生的个人专业技能和临床经验，考虑患者的价值观和偏好为患者制订治疗方案。这些最佳研究证据通过检索PubMed、Cochrane Library、Web of Science、Embase、中国生物医学文献数据库(CBM)、CNKI、万方数据库、中文科技期刊数据库(VIP)等中英文数据库获得。但是随着医学的发展，发表的生物医学研究文献数量越来越多，这极大地增加了从业人员筛选与所研究问题密切相关文献的难度。同时，所选择的文献应具有良好的证据水平，生物医学文献的证据水平受到许多因素的影响，如文献的类型和研究的样本量等。其中生物医学文献的类型包括系统评价(SR)，随机对照试验(RCT)，病例报告等。尽管它们都可以提供某个方面的证据，但是它们的证据水平差异却很大。那么对于如何快速准确的获取最佳证据，及时制定出最佳治疗方案，临床医生面对着巨大的挑战。
[0003]对于生物医学文献类型的判定，传统的方法是通过包含文本字符串和数据库标签的组合的方式进行过滤，该方法可以判定部分文献的类型，但剩余文献需要人工判定。随着机器学习和深度学习的发展，自然语言处理(NLP)中的文本分类任务已经被广泛研究。基于机器学习的NLP技术，尽管提高了准确率，但模型...

【技术保护点】

【技术特征摘要】
1.一种生物医学文献类型的自动判定方法，其特征在于，包括：确定待判定的生物医学文献；将所述待判定的生物医学文献输入至文献类型判定模型，得到所述文献类型判定模型输出的生物医学文献类型判定结果；其中，所述文献类型判定模型是基于文献数据集的标注样本训练得到的。2.根据权利要求1所述的生物医学文献类型的自动判定方法，其特征在于，所述文献类型判定模型包括规则判定器和判定模型；将所述待判定的生物医学文献输入至文献类型判定模型，得到所述文献类型判定模型输出的生物医学文献类型判定结果，包括：将所述待判定的生物医学文献输入所述规则判定器，基于构建的规则词典判定是否直接输出文献类型：若是，则直接输出生物医学文献类型判定结果；否则，将所述待判定的生物医学文献传送至所述判定模型，输出生物医学文献类型判定结果；其中，所述规则词典是基于医学文献知识库进行文献数据筛选提炼出具有相同或相似规则特征的文献类别指标后确定各个文献类型得到的。3.根据权利要求2所述的生物医学文献类型的自动判定方法，其特征在于，所述判定模型是基于所述文献数据集的标注样本对损失函数进行迭代训练得到的；其中，所述损失函数的公式如下：式中，W为各文献类别的权重占比，p(x
i
)为样本数据集中类别x
i
的目标概率分布，q(x
i
)为预测概率分布，ε为平滑系数，n为样本数据类别总数。4.根据权利要求2所述的生物医学文献类型的自动判定方法，其特征在于，所述规则判定器包括判别单元、优化单元和结果收集单元；将所述待判定的生物医学文献输入所述规则判定器，基于构建的规则词典判定是否直接输出文献类型，包括：将所述待判定的生物医学文献输入所述判别单元，基于代码逻辑并结合所述规则词典输出类别判定结果；将所述类别判定结果输入所述结果收集单元，输出格式化的类型判定结果，以判定是否直接输出文献类型；其中，所述优化单元对所述判别单元和所述结果收集单元进行判别过程的时间优化和资源配置优化。5.一种生物医学文献类型的自动判定系统，其特征在于，包括：文献确定单元，用于确定待判定的生物医学文献；文献类型判定单...

【专利技术属性】
技术研发人员：任丽军，王则远，刘鹏，周旻，
申请(专利权)人：灵犀量子北京医疗科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人