一种基于个性化推荐算法的医药数据搜索系统技术方案

技术编号:38346017 阅读:8 留言:0更新日期:2023-08-02 09:26
本发明专利技术公开一种基于个性化推荐算法的医药数据搜索系统,属于搜索引擎的技术领域,本发明专利技术主要设备包括:底层数据库,中层数据库,高层数据库,数据收集模块,数据标准化模块,数据审核模块,搜索模块,身份识别模块与系统程序模块,其中,系统程序模块能够控制身份识别模块对使用者的个人身份信息单元进行识别分析,并根据识别到的个人身份信息控制搜索模块为使用者提供符合使用者需求的数据信息,控制身份识别模块根据使用者在使用搜索模块时浏览的数据信息类型,不断完善个人身份信息,并通过不断完善的个人信息修改数据收集模块、数据标准化模块与数据审核模块的应用算法,使搜索系统能够满足使用者的需求。系统能够满足使用者的需求。系统能够满足使用者的需求。

【技术实现步骤摘要】
一种基于个性化推荐算法的医药数据搜索系统


[0001]本专利技术涉及搜索引擎
,尤其涉及一种基于个性化推荐算法的医药数据搜索系统。

技术介绍

[0002]搜索系统是指按照用户的需求与一定的算法,运用特定的策略从互联网检索制定的信息反馈给用户的一门检索数据技术。搜索系统基于网络爬虫技术、网页处理技术、大数据处理技术等技术手段,为信息检索用户提供快速、高效的信息服务,数据搜索系统在医疗器械行业中应用广泛,对于医疗器械行业的发展起到了关键性作用。
[0003]公告号CN110020091A公开了一种基于区块链的医疗搜索引擎系统,区块链搜索引擎系统包括操作系统和处理系统;操作系统包括搜索设置单元、搜索信息设定单元以及搜索信息筛选单元;搜索设置单元与搜索信息设定单元连接,搜索信息设定单元与医疗数据处理单元连接,医疗数据处理单元和查找单元连接,查找单元与医疗数据结果显示单元连接,医疗数据结果显示单元与搜索信息筛选单元连接;处理系统包括医疗数据处理单元和医疗数据结果显示单元;本专利技术通过简单的搜索程序可以在整个系统中进行全面的搜索,搜索信息准确,节省了搜索时间,方便搜索用户的使用。
[0004]以上系统未设置搜索模块与身份识别模块,无法根据识别到的个人身份信息为使用者提供符合使用者需求的数据信息,也无法根据使用者浏览的数据信息类型,不断完善个人身份信息,使搜索系统的搜索效果下降。

技术实现思路

[0005]为此,本专利技术提供一种基于个性化推荐算法的医药数据搜索系统,用以克服现有技术中无法根据识别到的个人身份信息为使用者提供符合使用者需求的数据信息,也无法根据使用者浏览的数据信息类型,不断完善个人身份信息,使搜索系统的搜索效果下降。
[0006]为实现上述目的,本专利技术提供一种基于个性化推荐算法的医药数据搜索系统,包括,
[0007]医药数据库,用于存储搜索系统中的全部数据信息;
[0008]数据收集模块,用于在互联网上收集医药相关的数据信息,并将数据信息传输至所述医药数据库中;
[0009]数据标准化模块,用于对医药数据库中的数据信息进行整理、提取、分类的标准化处理操作,并将原始数据信息构建为数据信息单元,使数据信息以单元为单位的组织形式存储在医药数据库中,并为每个数据信息单元编辑独立的单元编号;
[0010]数据审核模块,用于对医药数据库中完成标准化处理操作的信息进行审核;
[0011]搜索模块,用于识别使用者输入的搜索词,并根据搜索词对医药数据库中的数据信息进行搜索;
[0012]身份识别模块,用于对系统的使用者进行身份识别,并根据系统使用者不同的身
份信息,制定出使用者的个人身份信息单元;
[0013]系统程序模块,用于协调控制所述医药数据库、所述数据收集模块、所述数据标准化模块、所述数据审核模块、所述搜索模块与所述身份识别模块进行组合工作,系统程序模块能够控制身份识别模块对使用者的个人身份信息单元进行识别分析,并根据识别到的个人身份信息控制搜索模块为使用者提供符合使用者需求的数据信息,并控制身份识别模块根据使用者在使用搜索模块时浏览的数据信息类型,不断完善个人身份信息,并通过不断完善的个人信息修改数据收集模块、数据标准化模块与数据审核模块的应用算法,使搜索系统能够满足使用者的需求。
[0014]进一步的,所述医药数据库,包括,
[0015]高层数据库,用于存储所述数据收集模块、所述数据标准化模块、所述数据审核模块、所述搜索模块、所述身份识别模块与所述系统程序模块的程序数据信息;
[0016]中层数据库,用于存储使用者的个人身份信息单元,并存储所述医药数据库中所有数据信息单元的单元编号;
[0017]底层数据库,用于存储所述数据收集模块从互联网上收集到的全部数据信息单元,并存储有医学名词词库;
[0018]所述各层级数据库相互连接。
[0019]进一步的,所述数据标准化模块能够对每个独立的数据信息单元中的数据信息进行识别,并判断数据信息单元中的数据信息是否具有标题,
[0020]若该数据信息单元中的数据信息具有标题,所述数据标准化模块直接将原标题作为该数据信息单元的标题;
[0021]若该数据信息单元中的数据信息不具有标题,所述数据标准化模块对该单元中的数据信息进行分析,根据对数据信息的分析,提取出医学相关的高频关键词,并为该数据信息单元设定标题。
[0022]进一步的,所述数据标准化模块具有数据分类算法,并能够对所述底层数据库中的全部数据信息单元进行分类;
[0023]所述数据标准化模块对数据信息单元标题中的医学名字进行提取,并将标题中具有同类医学名词的数据信息单元划分为以该医学名词作为标题的数据信息组;
[0024]所述数据标准化模块对每个数据信息组进行编号,数据信息组中保存有其类别下全部数据信息单元的单元编号,并且数据标准化模块将全部数据信息组存储在所述中层数据库中;
[0025]一个数据信息单元的标题中具有两个或两个以上的医学名词,该数据信息单元能够同时属于两个或两个以上的数据信息组;
[0026]所述数据标准化模块根据同一数据信息单元的标题中医学名词的数量,判定该数据信息单元的分类属性,
[0027]若同一数据信息单元的标题中仅具有一个医学名词,并仅属于一个数据信息组,所述数据标准化模块判定该数据信息单元的分类属性为单一类别数据信息单元;
[0028]若同一数据信息单元的标题中具有两个或两个以上的医学名词,并属于两个或两个以上的数据信息组,所述数据标准化模块判定该数据信息单元的分类属性为复合类别数据信息单元。
[0029]进一步的,所述身份识别模块具有使用者需求算法,使用者需求算法能够对使用者个人身份信息单元中的个人信息进行分析计算,并生成使用者需求单元;
[0030]所述身份识别模块对使用者个人身份信息单元中出现的医学名词进行提取,并将个人身份信息单元中出现的医学名词与各数据信息组的标题进行相似度计算,将计算结果记为使用者需求相似度,并根据使用者需求相似度的大小将各数据信息组进行排序,并提取出需求相似度排名第一的数据信息组的标题,保存在使用者需求单元中,作为使用者需求单元中的需求主词;
[0031]所述身份识别模块根据使用者使用所述搜索模块时,浏览的数据信息类型对使用者需求单元进行修改。
[0032]尤其,所述搜索模块能够接收使用者输入的搜索词,并将搜索词与各数据信息组的标题进行相似度计算,并将计算结果记为本次搜索中各数据信息组的关键词相似度,并且同一个数据信息组下属的全部数据信息单元与其所属的数据信息组具有相同的关键词相似度;
[0033]所述搜索模块内预设有关键词相似度参考值,搜索模块将各数据信息组的关键词相似度与关键词相似度参考值进行对比,
[0034]若数据信息组的关键词相似度大于或等于关键词相似度参考值,所述搜索模块判定该数据信息组为本次搜索范围内数据信息组;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于个性化推荐算法的医药数据搜索系统,其特征在于,包括,医药数据库,用于存储搜索系统中的全部数据信息;数据收集模块,用于在互联网上收集医药相关的数据信息,并将数据信息传输至所述医药数据库中;数据标准化模块,用于对医药数据库中的数据信息进行整理、提取、分类的标准化处理操作,并将原始数据信息构建为数据信息单元,使数据信息以单元为单位的组织形式存储在医药数据库中,并为每个数据信息单元编辑独立的单元编号;数据审核模块,用于对医药数据库中完成标准化处理操作的信息进行审核;搜索模块,用于识别使用者输入的搜索词,并根据搜索词对医药数据库中的数据信息进行搜索;身份识别模块,用于对系统的使用者进行身份识别,并根据系统使用者不同的身份信息,制定出使用者的个人身份信息单元;系统程序模块,用于协调控制所述医药数据库、所述数据收集模块、所述数据标准化模块、所述数据审核模块、所述搜索模块与所述身份识别模块进行组合工作,系统程序模块能够控制身份识别模块对使用者的个人身份信息单元进行识别分析,并根据识别到的个人身份信息控制搜索模块为使用者提供符合使用者需求的数据信息,控制身份识别模块根据使用者在使用搜索模块时浏览的数据信息类型,不断完善个人身份信息,并通过不断完善的个人信息修改数据收集模块、数据标准化模块与数据审核模块的应用算法,使搜索系统能够满足使用者的需求。2.根据权利要求1所述的基于个性化推荐算法的医药数据搜索系统,其特征在于,所述医药数据库,包括,高层数据库,用于存储所述数据收集模块、所述数据标准化模块、所述数据审核模块、所述搜索模块、所述身份识别模块与所述系统程序模块的程序数据信息;中层数据库,用于存储使用者的个人身份信息单元,并存储所述医药数据库中所有数据信息单元的单元编号;底层数据库,用于存储所述数据收集模块从互联网上收集到的全部数据信息单元,并存储有医学名词词库;所述各层级数据库相互连接。3.根据权利要求2所述的基于个性化推荐算法的医药数据搜索系统,其特征在于,所述数据标准化模块能够对每个独立的数据信息单元中的数据信息进行识别,并判断数据信息单元中的数据信息是否具有标题,若该数据信息单元中的数据信息具有标题,所述数据标准化模块直接将原标题作为该数据信息单元的标题;若该数据信息单元中的数据信息不具有标题,所述数据标准化模块对该单元中的数据信息进行分析,根据对数据信息的分析,提取出医学相关的高频关键词,并为该数据信息单元设定标题。4.根据权利要求3所述的基于个性化推荐算法的医药数据搜索系统,其特征在于,所述数据标准化模块具有数据分类算法,并能够对所述底层数据库中的全部数据信息单元进行分类;
所述数据标准化模块对数据信息单元标题中的医学名字进行提取,并将标题中具有同类医学名词的数据信息单元划分为以该医学名词作为标题的数据信息组;所述数据标准化模块对每个数据信息组进行编号,数据信息组中保存有其类别下全部数据信息单元的单元编号,并且数据标准化模块将全部数据信息组存储在所述中层数据库中;一个数据信息单元的标题中具有两个或两个以上的医学名词,该数据信息单元能够同时属于两个或两个以上的数据信息组;所述数据标准化模块根据同一数据信息单元的标题中医学名词的数量,判定该数据信息单元的分类属性,若同一数据信息单元的标题中仅具有一个医学名词,并仅属于一个数据信息组,所述数据标准化模块判定该数据信息单元的分类属性为单一类别数据信息单元;若同一数据信息单元的标题中具有两个或两个以上的医学名词,并属于两个或两个以上的数据信息组,所述数据标准化模块判定该数据信息单元的分类属性为复合类别数据信息单元。5.根据权利要求4所述的基于个性化推荐算法的医药数据搜索系统,其特征在于,所述身份识别模块具有使用者需求算法,使用者需求算法能够对使用者个人身份信息单元中的个人信息进行分析计算,并生成使用者需求单元;所述身份识别模块对使用者个人身份信息单元中出现的医学名词进行提取,并将个人身份信息单元中出现的医学名词与各数据信息组的标题进行相似度计算,将计算结果记为使用者需求相似度,并根据使用者需求相似度的大小将各数据信息组进行排序,并提取出...

【专利技术属性】
技术研发人员:彭勇杨小龙
申请(专利权)人:北京泰茂科技股份有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1