【技术实现步骤摘要】
基于NLP自然语言处理的中医养生智能问答系统
[0001]本专利技术属于数据识别领域,具体涉及一种基于NLP自然语言处理的中医养生智能问答系统。
技术介绍
[0002]随着医疗信息化的发展,人们越来越多地希望能够从网络上获得更为准确的疾病诊疗信息。通常情况下,人们通过再搜索引擎中输入关键词获得相关的网页信息,但这些网页信息还需要用户自行鉴别,对用户的鉴别能力要求较高。
[0003]问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。现有的医药问答网站的问答模式都是医生进行在线回复或搜索给出相关检索结果,尚未有智能知识问答系统提供服务。
[0004]中医药是我国医疗行业的重要组成部分,也是人们治未病、保健、养生的重要手段,智能知识问答系统在中医药领域的应用在急需研究和发展。但是现有的中医药领域的智能问答系统都是未真正基于中药领域本体构建的,进而使得问答系统无法获得较高的准确率。
技术实现思路
[0005]为解决上述问题,本专利技术提供了一种能够为用户准确迅速解答中医药养生问题的技术方案,本专利技术采用了如下技术方案:
[0006]本专利技术提供了一种基于NLP自然语言处理的中医养生智能问答系统,用于针对用户输入的临床表现文本进行自然语言处理,从而得到对应的养生建议,其特征在于,包括:多个用户终端,由用户持有;以及管理服务器,与用户终端相通信连接,其中,管理服务器包括中医养生文字分词模块、词性标注模块、命名实体识别与分类模块、依存关系分析模 ...
【技术保护点】
【技术特征摘要】
1.一种基于NLP自然语言处理的中医养生智能问答系统,用于针对用户输入的临床表现文本进行自然语言处理,从而得到对应的养生建议,其特征在于,包括:多个用户终端,由所述用户持有;以及管理服务器,与所述用户终端相通信连接,其中,所述管理服务器包括中医养生文字分词模块、词性标注模块、命名实体识别与分类模块、依存关系分析模块、语义相似度计算模块以及答案检索模块,所述中医养生文字分词模块根据预定的分词词库对所述临床表现文本进行分词处理,从而得到多个中医养生分词,所述词性标注模块对每个所述中医养生分词进行词性标注,使得每个所述中医养生分词都有对应的词性,所述命名实体识别与分类模块根据所述中医养生分词以及对应的所述词性,利用预先训练好的命名实体识别模型对所述中医养生分词进行命名实体识别,从而得到命名实体识别结果,并按照预定的实体类别对所述命名实体识别结果进行分类,从而使得每个所述命名实体识别结果都有对应的实体类别,所述依存关系分析模块基于所述中医养生分词、对应的所述词性以及所述实体类别对所述临床表现文本各个成分之间的关系进行分析,从而得到临床表现文本语义,所述语义相似度计算模块基于所述临床表现文本语义计算所述临床表现文本中的用户问题与预定的问答库中不同入库问题之间的语义相似度,从而得到所述用户问题与各个所述入库问题之间的语义相似度值,所述答案检索模块根据所述语义相似度值利用预定的检索机制从所述问答库中检索到与所述用户问题对应的答案,作为所述养生建议。2.根据权利要求1所述的基于NLP自然语言处理的中医养生智能问答系统,其特征在于:其中,所述分词词库由高频词库和分割词库组成,通过如下步骤得到:步骤S1
‑
1,从不同中医书籍中提取中医相关文字信息;步骤S1
‑
2,根据所述临床表现文本中的标点字符对所述临床表现文本进行文字分割,从而得到各个文字;步骤S1
‑
3,统计相邻的文字在同一时刻出现的频率数量;步骤S1
‑
4,判断所述频率数量是否大于预定的频率阈值T;步骤S1
‑
5,在所述步骤S1
‑
4判断为是时,将所述相邻的文字作为高频词生成所述高频词库,在所述步骤S1
‑
4判断为否时,将文字作为分割词生成所述分割词库。3.根据权利要求1所述的基于NLP自然语言处理的中医养生智能问答系统,其特征在于:其中,所述中医养生文字分词模块对所述临床表现文本进行的分词处理包括如下步骤:步骤S2
‑
1,遍历所述临床表现文本中的所有相邻字符串mn,判断所述相邻字符串mn是否为高频词库中的元素;步骤S2
‑
2,在所述步骤S2
‑
1判断为是时,则所述相邻字符串mn成词,在所述步骤S2
‑
1判断为否时,则判断所述相邻字符串mn是否为分割词库的元素;
步骤S2
‑
3,在所述步骤S2
‑
2判断为是时,则所述相邻字符串mn不成词,在所述步骤S2
‑
2判断为否时,计算所述相邻字符串mn之间的正向概率;步骤S2
‑
4,判断正向概率是否大于0.1;步骤S2
‑
5,在所述步骤S2
‑
4判断为是时,则所述相邻字符串mn成词,在所述步骤S2
‑
4判断为否时,则判断所述正向概率是否小于0.001;步骤S2
‑
6,在所述步骤S2
‑
5判断为是时,则所述相邻字符串mn不成词,在所述步骤S2
‑
5判断为否时,则计算所述相邻字符串mn的逆向概率;步骤S2
‑
7,判断所述逆向概率是否大于0.1;步骤S2
‑
8,在所述步骤S2
‑
7判断为是时,则所述相邻字符串mn成词,在所述步骤S2
‑
7判断为否时,则判断所述逆向概率是否小于0.001;步骤S2
‑
9,在所述步骤S2
‑
8判断为是时,则所述相邻字符串...
【专利技术属性】
技术研发人员:周峰,吕智慧,严绍根,陈宇,徐杨川,林榕健,
申请(专利权)人:浙江智树网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。