基于NLP自然语言处理的中医养生智能问答系统技术方案

技术编号:30647207 阅读:14 留言:0更新日期:2021-11-04 00:57
本发明专利技术提供一种基于NLP自然语言处理的中医养生智能问答系统,包括:用户终端和管理服务器,其中,管理服务器包括中医养生文字分词模块、词性标注模块、命名实体识别与分类模块、依存关系分析模块、语义相似度计算模块以及答案检索模块,中医养生文字分词模块根据预定分词词库对临床表现文本进行分词处理,命名实体识别与分类模块对分词进行命名实体识别并分类,依存关系分析模块对临床表现文本各个成分之间的关系进行分析,得到临床表现文本语义,语义相似度计算模块基于临床表现文本语义计算用户问题与入库问题之间的语义相似度值,答案检索模块根据语义相似度值采用预定的检索机制从问答库中检索到与用户问题对应的答案,作为养生建议。作为养生建议。作为养生建议。

【技术实现步骤摘要】
基于NLP自然语言处理的中医养生智能问答系统


[0001]本专利技术属于数据识别领域,具体涉及一种基于NLP自然语言处理的中医养生智能问答系统。

技术介绍

[0002]随着医疗信息化的发展,人们越来越多地希望能够从网络上获得更为准确的疾病诊疗信息。通常情况下,人们通过再搜索引擎中输入关键词获得相关的网页信息,但这些网页信息还需要用户自行鉴别,对用户的鉴别能力要求较高。
[0003]问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。现有的医药问答网站的问答模式都是医生进行在线回复或搜索给出相关检索结果,尚未有智能知识问答系统提供服务。
[0004]中医药是我国医疗行业的重要组成部分,也是人们治未病、保健、养生的重要手段,智能知识问答系统在中医药领域的应用在急需研究和发展。但是现有的中医药领域的智能问答系统都是未真正基于中药领域本体构建的,进而使得问答系统无法获得较高的准确率。

技术实现思路

[0005]为解决上述问题,本专利技术提供了一种能够为用户准确迅速解答中医药养生问题的技术方案,本专利技术采用了如下技术方案:
[0006]本专利技术提供了一种基于NLP自然语言处理的中医养生智能问答系统,用于针对用户输入的临床表现文本进行自然语言处理,从而得到对应的养生建议,其特征在于,包括:多个用户终端,由用户持有;以及管理服务器,与用户终端相通信连接,其中,管理服务器包括中医养生文字分词模块、词性标注模块、命名实体识别与分类模块、依存关系分析模块、语义相似度计算模块以及答案检索模块,中医养生文字分词模块根据预定的分词词库对临床表现文本进行分词处理,从而得到多个中医养生分词,词性标注模块对每个中医养生分词进行词性标注,使得每个中医养生分词都有对应的词性,命名实体识别与分类模块根据中医养生分词以及对应的词性,利用预先训练好的命名实体识别模型对中医养生分词进行命名实体识别,从而得到命名实体识别结果,并按照预定的实体类别对命名实体识别结果进行分类,从而使得每个命名实体识别结果都有对应的实体类别,依存关系分析模块基于中医养生分词、对应的词性以及实体类别对临床表现文本各个成分之间的关系进行分析,从而得到临床表现文本语义,语义相似度计算模块基于临床表现文本语义计算临床表现文本中的用户问题与预定的问答库中不同入库问题之间的语义相似度,从而得到用户问题与各个入库问题之间的语义相似度值,答案检索模块根据语义相似度值利用预定的检索机制从问答库中检索到与用户问题对应的答案,作为养生建议。
[0007]根据本专利技术提供的一种基于NLP自然语言处理的中医养生智能问答系统,还可以具有这样的技术特征,其中,分词词库由高频词库和分割词库组成,通过如下步骤得到:步
骤S1

1,从不同中医书籍中提取中医相关文字信息;步骤S1

2,根据临床表现文本中的标点字符对临床表现文本进行文字分割,从而得到各个文字;步骤S1

3,统计相邻的文字在同一时刻出现的频率数量;步骤S1

4,判断频率数量是否大于预定的频率阈值T;步骤S1

5,在步骤S1

4判断为是时,将相邻的文字作为高频词生成高频词库,在步骤S1

4判断为否时,将文字作为分割词生成分割词库。
[0008]根据本专利技术提供的一种基于NLP自然语言处理的中医养生智能问答系统,还可以具有这样的技术特征,其中,中医养生文字分词模块对临床表现文本进行的分词处理包括如下步骤:步骤S2

1,遍历临床表现文本中的所有相邻字符串mn,判断相邻字符串mn是否为高频词库中的元素;步骤S2

2,在步骤S2

1判断为是时,则相邻字符串mn成词,在步骤S2

1判断为否时,则判断相邻字符串mn是否为分割词库的元素;步骤S2

3,在步骤S2

2判断为是时,则相邻字符串mn不成词,在步骤S2

2判断为否时,计算相邻字符串mn之间的正向概率;步骤S2

4,判断正向概率是否大于0.1;步骤S2

5,在步骤S2

4判断为是时,则相邻字符串mn成词,在步骤S2

4判断为否时,则判断正向概率是否小于0.001;步骤S2

6,在步骤S2

5判断为是时,则相邻字符串mn不成词,在步骤S2

5判断为否时,则计算相邻字符串mn的逆向概率;步骤S2

7,判断逆向概率是否大于0.1;步骤S2

8,在步骤S2

7判断为是时,则相邻字符串mn成词,在步骤S2

7判断为否时,则判断逆向概率是否小于0.001;步骤S2

9,在步骤S2

8判断为是时,则相邻字符串mn不成词,在步骤S2

8判断为否时,则计算相邻字符串mn的相对距离;步骤S2

10,判断相对距离是否在预定的阈值范围内;步骤S2

11,在步S2

10判断为是时,则相邻字符串mn成词,在步S2

10判断为否时,则相邻字符串mn不成词,并完成针对临床表现文本的分词。
[0009]根据本专利技术提供的一种基于NLP自然语言处理的中医养生智能问答系统,还可以具有这样的技术特征,其中,命名实体识别模型的训练步骤如下:步骤S3

1,获取中医养生问答相关的训练用文本,对训练用文本进行分词;步骤S3

2,将不同的中医书籍中本体概念作为初始源词典,利用反向最大匹配算法获取初始源词典中的实体类别;步骤S3

3,根据实体类别对实体进行实体命名识别;步骤S3

4,利用条件随机场算法对训练用文本进行多属性特征标注,从而得到标注好的训练样本;步骤S3

5,根据训练样本的特点制定对应的特征模板;步骤S3

6,利用标注好的训练样本以及特征模板进行训练,从而得到训练好的命名实体识别模型,实体类别包括主诉、临床表现、西医诊断、中医诊断、中医证型、中医方药、方药组成、治疗建议、药膳建议、运动建议、生活建议以及穴位建议。
[0010]根据本专利技术提供的一种基于NLP自然语言处理的中医养生智能问答系统,还可以具有这样的技术特征,其中,依存关系分析模块对临床表现文本进行分析的步骤如下:步骤S4

1,分别对所有中医养生分词、所有词性以及所有实体类别进行特征提取,从而得到对应的词特征、词性特征以及词标签特征;步骤S4

2,分别将词特征、词性特征以及词标签特征映射成对应的词向量、词性向量以及词标签向量,将所有词向量所有词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NLP自然语言处理的中医养生智能问答系统,用于针对用户输入的临床表现文本进行自然语言处理,从而得到对应的养生建议,其特征在于,包括:多个用户终端,由所述用户持有;以及管理服务器,与所述用户终端相通信连接,其中,所述管理服务器包括中医养生文字分词模块、词性标注模块、命名实体识别与分类模块、依存关系分析模块、语义相似度计算模块以及答案检索模块,所述中医养生文字分词模块根据预定的分词词库对所述临床表现文本进行分词处理,从而得到多个中医养生分词,所述词性标注模块对每个所述中医养生分词进行词性标注,使得每个所述中医养生分词都有对应的词性,所述命名实体识别与分类模块根据所述中医养生分词以及对应的所述词性,利用预先训练好的命名实体识别模型对所述中医养生分词进行命名实体识别,从而得到命名实体识别结果,并按照预定的实体类别对所述命名实体识别结果进行分类,从而使得每个所述命名实体识别结果都有对应的实体类别,所述依存关系分析模块基于所述中医养生分词、对应的所述词性以及所述实体类别对所述临床表现文本各个成分之间的关系进行分析,从而得到临床表现文本语义,所述语义相似度计算模块基于所述临床表现文本语义计算所述临床表现文本中的用户问题与预定的问答库中不同入库问题之间的语义相似度,从而得到所述用户问题与各个所述入库问题之间的语义相似度值,所述答案检索模块根据所述语义相似度值利用预定的检索机制从所述问答库中检索到与所述用户问题对应的答案,作为所述养生建议。2.根据权利要求1所述的基于NLP自然语言处理的中医养生智能问答系统,其特征在于:其中,所述分词词库由高频词库和分割词库组成,通过如下步骤得到:步骤S1

1,从不同中医书籍中提取中医相关文字信息;步骤S1

2,根据所述临床表现文本中的标点字符对所述临床表现文本进行文字分割,从而得到各个文字;步骤S1

3,统计相邻的文字在同一时刻出现的频率数量;步骤S1

4,判断所述频率数量是否大于预定的频率阈值T;步骤S1

5,在所述步骤S1

4判断为是时,将所述相邻的文字作为高频词生成所述高频词库,在所述步骤S1

4判断为否时,将文字作为分割词生成所述分割词库。3.根据权利要求1所述的基于NLP自然语言处理的中医养生智能问答系统,其特征在于:其中,所述中医养生文字分词模块对所述临床表现文本进行的分词处理包括如下步骤:步骤S2

1,遍历所述临床表现文本中的所有相邻字符串mn,判断所述相邻字符串mn是否为高频词库中的元素;步骤S2

2,在所述步骤S2

1判断为是时,则所述相邻字符串mn成词,在所述步骤S2

1判断为否时,则判断所述相邻字符串mn是否为分割词库的元素;
步骤S2

3,在所述步骤S2

2判断为是时,则所述相邻字符串mn不成词,在所述步骤S2

2判断为否时,计算所述相邻字符串mn之间的正向概率;步骤S2

4,判断正向概率是否大于0.1;步骤S2

5,在所述步骤S2

4判断为是时,则所述相邻字符串mn成词,在所述步骤S2

4判断为否时,则判断所述正向概率是否小于0.001;步骤S2

6,在所述步骤S2

5判断为是时,则所述相邻字符串mn不成词,在所述步骤S2

5判断为否时,则计算所述相邻字符串mn的逆向概率;步骤S2

7,判断所述逆向概率是否大于0.1;步骤S2

8,在所述步骤S2

7判断为是时,则所述相邻字符串mn成词,在所述步骤S2

7判断为否时,则判断所述逆向概率是否小于0.001;步骤S2

9,在所述步骤S2

8判断为是时,则所述相邻字符串...

【专利技术属性】
技术研发人员:周峰吕智慧严绍根陈宇徐杨川林榕健
申请(专利权)人:浙江智树网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1