The invention provides a traditional Chinese medicine literature analysis method, which comprises the following steps: acquiring Chinese medical literature database; obtaining medical keywords and saved into a specific data format as the key information is stored; then the unstructured text data downloaded into key information extraction, encoding the key information for Establishing TCM medical literature the classification of all keywords; the core data corresponding to a number of core data group; while the non core data corresponding to all the keywords into several non core data base; access to Chinese literature keyword combination, according to TCM keyword combination as search keywords to obtain the corresponding Chinese literature as a traditional Chinese medical literature, Chinese medicine document storage, and the traditional Chinese medicine literature keyword combination and the time interval as the Medical literature storage identifier. The invention realizes the efficient and accurate access to the documents and data of traditional Chinese medicine, and achieves the accurate classification and storage of the medical documents of traditional Chinese medicine.
【技术实现步骤摘要】
一种中医学文献分析方法
本专利技术涉及到文献数据处理
,特别是一种中医学文献分析方法。
技术介绍
中医学是当今中国医药卫生事业中独具特色和优势的重要组成部分,对于丰富世界医学宝库、保护人类健康,产生积极的作用。新形势下,我国中医学学领域的相关研究在注重继承经典的同时,同样注重与西方医学、药学、信息学、生物学等领域的交叉融合,形成新的学科增长点,在学术研究领域则表现为研究主题跨双学科或多学科的学术论文的发表。在医学研究领域,领域内专家、学者通常基于定性的研究方法,在大量阅读文献的基础上,依据其研究经验及积累主观性地识别某领域或学科的研究热点,形成综述类文献或报告,以供借鉴。现有技术目前都是基于人工分析整理中医学文献,还没有一种科学化基于大数据分析的文献分类方式。
技术实现思路
为解决上述技术问题,本专利技术提供了一种中医学文献分析方法,其包括以下步骤:S1:以中医学为关键词获取原始文献数据库,提取所述原始文献数据库中每个文献的发表时间信息,将所述原始文献数据库按照多个时间段进行归类;S2:获取所述各时间段内的原始文献的原始关键词,所述原始关键词为原始文献中出现频次超过设定阈值的词,对所述原始关键词进行数据清洗得到医学关键词;S3:然后将所述医学关键词保存成特定的数据格式作为关键信息进行存储,建立中医医学文献的关键信息的编码表,所述关键信息分别对应一个二进制编码;S4:所述关键信息包括核心数据和非核心数据两种类型,提取出来的数据,首先存入相应数据库,作为下一步数据处理的基础数据,然后导人SQL中进行下一步的挖掘分析;所述核心数据为下载的文本数据中超过设定阈值 ...
【技术保护点】
一种中医学文献分析方法,其特征在于,包括以下步骤:S1:以中医学为关键词获取原始文献数据库,提取所述原始文献数据库中每个文献的发表时间信息,将所述原始文献数据库按照多个时间段进行归类;S2:获取所述各时间段内的原始文献的原始关键词,所述原始关键词为原始文献中出现频次超过设定阈值的词,对所述原始关键词进行数据清洗得到医学关键词;S3:然后将所述医学关键词保存成特定的数据格式作为关键信息进行存储,建立中医医学文献的关键信息的编码表,所述关键信息分别对应一个二进制编码;S4:所述关键信息包括核心数据和非核心数据两种类型,提取出来的数据,首先存入相应数据库,作为下一步数据处理的基础数据,然后导人SQL中进行下一步的挖掘分析;所述核心数据为下载的文本数据中超过设定阈值频率的关键词,所述非核心数据为下载的文本数据中出现过至少一次并低于设定阈值的关键词;核心数据对应的关键词i的数据模式可以表示为一个关系表Hi(B1,B2,...,Bmi),其中B为该关键词的属性值,各关键词的属性值根据关键词所在中医的具体领域进行预先设定;关键词对应的数据库{D1,D2,...,Dni}的数据模式都可以对应到Hi上; ...
【技术特征摘要】
1.一种中医学文献分析方法,其特征在于,包括以下步骤:S1:以中医学为关键词获取原始文献数据库,提取所述原始文献数据库中每个文献的发表时间信息,将所述原始文献数据库按照多个时间段进行归类;S2:获取所述各时间段内的原始文献的原始关键词,所述原始关键词为原始文献中出现频次超过设定阈值的词,对所述原始关键词进行数据清洗得到医学关键词;S3:然后将所述医学关键词保存成特定的数据格式作为关键信息进行存储,建立中医医学文献的关键信息的编码表,所述关键信息分别对应一个二进制编码;S4:所述关键信息包括核心数据和非核心数据两种类型,提取出来的数据,首先存入相应数据库,作为下一步数据处理的基础数据,然后导人SQL中进行下一步的挖掘分析;所述核心数据为下载的文本数据中超过设定阈值频率的关键词,所述非核心数据为下载的文本数据中出现过至少一次并低于设定阈值的关键词;核心数据对应的关键词i的数据模式可以表示为一个关系表Hi(B1,B2,...,Bmi),其中B为该关键词的属性值,各关键词的属性值根据关键词所在中医的具体领域进行预先设定;关键词对应的数据库{D1,D2,...,Dni}的数据模式都可以对应到Hi上;其中非核心数据对应的关键词j的数据模式可以表示为一个关系表Hj(B1,B2,...,Bmj),其中B为该关键词的属性,关键词对应的数据库{D1,D2,...,Dnj}的数据模式都可以对应到Hj上;具体各关键词的关联度量化值为K(Bmi,Dni)=ρdist(Bmi,Dni)-1,K(...
【专利技术属性】
技术研发人员:谭红春,阚红星,耿英保,谷宗运,
申请(专利权)人:谭红春,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。