System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其是涉及到一种选刊方法、装置、存储介质和计算机设备。
技术介绍
1、发表科研论文是学术工作者最关心的事情,但世面已有的刊物众多,对于初涉领域的人来说,选择什么刊发表是一个难题。相关技术中,通常依靠网络爬虫爬取历史发表数据形成可用于人工智能模型的语料,并建立相关模型,通过计算出新输入数据与模型语料之间的相似度,利用相似度找出相似度高的语料,再根据这些相似语料的得出刊物。但局部数据无法涵盖全部的刊源信息,结果准确性不能保障,并且建立模型需一定时间,无法高效的应用数据。
技术实现思路
1、有鉴于此,本申请提供了一种选刊方法、装置、存储介质和计算机设备,利用用户输入的篇名、关键词、摘要等信息通过统计学的办法快速推荐出较适合发表的刊物。
2、根据本申请的一个方面,提供了一种选刊方法,包括:
3、依据待投文档的检索词和指定检索内容,按照指定检索方式在目标数据库进行检索,确定待投文档的相似文档;
4、依据指定检索方式,确定待投文档与相似文档所属候选刊物之间的刊物相关度和候选刊物的相似属性信息;
5、依据刊物相关度和相似属性信息,计算候选刊物的推荐度;
6、将推荐度大于预设推荐度的候选刊物作为目标刊物,并顺序输出目标刊物的刊物信息。
7、进一步地,指定检索方式包括模糊检索,依据待投文档的检索词和指定检索内容,按照指定检索方式在目标数据库进行检索,确定待投文档的相似文档,具体包括:
8、以目标数据
9、确定不同预设刊物下的候选文档的文档数量;
10、对预设刊物进行筛选,确定候选文档的文档数量大于预设数量的候选刊物;
11、将候选刊物下的候选文档作为相似文档。
12、进一步地,指定检索方式包括模糊检索,依据指定检索方式,确定待投文档与相似文档所属候选刊物之间的刊物相关度,具体包括:
13、将预设相关度作为刊物相关度。
14、进一步地,指定检索方式包括精确检索,依据待投文档的检索词和指定检索内容,按照指定检索方式在目标数据库进行检索,确定待投文档的相似文档,具体包括:
15、依据检索词和指定检索内容在目标数据库进行检索,确定候选文档以及候选文档与待投文档之间的相似度;
16、依据相似度对候选文档进行筛选,确定预设文档数量的相似文档,其中,相似文档的相似度大于第一预设相似度。
17、进一步地,指定检索方式包括精确检索,依据指定检索方式,确定待投文档与相似文档所属候选刊物之间的刊物相关度,具体包括:
18、将相似文档所属的预设刊物作为候选刊物,并依据属于同一候选刊物的相似文档的相似度,确定刊物相关度。
19、进一步地,相似属性信息包括:候选刊物下文档的文档数量、所有候选刊物下文档的第一文档总数、候选刊物下的相似文档的文档数量、所有相似文档的第二文档总数、待投文档与相似文档之间的相似度、刊物相关度的最大值和平均值。
20、进一步地,依据刊物相关度和相似属性信息,计算候选刊物的推荐度,具体包括:
21、依据第一文档总数、第二文档总数、刊物相关度的最大值和平均值,计算基础匹配度;
22、依据候选刊物下相似文档与待投文档之间的相似度和基础匹配度计算推荐度。
23、进一步地,依据候选刊物下相似文档与待投文档之间的相似度和基础匹配度计算推荐度,具体包括:
24、若候选刊物下存在相似度大于第二预设相似度的相似文档,依据基础匹配度、刊物相关度、候选刊物下文档的文档数量、候选刊物下相似文档的文档数量,计算第一匹配度作为推荐度;
25、若候选刊物下不存在相似度大于第二预设相似度的相似文档,依据第一匹配度和预设系数计算第二匹配度作为推荐度。
26、进一步地,选刊方法还包括:
27、采用预设提取工具对待投文档的内容信息进行分词处理,确定待投文档的分词词语并删除分词词语中的停用词;
28、确定分词词语的分词权重;
29、依据分词权重拼接分词词语,得到检索词。
30、进一步地,内容信息包括摘要文本和标题文本,确定分词词语的分词权重,具体包括:
31、获取分词词语的词语特征,以及第一分词在摘要文本和标题文本的语句特征;
32、依据词语特征和语句特征,确定分词词语的分词权重。
33、进一步地,内容信息包括关键词,确定分词词语的分词权重,具体包括:
34、将第一预设权重值作为分词权重。
35、进一步地,内容信息包括关键词,方法还包括:
36、依据关键词更新预设提取工具。
37、进一步地,依据分词权重拼接分词词语,具体包括:
38、从分词词语中筛选分词权重大于第二预设权重值的目标词语;
39、将目标词语输入语义模型,得到目标词语的语义信息;
40、将目标词语的语义信息作为聚类元素,并对聚类元素进行聚类,得到至少一个语义聚类集合;
41、依据第一拼接方式组合不同语义聚类集合,并依据第二拼接方式组合同一语义聚类集合中的目标词语。
42、根据本申请的另一方面,提供了一种选刊装置,包括:
43、检索模块,用于依据待投文档的检索词和指定检索内容,按照指定检索方式在目标数据库进行检索,确定待投文档的相似文档;
44、处理模块,用于依据指定检索方式,确定待投文档与相似文档所属候选刊物之间的刊物相关度和候选刊物的相似属性信息;以及,依据刊物相关度和相似属性信息,计算候选刊物的推荐度;
45、推荐模块,用于将推荐度大于预设推荐度的候选刊物作为目标刊物,并顺序输出目标刊物的刊物信息。
46、进一步地,指定检索方式包括模糊检索,检索模块,具体用于以目标数据库中预设刊物作为检索单元,依据检索词和指定检索内容检索不同预设刊物下的候选文档;确定不同预设刊物下的候选文档的文档数量;对预设刊物进行筛选,确定候选文档的文档数量大于预设数量的候选刊物;将候选刊物下的候选文档作为相似文档。
47、进一步地,指定检索方式包括模糊检索,处理模块,具体用于将预设相关度作为刊物相关度。
48、进一步地,指定检索方式包括精确检索,检索模块,具体用于依据检索词和指定检索内容在目标数据库进行检索,确定候选文档以及候选文档与待投文档之间的相似度;依据相似度对候选文档进行筛选,确定预设文档数量的相似文档,其中,相似文档的相似度大于第一预设相似度。
49、进一步地,指定检索方式包括精确检索,处理模块,具体用于将相似文档所属的预设刊物作为候选刊物,并依据属于同一候选刊物的相似文档的相似度,确定刊物相关度。
50、进一步地,相似属性信息包括:候选刊物下文档本文档来自技高网...
【技术保护点】
1.一种选刊方法,其特征在于,所述方法包括:
2.根据权利要求1所述的选刊方法,其特征在于,所述指定检索方式包括模糊检索,
3.根据权利要求1所述的选刊方法,其特征在于,所述指定检索方式包括精确检索,
4.根据权利要求1所述的选刊方法,其特征在于,
5.根据权利要求4所述的选刊方法,其特征在于,所述依据所述候选刊物下所述相似文档与所述待投文档之间的相似度和所述基础匹配度,计算所述推荐度,具体包括:
6.根据权利要求1至5中任一项所述的选刊方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的选刊方法,其特征在于,所述依据所述分词权重拼接所述分词词语,具体包括:
8.一种选刊装置,其特征在于,所述装置包括:
9.一种可读存储介质,其上存储有程序或指令,其特征在于,所述程序或指令被处理器执行时实现如权利要求1至7中任一项所述的选刊方法的步骤。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实
...【技术特征摘要】
1.一种选刊方法,其特征在于,所述方法包括:
2.根据权利要求1所述的选刊方法,其特征在于,所述指定检索方式包括模糊检索,
3.根据权利要求1所述的选刊方法,其特征在于,所述指定检索方式包括精确检索,
4.根据权利要求1所述的选刊方法,其特征在于,
5.根据权利要求4所述的选刊方法,其特征在于,所述依据所述候选刊物下所述相似文档与所述待投文档之间的相似度和所述基础匹配度,计算所述推荐度,具体包括:
6.根据权利要求1至5中任一项所述的选刊方法,其特征在于...
【专利技术属性】
技术研发人员:王海彬,赵洪,毋晓霞,张晓迪,肖洪,
申请(专利权)人:同方知网数字出版技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。