图书目录生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20797254 阅读:27 留言:0更新日期:2019-04-06 10:51
本申请涉及一种图书目录生成方法、装置、计算机设备和存储介质,通过获取图书内容和对应的属性标签,根据分词算法对图书内容进行分词,得到对应的分词结果,根据属性标签对分词结果进行筛选得到候选分词结果,获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果,根据目标分词结果生成图书目录。通过分词算法对图书进行分词,根据图书的属性标签和自定义关键词对分词得到的数据进行筛选,得到自定义的图书目录,方便检索感兴趣的内容,且根据用户感兴趣的内容生成对应的图书目录。

The Method, Device, Computer Equipment and Storage Medium of Book Catalogue Generation

This application involves a method, device, computer equipment and storage medium for book catalogue generation. By acquiring book content and corresponding attribute labels, the book content is segmented according to the word segmentation algorithm, and the corresponding word segmentation results are obtained. According to the attribute labels, the candidate word segmentation results are filtered to obtain the customized keywords. According to the keywords, the candidate word segmentation results are obtained. The result of word segmentation is filtered to get the result of target word segmentation, and the book catalogue is generated according to the result of target word segmentation. Through word segmentation algorithm, the data obtained by word segmentation is filtered according to the attribute label and the custom keyword of the book, and a custom book catalogue is obtained, which is convenient to retrieve the content of interest, and the corresponding book catalogue is generated according to the content of interest of the user.

【技术实现步骤摘要】
图书目录生成方法、装置、计算机设备和存储介质
本申请涉及计算机
,尤其涉及一种图书目录生成方法、装置、计算机设备和存储介质。
技术介绍
图书数据大部分为文本形式的非结构化数据,用户通常是通过查阅事先编辑好的目录进行阅读,而图书的目录都是固定的,用户想通过目录检索个人感兴趣的部分进行阅读时,无法得到准确的感兴趣的内容,即图书目录无法根据个人喜好进行调整。
技术实现思路
为了解决上述技术问题,本申请提供了一种图书目录生成方法、装置、计算机设备和存储介质。一种图书目录生成方法,包括:获取图书内容和对应的属性标签;根据分词算法对图书内容进行分词,得到对应的分词结果;根据属性标签对分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果;根据目标分词结果生成图书目录。一种图书目录生成装置,包括:数据获取模块,用于获取图书内容和对应的属性标签;分词模块,用于根据分词算法对图书内容进行分词,得到对应的分词结果;属性筛选模块,用于根据属性标签对分词结果进行筛选得到候选分词结果;自定义分词模块,用于获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果;目录生成模块,用于根据目标分词结果生成图书目录。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取图书内容和对应的属性标签;根据分词算法对图书内容进行分词,得到对应的分词结果;根据属性标签对分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果;根据目标分词结果生成图书目录。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取图书内容和对应的属性标签;根据分词算法对图书内容进行分词,得到对应的分词结果;根据属性标签对分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果;根据目标分词结果生成图书目录。上述图书目录生成方法、装置、计算机设备和存储介质,通过获取图书内容和对应的属性标签,根据分词算法对图书内容进行分词,得到对应的分词结果,根据属性标签对分词结果进行筛选得到候选分词结果,获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果,根据目标分词结果生成图书目录。通过分词算法对图书进行分词,根据图书的属性标签和自定义关键词对分词得到的数据进行筛选,得到自定义的图书目录,方便检索感兴趣的内容,且根据用户感兴趣的内容生成对应的图书目录。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为一个实施例中目录生成方法的应用场景图;图2为一个实施例中图书目录生成方法的流程示意图;图3为一个实施例中图书内容的分词步骤流程示意图;图4为另一个实施例中图书目录生成方法的流程示意图;图5为一个实施例中图书目录生成装置的结构框图;图6为一个实施例中分词模块的结构框图;图7为一个实施例中目录生成模块的结构框图;图8为另一个实施例中图书目录生成装置的结构框图;图9为一个实施例中计算机设备的内部结构框图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为一个实施例中图书目录生成方法的应用环境图。参照图1,该图书目录生成方法应用于图书目录生成系统。该图书目录生成系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端或服务器获取图书内容和对应的属性标签,根据分词算法对图书内容进行分词,得到对应的分词结果,根据属性标签对分词结果进行筛选得到候选分词结果,获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果,根据目标分词结果生成图书目录。其中,终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。如图2所示,在一个实施例中,提供了一种图书目录生成方法。本实施例主要以该方法应用于上述图1中的终端110(或服务器120)来举例说明。参照图2,该图书目录生成方法具体包括如下步骤:步骤S201,获取图书内容和对应的属性标签。具体地,图书内容可以是整本书的内容,也可以是一本图书的部分内容,或者是多本书的内容。属性标签是用于描述图书类型的标签,属性标签包括但不限于历史、生活、文学、医学和科技等。同一本书可以对应多个属性标签。获取图书内容和图书内容对应的属性标签。在一个实施例中,在获取图书内容和对应的属性标签之前,还包括:对图书内容进行标注得到对应的属性标签。对图书内容进行标注,可以采用人工标注,或根据自动标注模型对图书内容进行标注。步骤S202,根据分词算法对图书内容进行分词,得到对应的分词结果。具体地,分词算法是用于对图书内容进行拆分的算法,将图书内容拆分成多个词汇,用拆分的词汇来描述图书内容。常见的分词算法包括最大匹配法、最优匹配法、机械匹配法、逆向匹配法和双向匹配法等。采用不同的算法对图书内容进行分词,得到的分词结果不相同。在选取分词算法时可以根据需求自定义选择,可以单独使用其中一个分词算法,也可以结合使用多个算法对图书内容进行分词。在一个实施例中,根据属性标签选择分词算法。对于特定领域时可以根据图书内容的标签选取对应的分词算法,如针对医学领域和科技领域,医学领域和科技领域有许多的医学名词和科技名词与常见的名词表述方式不一致,故在针对特定属性标签时,可以选择与特定属性标签对应的分词算法。步骤S203,根据属性标签对分词结果进行筛选得到候选分词结果。具体地,根据属性标签对分词结果进行筛选,是指根据图书内容对应的属性标签对分词结果进行过滤,从分词结果中筛选出与属性标签对应的分词结果,过滤部分与属性标签完全无关的词汇,提高分词的准确度。如属性标签为历史,则可以从分词结果中筛选出事件发生顺序、事件的前因后果、事件发生的地点等相关的分词结果作为候选分词结果。如属性标签为医学,可以从分词结果中筛选出各种疾病的起因、疾病的症状、疾病的治疗方法等作为候选分词结果。步骤S204,获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果。具体地,自定义的关键词是用户根据个人兴趣设置的关键词,根据关键词从候选分词结果中,筛选出用户感兴趣的分词结果作为目标分词结果。如图书内容为记录了某段历史时期的人物事件,用户对其中一个历史人物感兴趣,则将该历史人物的名称设置为关键词,通过关键词将图书中关于该历史人物的分本文档来自技高网...

【技术保护点】
1.一种图书目录生成方法,所述方法包括:获取图书内容和对应的属性标签;根据分词算法对所述图书内容进行分词,得到对应的分词结果;根据所述属性标签对所述分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据所述关键词对所述候选分词结果进行筛选,得到目标分词结果;根据所述目标分词结果生成图书目录。

【技术特征摘要】
1.一种图书目录生成方法,所述方法包括:获取图书内容和对应的属性标签;根据分词算法对所述图书内容进行分词,得到对应的分词结果;根据所述属性标签对所述分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据所述关键词对所述候选分词结果进行筛选,得到目标分词结果;根据所述目标分词结果生成图书目录。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取情感标签,根据所述情感标签对所述候选分词结果进行筛选,更新所述候选分词结果。3.根据权利要求1所述的方法,其特征在于,所述根据分词算法对所述图书内容进行分词,得到对应的分词结果,包括:获取标准语料和标准分词规则;根据所述标准语料和所述标注分词规则对所述图书内容进行分词,得到分词后的语料,将分词后的语料作为所述分词结果。4.根据权利要求1所述的方法,其特征在于,所述根据所述目标分词结果生成图书目录,包括:获取所述目标分词结果对应的位置信息和对应的文本信息;将所述位置信息和所述文本信息与所述图书目录建立关联关系。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述方法还包括:展示所述图书目录;当接收到对所述图书目录的操作时,根据所述操作生成对应的检索指令;通过所述检索指令检索所述图书目录对应的位置信息和文本信息;接收对检索到的位置信息中的任意位置信息的展示请求,展...

【专利技术属性】
技术研发人员:张光强
申请(专利权)人:紫优科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1