This application involves a method, device, computer equipment and storage medium for book catalogue generation. By acquiring book content and corresponding attribute labels, the book content is segmented according to the word segmentation algorithm, and the corresponding word segmentation results are obtained. According to the attribute labels, the candidate word segmentation results are filtered to obtain the customized keywords. According to the keywords, the candidate word segmentation results are obtained. The result of word segmentation is filtered to get the result of target word segmentation, and the book catalogue is generated according to the result of target word segmentation. Through word segmentation algorithm, the data obtained by word segmentation is filtered according to the attribute label and the custom keyword of the book, and a custom book catalogue is obtained, which is convenient to retrieve the content of interest, and the corresponding book catalogue is generated according to the content of interest of the user.
【技术实现步骤摘要】
图书目录生成方法、装置、计算机设备和存储介质
本申请涉及计算机
,尤其涉及一种图书目录生成方法、装置、计算机设备和存储介质。
技术介绍
图书数据大部分为文本形式的非结构化数据,用户通常是通过查阅事先编辑好的目录进行阅读,而图书的目录都是固定的,用户想通过目录检索个人感兴趣的部分进行阅读时,无法得到准确的感兴趣的内容,即图书目录无法根据个人喜好进行调整。
技术实现思路
为了解决上述技术问题,本申请提供了一种图书目录生成方法、装置、计算机设备和存储介质。一种图书目录生成方法,包括:获取图书内容和对应的属性标签;根据分词算法对图书内容进行分词,得到对应的分词结果;根据属性标签对分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果;根据目标分词结果生成图书目录。一种图书目录生成装置,包括:数据获取模块,用于获取图书内容和对应的属性标签;分词模块,用于根据分词算法对图书内容进行分词,得到对应的分词结果;属性筛选模块,用于根据属性标签对分词结果进行筛选得到候选分词结果;自定义分词模块,用于获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到目标分词结果;目录生成模块,用于根据目标分词结果生成图书目录。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取图书内容和对应的属性标签;根据分词算法对图书内容进行分词,得到对应的分词结果;根据属性标签对分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据关键词对候选分词结果进行筛选,得到 ...
【技术保护点】
1.一种图书目录生成方法,所述方法包括:获取图书内容和对应的属性标签;根据分词算法对所述图书内容进行分词,得到对应的分词结果;根据所述属性标签对所述分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据所述关键词对所述候选分词结果进行筛选,得到目标分词结果;根据所述目标分词结果生成图书目录。
【技术特征摘要】
1.一种图书目录生成方法,所述方法包括:获取图书内容和对应的属性标签;根据分词算法对所述图书内容进行分词,得到对应的分词结果;根据所述属性标签对所述分词结果进行筛选得到候选分词结果;获取自定义的关键词,根据所述关键词对所述候选分词结果进行筛选,得到目标分词结果;根据所述目标分词结果生成图书目录。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取情感标签,根据所述情感标签对所述候选分词结果进行筛选,更新所述候选分词结果。3.根据权利要求1所述的方法,其特征在于,所述根据分词算法对所述图书内容进行分词,得到对应的分词结果,包括:获取标准语料和标准分词规则;根据所述标准语料和所述标注分词规则对所述图书内容进行分词,得到分词后的语料,将分词后的语料作为所述分词结果。4.根据权利要求1所述的方法,其特征在于,所述根据所述目标分词结果生成图书目录,包括:获取所述目标分词结果对应的位置信息和对应的文本信息;将所述位置信息和所述文本信息与所述图书目录建立关联关系。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述方法还包括:展示所述图书目录;当接收到对所述图书目录的操作时,根据所述操作生成对应的检索指令;通过所述检索指令检索所述图书目录对应的位置信息和文本信息;接收对检索到的位置信息中的任意位置信息的展示请求,展...
【专利技术属性】
技术研发人员:张光强,
申请(专利权)人:紫优科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。