本发明专利技术公开了一种数据处理的方法,包括:根据电子书籍的标识信息,获取同一部电子书籍在不同发布源的目录,根据所述同一部电子书籍在不同发布源的目录,确定待聚合电子书籍的目录从所述不同发布源发布的与所述待聚合目录对应的内容中,选择测量分值最高的内容关联到所述待聚合目录下,聚合成所述待聚合电子书籍。本发明专利技术实施例提供的方案可以将不同发布源发布的同一部电子书籍聚合成最优的版本,用户在阅读时不需要来回切换就可以阅读到聚合后的最优版本的电子书籍,提高了用户与终端沟通的效率。
【技术实现步骤摘要】
本专利技术涉及数据处理
,具体涉及一种数据处理的方法及终端。
技术介绍
随着互联网的普及,网络小说等电子书籍越来越多,而且存储电子书籍的网站也 很多,不同网站上存储的电子书籍的质量也差异很大。例如:网站1上存储了小说藏地密码 的前3个章节,网站2上存储了小说藏地密码的第4和第7个章节,网站3上存储了小说藏 地密码的第5和第8个章节,网站4上存储了小说藏地密码的第6、第9和第10个章节。该 样,用户在阅读藏地密码时,就需要在不同网站上进行手动切换,才能阅读到藏地密码的完 整版本。 本专利技术的专利技术人发现,现有技术中由于电子书籍在网络上发布不受约束,导致电 子书籍的存储非常乱,一个网站下经常阅读不到完整的一本电子书籍,在阅读时需要用户 频繁的进行手动切换。
技术实现思路
本专利技术实施例提供一种数据处理的方法,可W将不同发布源发布的同一部电子书 籍聚合成最优的版本,用户在阅读时不需要来回切换就可W阅读到聚合后的最优版本的电 子书籍,提高了用户与终端沟通的效率。本专利技术实施例还提供了相应的终端。 本专利技术第一方面提供一种数据处理的方法,包括: 根据电子书籍的标识信息,获取同一部电子书籍在不同发布源的目录; 根据所述同一部电子书籍在不同发布源的目录,确定待聚合电子书籍的目录; 从所述不同发布源发布的与所述待聚合目录对应的内容中,选择测量分值最高的 内容关联到所述待聚合目录下,聚合成所述待聚合电子书籍。 本专利技术第二方面提供一种终端,包括: 获取单元,用于根据电子书籍的标识信息,获取同一部电子书籍在不同发布源的 目录; 确定单元,用于根据所述获取单元获取的所述同一部电子书籍在不同发布源的目 录,确定待聚合电子书籍的目录; 聚合单元,用于从所述不同发布源发布的与所述确定单元确定的所述待聚合目录 对应的内容中,选择测量分值最高的内容关联到所述待聚合目录下,聚合成所述待聚合电 子书籍。 本专利技术实施例采用根据电子书籍的标识信息,获取同一部电子书籍在不同发布源 的目录,根据所述同一部电子书籍在不同发布源的目录,确定待聚合电子书籍的目录,从所 述不同发布源发布的与所述待聚合目录对应的内容中,选择测量分值最高的内容关联到所 述待聚合目录下,聚合成所述待聚合电子书籍。与现有技术中不同发布源发布的同一部电 子书籍不完整,需要用户来回手动切换相比,本专利技术实施例提供的数据处理的方法,可W将 不同发布源发布的同一部电子书籍聚合成最优的版本,用户在阅读时不需要来回切换就可W阅读到聚合后的最优版本的电子书籍,提高了用户与终端沟通的效率。【附图说明】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于 本领域技术人员来讲,在不付出创造性劳动的前提下,还可W根据该些附图获得其他的附 图。 图1是本专利技术实施例中数据处理的方法的一实施例示意图; 图2是本专利技术实施例中数据处理的方法的另一实施例示意图; 图3是本专利技术实施例中终端的一实施例示意图; 图4是本专利技术实施例中终端的另一实施例示意图; 图5是本专利技术实施例中终端的另一实施例示意图; 图6是本专利技术实施例中终端的另一实施例示意图。【具体实施方式】 本专利技术实施例提供一种数据处理的方法,可W将不同发布源发布的同一部电子书 籍聚合成最优的版本,用户在阅读时不需要来回切换就可W阅读到聚合后的最优版本的电 子书籍,提高了用户与终端沟通的效率。本专利技术实施例还提供了相应的终端。W下分别进 行详细说明。 下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于 本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施 例,都属于本专利技术保护的范围。 参阅图1,本专利技术实施例提供的数据处理的方法的一实施例包括: 101、根据电子书籍的标识信息,获取同一部电子书籍在不同发布源的目录。 电子书籍的标识信息可W是电子书籍的名称,或者电子书籍的名称与作者的组 厶 口 〇 本专利技术实施例中电子书籍是指在网络上可明词读下载的网络书籍,例如;网络小 说。 本专利技术实施例中的发布源是指发布电子书籍的网站,例如:红袖添香、haol23小 说、潇湘书院、新浪读书网、逐浪小说网等。 102、根据所述同一部电子书籍在不同发布源的目录,确定待聚合电子书籍的目 5^ 〇 本专利技术实施例中,可W根据多个发布源发布的电子书籍的目录,确定出一份完整 的书籍目录,例如:网站1发布了小说藏地密码的前5个章节,网站2上发布了小说藏地密 码的第1至7个章节,网站3上发布了小说藏地密码的1至9个章节,网站4上发布了小说 藏地密码的第1-10个章节。该样,就可W确定待聚合电子书籍的目录,按照章节1-10排列。 103、从所述不同发布源发布的与所述待聚合目录对应的内容中,选择测量分值最 高的内容关联到所述待聚合目录下,聚合成所述待聚合电子书籍。 因不同网站上发布的章节有重叠,而且发布内容的质量不同,例如;有的网站发布 的内容较完整,语句连贯性较好,有的网站发布的内容乱码率较高,所W可W预先测量每个 章节对应的内容,然后打出测量分值,根据分值进行聚合。 待聚合电子书籍优先聚合测量分值最高的内容。下面还是W小说藏地密码为例, 说明本专利技术实施例中的聚合过程。 针对每个章节不同网站的打分情况参阅表1进行理解: 表1 ;不同发布源发布的章节内容得分表 ~关于每个章节测量分值的计算过程有一套预存的计算方案,例如;W内容的完整 度、语句的连贯度、误码出现的频率等作为依据来打分。 在聚合藏地密码时,通过分值比较,确定章节1测量分值最高的内容来源于网站 4,则选择网站4的章节1的内容加入到待聚合藏地密码,章节2测量分值最高的内容来源 于网站1,则选择网站1的章节内容2加入到待聚合藏地密码,其余的章节3到章节10测量 分值最高的内容都来源于网站4,则剩余的8个章节的内容都网站4的内容加入到待聚合藏 地密码。[003引本专利技术实施例采用根据电子书籍的标识信息,获取同一部电子书籍在不同发布源 的目录,根据所述同一部电子书籍在不同发布源的目录,确定待聚合电子书籍的目录,从所 述不同发布源发布的与所述待聚合目录对应的内容中,选择测量分值最高的内容关联到所 述待聚合目录下,聚合成所述待聚合电子书籍。与现有技术中不同发布源发布的同一部电 子书籍不完整,需要用户来回手动切换相比,本专利技术实施例提供的数据处理的方法,可W将 不同发布源发布的同一部电子书籍聚合成最优的版本,用户在阅读时不需要来回切换就可 W阅读到聚合后的最优版本的电子书籍,提高了用户与终端沟通的效率。 可选地,在上述图1对应的实施例的基础上,本专利技术实施例提供的数据处理的方 法的另一实施例中,所述从所述不同发布源发布的与所述待聚合目录对应的内容中,选择 测量分值最高的内容关联到所述待聚合目录下,聚合成所述待聚合电子书籍,可W包括: 按照所述待聚合电子书籍的目录下最低层级的子目录,获取所述最低层级的子目 录在所述不同发布源对应的内容; 根据所述最低层级的子目录在所述不同发布源对应的内容的测量分值,为所述最 低层级的子目本文档来自技高网...
【技术保护点】
一种数据处理的方法,其特征在于,包括:根据电子书籍的标识信息,获取同一部电子书籍在不同发布源的目录;根据所述同一部电子书籍在不同发布源的目录,确定待聚合电子书籍的目录;从所述不同发布源发布的与所述待聚合目录对应的内容中,选择测量分值最高的内容关联到所述待聚合目录下,聚合成所述待聚合电子书籍。
【技术特征摘要】
【专利技术属性】
技术研发人员:龙海建,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。