关键字自动超级链接的方法技术

技术编号:13187510 阅读:96 留言:0更新日期:2016-05-11 17:24
一种关键字自动超级链接的方法,用户打开应用程序时,程序根据当前的配置判断是否需要从指定的服务器下载关键字超链数据,如果需要下载,则自动从指定的服务器下载并保存到本地;用户在通过应用程序打开文档时,应用程序解析文档时自动分析关键字,并在关键字超链数据库中搜索匹配关键字,获取对应的超链数据;如果在数据库没有匹配到关键字,则访问指定的服务器,以此来获取指定关键字的超级链接数据,并更新到本地,如果在数据库能够匹配到关键字,根据匹配关键字获取的超级链接数据,在展示文档内容时,在关键字区域展示超级链接。避免了超级链接还无法在远程通过关键词实现自动形成超链的形式而由此极大的局限了它的作用效果的问题。

【技术实现步骤摘要】

本专利技术涉及一种超级链接
,尤其是一种。
技术介绍
超级链接在本质上属于一个网页的一部分,它是一种允许我们同其他网页或站点 之间进行连接的元素。各个网页链接在一起后,才能真正构成一个网站。所谓的超链接是指 从一个网页指向一个目标的连接关系,这个目标可以是另一个网页,也可以是相同网页上 的不同位置,还可以是一个图片,一个电子邮件地址,一个文件,甚至是一个应用程序。而在 一个网页中用来超链接的对象,可以是一段文本或者是一个图片。当浏览者单击已经链接 的文字或图片后,链接目标将显示在浏览器上,并且根据目标的类型来打开或运行。 而目前来看这种超级链接还无法在远程通过关键词实现自动形成超链的形式,由 此极大的局限了它的作用效果。
技术实现思路
本专利技术的目的在于提供一种,用户打开应用程序时, 程序根据当前的配置判断是否需要从指定的服务器下载关键字超链数据,如果需要下载, 则自动从指定的服务器下载并保存到本地;用户在通过应用程序打开文档时,应用程序解 析文档时自动分析关键字,并在关键字超链数据库中搜索匹配关键字,获取对应的超链数 据;如果在数据库没有匹配到关键字,则访问指定的服务器,以此来获取指定关键字的超 级链接数据,并更新到本地,如果在数据库能够匹配到关键字,根据匹配关键字获取的超级 链接数据,在展示文档内容时,在关键字区域展示超级链接。避免了超级链接还无法在远程 通过关键词实现自动形成超链的形式而由此极大的局限了它的作用效果的问题。 为了达到上述目的,本专利技术的技术方案是:一种,用户 打开应用程序时,程序根据当前的配置判断是否需要从指定的服务器下载关键字超链数 据,如果需要下载,则自动从指定的服务器下载并保存到本地;用户在通过应用程序打开文 档时,应用程序解析文档时自动分析关键字,并在关键字超链数据库中搜索匹配关键字,获 取对应的超链数据;如果在数据库没有匹配到关键字,则访问指定的服务器,以此来获取指 定关键字的超级链接数据,并更新到本地,如果在数据库能够匹配到关键字,根据匹配关键 字获取的超级链接数据,在展示文档内容时,在关键字区域展示超级链接。 采用上述方法后,本专利技术就能够自动从指定的服务器下载关键字超链数据并保存 到本地,由此根据分析并获取的超链数据,在展示文档内容时,在关键字区域展示超级链 接。【附图说明】 图1是本专利技术的流程图。 图2是本专利技术的随机内容抽取算法的流程图。 图3是本专利技术的分层内容抽取算法的流程图。 图4是本专利技术的关键词提取的流程图。 图5是本专利技术的关键词自动收集的流程图。【具体实施方式】 以下结合附图给出的实施例对本专利技术作进一步详细的说明。参 见图1-图5所示,,用户打开应用程序时,程序根据当 前的配置判断是否需要从指定的服务器下载关键字超链数据,如果需要下载,则自动从指 定的服务器下载并保存到本地;用户在通过应用程序打开文档时,应用程序解析文档时自 动分析关键字,并在关键字超链数据库中搜索匹配关键字,获取对应的超链数据;如果在数 据库没有匹配到关键字,则访问指定的服务器,以此来获取指定关键字的超级链接数据,并 更新到本地,如果在数据库能够匹配到关键字,根据匹配关键字获取的超级链接数据,在展 示文档内容时,在关键字区域展示超级链接。 其中,应用程序解析文档的方式为: 先进行单个文档样本数据收集,也就是根据用户打开的文档进行分析,一般文本 数据的关键信息都会保存在以下几个地方:文件名、文档标题、书签、文档第一段内容、文档 最后一段内容。鉴于此,本专利技术也将主要从这些部分抽取样本数据。样本数据先保存在本 地,待用户连网之后再把这些数据上传给服务器来完成关键字的提取、分类、权重调整和超 链数据的准备;由于上传地时机不确定,记录样本数据时需要记录文档最近一次打开的时 间以及上传之前打开的次数,这两项信息是之后计算关键字权值时需要的;所述的样本数 据的存储格式如表1所示依次为数据包大小、最后打开时间、打开次数、文档语言、文件名 称长度、文件名称数据、文档标题长度、文档标题数据、首段内容长度、首段内容数据、末段 内容长度、末段内容数据、书签条目数量、第一书签条目长度、第一书签条目内容、第二书签 条目长度、第二书签条目内容…第η书签条目长度、第η书签条目内容、随机内容数量、第一 随机内容长度、第一随机内容数据、第二随机内容长度、第二随机内容数据…第η随机内容 长度、第η随机内容数据的数据段;其中η为正整数; 表1 上述结构内容的含义描述如表2所示: 表 2 而在进行随机内容抽取时,能够采用随机抽取算法或分层抽取法进行抽取; 对于比较小的文档或者没有书签信息和分布信息的文档,采用这个随机抽取算 法,所述的随机抽取算法要随机读取整个文档的内容,该算法具体流程如下,首先确定需要 抽取的样本的数量,根据文档内容的大小,生成一组样本数量的随机数列表且不重复,再依 照该数组中各数值作为文档内偏移,依次读取固定长度的文本内容并保存; 对于比较大的文档,采用此分层抽取法算法。该算法可以根据抽取样本的策略是 全面抽取还是重点抽取来定义第一层样本的权值系数H。 所述的分层抽取算法具体流程如下,首先确定需要抽取的样本的数量N,第一层需 要抽取的样本数量为总数量的N/H。如果该文档有书签信息,则以书签信息作为第一层样本 池,如果没有书签信息,则以分页信息作为第一层样本池。以各书签ID或各分页ID号来构造 列表,再以书签的数量或分页数量为基数构造需要的第一层样本列表。接下来根据抽取的 第一层样本列表,各自单独抽取Η个样本。例如:如果是以书签信息作为样本池的,根据已生 成的第一层样本列表,每个表项都是一个书签ID,在单独抽取二层样本的时候,根据书签ID 来定位文档的位置,再用随机抽取算法抽取Η个文本样本数据开保存; 进行样本数据上传及关键字信息提取的方式为:样本数据会根据用户打开不同的 文档进行更新,存储在本地设备中;在用户设备联网的时候,根据策略设置上传本地存储的 样本数据到服务器上,以便进行关键字提取及后续工作; 用户使用场景多种多样,总体可以分为:没有联网、移动网络、固定网格(LAN、 WIFI),根据不同的使用联网环境,采取不同的样本数据上传策略,具体如下: (1)没有联网的环境:不进行上传操作。 (1)移动网络环境:不进行上传操作。 (2)固定网络环境:闲时上传,限制上传速度。 (4)用户可以自己定义策略,比如:移动网络时允许上传、固定网络时限时间内允 许上传等等。在进行客户端ID计算和校验时,往往采用的是以下所描述的几种客户端ID的计算 和校验方法,但客户端ID不仅限下这几种方法,同时也可以是几种算法组合使用: 1、硬件组合ID的方法收集的样本信息上传的时候需要标明该样本信息所属的用户,而且软件下载用户 关键字信息及超链数据时也需要标明用户ID,即数据是和用户关联的。这个用户ID需要能 唯一标明用户。计算方法:按照固定的顺序获取设备部分硬件的ID信息,无法获取的ID用FF填充, 并按照这个顺序组合成一串字符。校验方法:由于组成ID的各部分信息,每个设备有哪些硬件都不一样,而且不保证 各设备的硬盘不会更换。如此校验的方法就不能用简单的完全匹配来校验,具体校验时,每 个硬件信息分析出来单本文档来自技高网...

【技术保护点】
一种关键字自动超级链接的方法,其特征在于:用户打开应用程序时,程序根据当前的配置判断是否需要从指定的服务器下载关键字超链数据,如果需要下载,则自动从指定的服务器下载并保存到本地;用户在通过应用程序打开文档时,应用程序解析文档时自动分析关键字,并在关键字超链数据库中搜索匹配关键字,获取对应的超链数据;如果在数据库没有匹配到关键字,则访问指定的服务器,以此来获取指定关键字的超级链接数据,并更新到本地,如果在数据库能够匹配到关键字,根据匹配关键字获取的超级链接数据,在展示文档内容时,在关键字区域展示超级链接。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴阳杜宇
申请(专利权)人:南京鼎岩信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1