一种更新摘要结构的方法及装置制造方法及图纸

技术编号:4382387 阅读:227 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种更新摘要结构的方法,用于提高摘要结构的准确性,以提高用户体验。所述方法包括:通过在摘要结构中为用户提供的新增结构,获得用户在发布信息或搜索信息过程中输入的新增结构标签;统计所述新增结构标签的出现频率,并判断所述新增结构标签的出现频率是否满足预设的条件,当满足时,在摘要结构中增加该新增结构标签对应的结构。本发明专利技术还公开了一种用于实现所述方法的装置和系统。

【技术实现步骤摘要】

本专利技术涉及计算机及通信领域,特别是涉及更新摘要结构的方法及装置
技术介绍
计算机和互联网技术已被广泛应用,资源共享是其主要特点。如何从巨大 的信息资源中搜索到自身需要的信息,是用户普遍关心的问题。根据用户输入的关键字来搜索信息,曾经被广泛且长时间的应用。然而对 于日益膨胀的网页海量信息来说,通过关键字进行的全文搜索,在搜索速度和 搜索结果方面都已不能满足用户的需要。因此,业内技术人员提出了结构化搜 索的解决方案。目前的结构化搜索引擎的数据库是预先设计好的,即搜索结构是固定不变 的。无法适应信息的多样化发展和各类用户的需要。首先,用户按常规的分类体系和方法,无法查找到所需要的网络信息;其次,用户在^f吏用各类不同网站 时,必须熟悉各种不同的分类体系才能较快检索到所需信息。综上,现有技术中的搜索方式无法提供较准确和通用的搜索,搜索结果不 理想。
技术实现思路
本专利技术实施例提供一种更新摘要结构的方法及装置,用于提高摘要结构的 准确性和通用性,以提高用户的结构化摘要^r索体-验。 一种更新摘要结构的方法,包括以下步骤通过在摘要结构中为用户提供的新增结构,获得用户在发布信息或搜索信 息过程中输入的新增结构标签;统计所述新增结构标签的出现频率,并判断所述新增结构标签的出现频率是否满足预设的条件,当满足时,在摘要结构中增加该新增结构标签对应的结 构。一种用于更新摘要结构的装置,包括用户接口模块,用于通过在摘要结构中为用户提供的新增结构,获得用户 在发布信息或搜索信息过程中输入的新增结构标签;统计模块,用于统计所述新增结构标签的出现频率;控制模块,用于判断所述新增结构标签的出现频率是否满足预设的条件, 当满足时,在摘要结构中增加该新增结构标签对应的结构。一种网络系统,包括用户设备和服务器;其中用户设备,用于通过服务器在摘要结构中为用户提供的新增结构,获得用 户在发布信息或搜索信息过程中输入的新增结构标签并传输给服务器;服务器,用于统计所述新增结构标签的出现频率,并判断所述新增结构标 签的出现频率是否满足预设的条件,当满足时,在摘要结构中增加该新增结构 标签对应的结构。本专利技术实施构标签,并在该新增结构标签满足预设条件的情况下,跟该新增结构标签在摘 要结构中增加相应的结构,使更新后的摘要结构更准确,更加接近用户的需求, 提高用户体验。附图说明图1为本专利技术实施例中更新摘要结构的主要方法流程图; 图2为本专利技术实施例中摘要结构的示意图; 图3为本发W 构的方法流程5r'印的方法流程图5为本专利技术实施例中利用专用摘要结构的新增结构来更新通用摘要结构的方法流程图6为本专利技术实施例中装置的结构图; 图7为本专利技术实施例中网络系统的结构图。具体实施例方式本专利技术实施例在摘要结构中为用户提供了新增结构,并根据用户输入的新 增结构标签,来调整摘要结构,提高了摘要结构的准确性,使其更符合用户的 需求,提高用户体验。本专利技术实施例中包括指向存储文件的路径(包括链接)的结构均属于摘要 结构。摘要结构中的结构从划分角度讲包括分类项和结构项,从内容上讲包括 结构标签和结构内容。 一个分类项下可以有多个结构项。预设分类项包括新闻、 公告、知识、产品、服务、黄页、人际交往、论坛、点播和下载等。新闻分类 项下的结构项如主体、行为、时间等。参见图1,本实施例中更新摘要结构的主要方法流程如下步骤101:通过在摘要结构中为用户提供的新增结构,获得用户在发布信 息或搜索信息过程中输入的新增结构标签。步骤102:统计所述新增结构标签的出现频率。步骤103:判断所述新增结构标签的出现频率是否满足预设的条件,当满 足时,在摘要结构中增加该新增结构标签对应的结构。能够选出高频的新增结 构标签的条件均适用于本实施例。一个摘要结构的示意图如图2所示,用户可在"新增分类项"中设置新增 分类项,若该新增分类项满足预设的条件,则可在图2所示的"新增分类项" 与"博客"预设分类项之间增加一分类项如"黄页"。以及可以在图2所示的 括号"(),,内输入分类项或结构项的内容,在""中输入新增结构项的标签。分类项下输入的结构内容均采用无结构化存储。其中,所述的结构化存储是指 每一结构下的内容分别存储于数据库表单内的相应结构下;所述的无结构化存储是指结构标签和结构下输入的结构内容存储于表单内的同 一结构中。在步骤103中有多种具体实现方式,如在摘要结构中增加用户输入的新增 结构,并用无结构化方式存储该新增结构的内容,或者用输入的新增结构替换 已有的预设结构,并用结构化方式来存储该新增结构的内容,还可以有其它具 体实现方式,下面通过两个实施例来详细介绍更新摘要结构的实现过程。参见图3,本实施例中用无结构化方式存储新增结构的内容时,更新摘要 结构的详细方法流^E如下步骤301:通过在摘要结构中为用户提供的新增结构,获得用户在发布信 息或搜索信息过程中输入的新增结构标签。步骤302:统计并保存新增结构标签的出现频率。本实施例中新增结构标 签的出现频率可以是新增结构标签的出现次数,或者是该新增结构标签的出现 次数与所有结构标签的出现次数的比值,或者是该新增结构标签当天的出现次 数与所有结构标签当天的出现次数的比值,也可以是其它能反映频率性质的参 数。步骤303:判断所述新增结构标签的出现频率是否满足预设的频率门限, 若满足,则继续步骤304,否则结束流程,或者继续步骤305。步骤304:在摘要结构的非预设结构中增加该新增结构标签对应的结构。 通过获得用户的发布命令或搜索命令来确定用户是在发布信息还是在搜 索信息。若用户是在发布信息,则继续步骤305。步骤305:通过才是供的新增结构获得用户输入的新增结构内容。 步骤306:采用无结构化方式在数据库中存储该新增结构标签和新增结构 内容。在步骤302中,统计新增结构标签的出现频率的过程包括在包括同义词 和/或近义词的列表中查找新增结构标签的同义词和/或近义词,在摘要结构中 确定新增结构标签的同义词和/或近义词是否为在摘要结构中的结构标签,将新 增结构标签及其作为结构标签的同义词和/或近义词的出现频率之和,作为该新增结构标签的出现频率。以及,在步骤304之前,判断是否已有新增结构标签的同义词和/或近义词 为摘要结构中的结构标签,若有,则不为该新增结构标签增加对应的结构,可 据此更新新增结构标签的同义词和/或近义词所对应的出现频率,然后可继续步 骤305,将获得的新增结构内容存储到新增结构标签的同义词和/或近义词所对 应的结构中;若没有,则可继续步骤304。该判断过程与步骤303之间无严格 的执行先后。在步骤303中,经过对摘要结构的长期使用,可能有多个新增结构标签的 出现频率满足预设的频率门限,则可能在摘要结构中增加过多的新增结构,使 得摘要结构中的冗余信息较多。因此在满足预设的频率门限的情况下,或者在的出现频率,若是,则在摘要结构的非预设结构中,即在步骤304中,用所述 新增结构标签替换已有的新增结构标签,用所述新增结构标签对应的结构替换 已有的新增结构标签对应的结构,或者用所述新增结构标签替换已有的新增结 构标签中出现频率最小的已有的新增结构标签。这样可以保证摘要结构的非预 设结构中结构的数量一定,不会造成过多的冗余。由于本实施例是采用无结构化方本文档来自技高网...

【技术保护点】
一种更新摘要结构的方法,其特征在于,包括以下步骤: 通过在摘要结构中为用户提供的新增结构,获得用户在发布信息或搜索信息过程中输入的新增结构标签; 统计所述新增结构标签的出现频率,并判断所述新增结构标签的出现频率是否满足预设的条件 ,当满足时,在摘要结构中增加该新增结构标签对应的结构。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘莎
申请(专利权)人:北京思在信息技术有限责任公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1