一种网络搜索方法及网络搜索系统技术方案

技术编号:11835115 阅读:97 留言:0更新日期:2015-08-05 23:17
本发明专利技术公开了一种网络搜索方法及网络搜索系统,其中所述方法,包括:提取社交网站的网页结构及信息类别构成数据库;根据提交的关键词搜索与所述关键词相关的网页数据;根据所述数据库对搜索到的与所述关键词相关的所述网页数据进行分析,获取所述网页数据的描述信息,所述描述信息与所述社交网站的信息类别相适应;将所述描述信息随相应的网页数据作为搜索结果共同展现。本发明专利技术对于网站进行格式化分析,并完成专业维度的细化信息抽取,最终获取论坛和博客等社交网站类型的描述信息,并将具有论坛、博客特色的描述信息作为检索结果显示。

【技术实现步骤摘要】
一种网络搜索方法及网络搜索系统
本专利技术属于计算机领域,具体地说,涉及一种网络搜索方法及网络搜索系统。
技术介绍
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页,为了用户便于判断,除了网页标题和URL外还会提供一段来自网页的摘要以及其他信息。但是传统的搜索引擎对搜索结果的展示通常是不进行详细专业维度的格式化分析的,只能够获取如标题、摘要、链接、发表时间等常规信息,因此传统的搜索引擎的所有结果一般只显示网页标题、摘要、网页链接、发表时间。但是对于论坛和博客等社交网站类型的网页,除了网页标题、摘要、网页链接、发表时间等常规信息外,还有如浏览数、回复数等具有社交网站特色的属性,对于论坛和博客的用户对于这类属性往往更加感兴趣,这类属性可以帮助用户判断网页的热度等等。然而传统的搜索引擎因为不具备专业维度的格式化分析能力,因此并不能够向用户展示出这部分信息。因此,如果获得一种能够特别适适于论坛和博客等社交网站类型的网页的网络搜索和展示方式,即成为亟待解决的技术问题。
技术实现思路
有鉴于此,本专利技术所要解决的技术问题是提供了一种网络搜索方法及网络搜索系统。为了解决上述技术问题,本专利技术公开了一种网络搜索系统,包括:数据库管理模块、数据库、搜索模块、分析模块和展现模块,其中,所述数据库管理模块,适于提取与社交网站相关的网页结构及信息类别构成数据库;所述数据库,适于保存与社交网站相关的网页结构及信息类别;所述搜索模块,适于根据提交的关键词搜索与所述关键词相关的网页数据;所述分析模块,适于根据所述数据库对搜索到的与所述关键词相关的所述网页数据进行分析,获取所述网页数据的描述信息,所述描述信息与所述社交网站的信息类别相适应;所述展现模块,适于将所述描述信息随相应的网页数据作为搜索结果共同展现。进一步地,还包括:点选检测模块;所述点选检测模块,适于检测对展现的所述描述信息的触发事件,所述描述信息至少包括:所述网页数据的来源名称和/或所述网页数据的作者名称;所述搜索模块,还适于根据所述事件触发以所述描述信息作为关键词的搜索,其搜索与所述描述信息相关的网页数据。进一步地,所述分析模块,适于根据所述数据库中的网页结构将所述网页数据分解为若干布局板块或属性区域;再根据所述数据库中的各个信息类别在所述网页数据分解后得到的相应布局板块或属性区域中获取描述信息。进一步地,还包括:更新检测模块;所述更新检测模块,适于周期性或实时地检测展现的所述描述信息的变化并更新;所述展现模块,还适于接收所述更新检测模块的通知刷新页面将更新的描述信息随相应的网页数据共同展现。进一步地,还包括:触发入口生成模块、触发检测模块及预览模块;所述触发入口生成模块,适于生成所述网页数据的预览操作的触发入口;所述展现模块,还适于将所述触发入口与相应的网页数据及描述信息共同展现;所述触发检测模块,适于检测到光标在所述触发入口停留超过一预设时长时通知所述预览模块;所述预览模块,适于当收到所述触发检测模块的通知时,截取预设长度的所述网页数据进行加载并进行显示。进一步地,所述显示包括:缩略图形式显示或去除所有网页渲染效果后显示。进一步地,所述分析模块获取的所述描述信息,至少包括以下一种或多种的组合:所述网页数据的来源名称、所述网页数据的作者名称、所述网页数据的浏览次数、所述网页数据的回复次数。进一步地,所述数据库管理模块,提取的所述网页结构及信息类别,包括:各社交网站的个性网页结构及个性信息类别,和/或各社交网站的通用网页结构及通用信息类别。为了解决上述技术问题,本专利技术还公开了一种网络搜索方法,包括:提取社交网站的网页结构及信息类别构成数据库;根据提交的关键词搜索与所述关键词相关的网页数据;根据所述数据库对搜索到的与所述关键词相关的所述网页数据进行分析,获取所述网页数据的描述信息,所述描述信息与所述社交网站的信息类别相适应;将所述描述信息随相应的网页数据作为搜索结果共同展现。进一步地,将所述描述信息随所述网页数据共同展现之后,还包括:检测对展现的所述描述信息的触发事件,所述描述信息至少包括:所述网页数据的来源名称和/或所述网页数据的作者名称;根据所述事件触发以所述描述信息作为关键词的搜索,其搜索与所述描述信息相关的网页数据;根据所述数据库对搜索到的所述网页数据进行分析,获取所述网页数据的描述信息;将所述描述信息随相应的网页数据作为搜索结果共同展现。进一步地,根据所述数据库对所述网页数据进行分析,获取所述网页数据的描述信息,包括:根据所述数据库中的网页结构将所述网页数据分解为若干布局板块或属性区域,再根据所述数据库中的各个信息类别在所述网页数据分解后得到的相应布局板块或属性区域中获取描述信息。进一步地,将所述描述信息随所述网页数据共同展现之后,还包括:周期性或实时地检测展现的所述描述信息的变化并更新;刷新页面将更新的描述信息随相应的网页数据共同展现。进一步地,将所述描述信息随相应的网页数据共同展现之后,还包括:将所述网页数据的预览操作的触发入口与相应的网页数据及描述信息共同展现;检测到光标在所述触发入口停留超过一预设时长;截取预设长度的所述网页数据进行加载并进行显示。进一步地,所述显示包括:缩略图形式显示或去除所有网页渲染效果后显示。进一步地,所述描述信息,至少包括以下一种或多种的组合:所述网页数据的来源名称、所述网页数据的作者名称、所述网页数据的浏览次数、所述网页数据的回复次数。进一步地,所述网页结构及信息类别,包括:各社交网站的个性网页结构及个性信息类别,和/或各社交网站的通用网页结构及通用信息类别;所述社交网站,至少包括以下一种或多种的组合:论坛、贴吧、公告栏、群组讨论网站、在线聊天网站、交友网站、个人空间、博客、微博、其它社交网站。与现有的方案相比,本专利技术所获得的技术效果:1)本专利技术对于网站进行格式化分析,并完成专业维度的细化信息抽取,最终获取论坛和博客等社交网站类型的描述信息,并将具有论坛、博客特色的描述信息作为检索结果的一部分进行突出显示,让用户可以通过这些描述快速了解网页的基本情况,例如通过对点击回复次数的判断可以获知热门程度等。2)在搜索结果展示形式上增加了来源名称、作者名称、浏览次数、回复次数的描述信息后,特别对于来源名称、作者名称,还可以在点击来源名称、作者名称后按照来源名称、作者名称进行搜索,极大地方便了用户的搜索效率和搜索范围的精确制定。3)所述描述信息中的所述网页数据的来源名称、所述网页数据的作者名称、所述网页数据的浏览次数、所述网页数据的回复次数在随网页数据完成展现后很可能会发生变化,尤其浏览次数和回复次数更是会随时发生变化,本专利技术在展现描述信息等搜索结果时还不断刷新页面进行更新。附图说明图1为本专利技术实施例的第一方法流程图;图2为本专利技术实施例的第二方法流程图;图3为本专利技术实施例的第三方法流程图;图4为本专利技术实施例的第四方法流程图;图5为本专利技术实施例的第一系统架构图;图6为本专利技术实施例的第二系统架构图;图7为本专利技术实施例的第三系统架构图;图8为本专利技术实施例的第四系统架构图;图本文档来自技高网...

【技术保护点】
一种网络搜索系统,其特征在于,包括:数据库管理模块、数据库、搜索模块、分析模块和展现模块,其中,所述数据库管理模块,适于提取与社交网站相关的网页结构及信息类别构成数据库;所述数据库,适于保存与社交网站相关的网页结构及信息类别;所述搜索模块,适于根据提交的关键词搜索与所述关键词相关的网页数据;所述分析模块,适于根据所述数据库对搜索到的与所述关键词相关的所述网页数据进行分析,获取所述网页数据的描述信息,所述描述信息与所述社交网站的信息类别相适应;所述展现模块,适于将所述描述信息随相应的网页数据作为搜索结果共同展现。

【技术特征摘要】
1.一种网络搜索系统,其特征在于,包括:数据库管理模块、数据库、搜索模块、分析模块和展现模块,其中,所述数据库管理模块,适于提取与社交网站相关的网页结构及信息类别构成数据库;所述网页结构为布局板块或属性区域;所述网页结构包括各社交网站的个性网页结构或通过统计汇总各社交网站得到的通用网页结构;所述数据库,适于保存与社交网站相关的网页结构及信息类别;所述搜索模块,适于根据提交的关键词搜索与所述关键词相关的网页数据;所述分析模块,适于根据所述数据库对搜索到的与所述关键词相关的所述网页数据进行分析,获取所述网页数据的描述信息,所述描述信息与所述社交网站的信息类别相适应;所述展现模块,适于将所述描述信息随相应的网页数据作为搜索结果共同展现;所述分析模块,适于根据所述数据库中的网页结构将所述网页数据分解为若干布局板块或属性区域;再根据所述数据库中的各个信息类别在所述网页数据分解后得到的相应布局板块或属性区域中获取描述信息。2.如权利要求1所述的网络搜索系统,其特征在于,还包括:点选检测模块;所述点选检测模块,适于检测对展现的所述描述信息的触发事件,所述描述信息至少包括:所述网页数据的来源名称和/或所述网页数据的作者名称;所述搜索模块,还适于根据所述事件触发以所述描述信息作为关键词的搜索,其搜索与所述描述信息相关的网页数据。3.如权利要求1-2中任一项所述的网络搜索系统,其特征在于,还包括:更新检测模块;所述更新检测模块,适于周期性或实时地检测展现的所述描述信息的变化并更新;所述展现模块,还适于接收所述更新检测模块的通知刷新页面将更新的描述信息随相应的网页数据共同展现。4.如权利要求1-2中任一项所述的网络搜索系统,其特征在于,还包括:触发入口生成模块、触发检测模块及预览模块;所述触发入口生成模块,适于生成所述网页数据的预览操作的触发入口;所述展现模块,还适于将所述触发入口与相应的网页数据及描述信息共同展现;所述触发检测模块,适于检测到光标在所述触发入口停留超过一预设时长时通知所述预览模块;所述预览模块,适于当收到所述触发检测模块的通知时,截取预设长度的所述网页数据进行加载并进行显示。5.如权利要求3所述的网络搜索系统,其特征在于,还包括:触发入口生成模块、触发检测模块及预览模块;所述触发入口生成模块,适于生成所述网页数据的预览操作的触发入口;所述展现模块,还适于将所述触发入口与相应的网页数据及描述信息共同展现;所述触发检测模块,适于检测到光标在所述触发入口停留超过一预设时长时通知所述预览模块;所述预览模块,适于当收到所述触发检测模块的通知时,截取预设长度的所述网页数据进行加载并进行显示。6.如权利要求4所述的网络搜索系统,其特征在于,所述显示,包括:缩略图形式显示或去除所有网页渲染效果后显示。7.如权利要求5所述的网络搜索系统,其特征在于,所述显示,包括:缩略图形式显示或去除所有网页渲染效果后显示。8.如权利要求1所述的网络搜索系统,其特征在于,所述分析模块获取的所述描述信息,至少包括以下一种或多种的组合:所述网页数据的来源名称、所述网页数据的作者名称、所述网页数据的浏览次数、所述网页数据的回复次数。9.如权利要求1所述的网络搜索系统,其特征在于,所述数据库管理模块...

【专利技术属性】
技术研发人员:刘付强
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1