The present invention provides a novel multi domain vertical search sites, automatic intelligent analysis of natural language user request can be the website, then users into different areas of the search page, the site can also reverse the crawler. It mainly includes front end analysis module, result display module and anti crawler module. The front-end analysis module is the main module of Natural Language Processing, we can analyze the user using natural language request, determine the search field and the key information of the users, result display module includes search box module, selection module, advertising module, scheduling module, display module and the module of the search results page, to show the different search the results page according to the user demand, while preventing the crawler page content extraction. The anti crawler module mainly includes selection condition module, search result display module and page turning module, mainly for setting up some methods of anti crawler.
【技术实现步骤摘要】
一种新型可排序反爬虫多领域垂直搜索网站的设计方法
本专利技术提出了一种新型的,可以处理人工语言请求的,可以反爬虫的,可以对搜索结果进行排序的,多领域垂直搜索系统的网站设计方法。该领域主要包括计算机安全领域,主要是爬虫的数据抽取技术,数据库技术,主要是配置文件读取和排序技术,人工智能领域,主要是自然语言处理领域,能够分别出用户用自然语言提出的请求,并且做出分析和判断。
技术介绍
本专利技术设计的
技术介绍
主要包括爬虫技术,需要对爬虫技术进行深度的理解,方可知道如何反爬虫,同时需要服务器端编程技术,能够记录用户对广告位的点击情况,还有配置文件技术和数据库技术,方便根据配置文件从数据库中读取不同的内容,同时还有自然语言处理技术,该技术主要是能够处理用户使用自然语言提出的需求,对该需求进行分析,判断出用户的搜索领域。
技术实现思路
本网站主要包括前端处理模块,结果页面展示模块和反爬虫模块。主要使用的语言为php。前端处理模块主要是一个中文自然语言处理模块,它能够分析用户提出的中文请求,判断出用户的搜索领域。结果页面显示模块主要包括个四个子模块,按照页面顺序,从上到下分别是搜索框模块,选择条件模块,广告位模块,排序模块,搜索结果展示和翻页模块。搜索框模块提供到该页面的搜索,选择条件模块提供一些过滤条件供用户选择,广告位模块提供广告位给客户,同时记录用户对该广告位的行为,排序模块能够使得搜索结果页面按照预先制定的顺序进行展示,搜索结果展示和翻页模块将用户需要的结果展示出来,并且提供翻页。反爬虫模块包括两个子模块,一个是选择条件模块,另一个是搜索结果展示和翻页模块。通过两个模 ...
【技术保护点】
要求整个系统的构造及其衍生模式进行保护,其中包括前段处理模块,结果展示模块,其中包括搜索框模块,选择条件模块,广告位模块,排序模块,搜索结果展示及翻页模块五个子模块,反爬虫模块,其中将结果展示模块的五个子模块调换次序属于该结果展示模块的衍生模式,要求进行保护,具体的样式图,可以参照说明书附图中的图2,要求对该图的样式进行保护,同时对该图的衍生版本,比如调换各个子模块之间的顺序,也要求保护。
【技术特征摘要】
1.要求整个系统的构造及其衍生模式进行保护,其中包括前段处理模块,结果展示模块,其中包括搜索框模块,选择条件模块,广告位模块,排序模块,搜索结果展示及翻页模块五个子模块,反爬虫模块,其中将结果展示模块的五个子模块调换次序属于该结果展示模块的衍生模式,要求进行保护,具体的样式图,可以参照说明书附图中的图2,要求对该图的样式进行保护,同时对该图的衍生版本,比如调换各个子模块之间的顺序,也要求保护。2.要求对该系统中的前端处理方式进行保护,其中包括中文自然语言处理方式,对包括“领域”,“领域关键词1关键词2”的分析模式进行保护,同时对其的衍生模式也申请保护,比如“领域关键词1关键词2...关键词n”将关键词复制了多次,属于衍生模式,而将各个关键词之间的空格替换为其他符号,比如“,”等,该模式也属于衍生模式,同时将一个空格或者其他分隔符换成多个,比如两个或者三个,也是属于衍生模式。3.要求对结果展示页面的几个模块及其排序方式进行保护,该搜索结果页面从上到下依次为,搜索框模块,条件选择模块,广告位模块,搜索结果展示和翻页模块,要求对该结果展示的主要内容及其衍生模式进行保护,比如类似的页面包括广告位模块,搜索结果展示和翻页模块,搜索框模块,条件选择模块,等调换次序的结果页面形式视为衍生形式,要求进行保护,同时对包含主要的几个页面,比如包含搜索框模块,广告位模块,搜索结果展示和翻页模块的结果页面,视为衍生模式,要求进行保护。4.要求对广告位模块进行保护,保护内容包括,该模块的生成方式及其衍生模式,其中包括但不限于,href的target为_blank,img对应客户的logo,点击行为触发javascript函数,并且进一步触发服务器端的函数,从而进行数据存储的整个流程,同时对其衍生模式要求保护,其中包括,使用href,链接到客户网站,点击行为触发javasc...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。