一种获取任务的方法及装置制造方法及图纸

技术编号:14335143 阅读:97 留言:0更新日期:2017-01-04 08:54
本发明专利技术公开了一种获取任务的方法及装置。该方法包括:针对每个发布任务的网站,对所述网站所包含的多个网页内容分别进行解析,确定获取任务的方式;根据确定出的获取任务的方式,确定预先定义的与所述方式对应的应对策略;执行所述应对策略以模拟用户的操作,从所述网站获取任务。本发明专利技术通过自动化的方式获取网页内容、模拟用户获取任务的操作,较现有技术中通过用户人为上网搜索并人为获取任务的方式,大大提高了获取任务的效率。

【技术实现步骤摘要】

本专利技术涉及互联网
,特别涉及一种获取任务的方法及装置
技术介绍
经过近几年的互联网技术的发展,出现了许多任务发布的网站,这些网站发布任务,吸引具备相应任务解决能力者前来接受任务。发布的任务多样,例如一些发布音频视频编辑、语音识别的任务,软件的试用任务等等;举一个例子来说,网站发布一个任务即:从互联网上搜索包含人脸的10000张图片,从这些图片中圈出人脸。用户可以通过完成这些任务获得相应的报酬,获取任务的方式也多样,有些需要按照指示逐步完成,有些通过回答相应的问题来完成。以往接受任务的方式都是用户人为地搜索任务发布网站,然后再人为搜素自身能够完成的任务,并按照网站指示的方式接受任务并处理,直至任务完成。但是这种人工零散接受任务并处理任务的方式,存在整体效率较低的问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种获取任务的方法及装置。本专利技术实施例提供的一种获取任务的方法,包括:针对每个发布任务的网站,对所述网站所包含的多个网页内容分别进行解析,确定获取任务的方式;根据确定出的获取任务的方式,确定预先定义的与所述方式对应的应对策略;执行所述应对策略以模拟用户的操作,从所述网站获取任务。进一步地,所述发布任务的网站通过下述方式确定:将预设的与发布任务的网站相关的至少一个检索关键词发送给搜索引擎,获取所述搜索引擎返回的发布任务的网站的搜索结果,所述搜索结果中包含一个或多个发布网站的地址链接。进一步地,所述网页内容通过网络爬虫技术获取。进一步地,对所述网站所包含的多个网页内容分别进行解析,确定获取任务的方式,具体包括:对所述多个网页内容所包含的任务的关键词进行解析,确定获取任务的方式;所述获取任务的方式包括但不限于:通过点击按钮来获取、通过填写预制的信息来获取和回答设定的问题来获取。进一步地,根据确定出的获取任务的方式,确定预先定义的与所述方式对应的应对策略,包括:当所述获取的任务的方式为通过点击按钮来获取时,确定所述应对策略为点击预设的与所述任务步骤对应的各按钮选项;当所述获取的任务的方式为通过填写预制的信息来获取时,确定所述应对策略为填写预设的与所述任务步骤对应的各预制的信息;当所述获取的任务的方式为回答设定的问题来获取时,确定所述应对策略为填写预设的与所述任务步骤对应的问题答案。本专利技术实施例提供的获取任务的装置,包括:解析模块,用于针对每个发布任务的网站,对所述网站所包含的多个网页内容分别进行解析,确定获取任务的方式;应对策略确定模块,用于根据确定出的获取任务的方式,确定预先定义的与所述方式对应的应对策略;任务获取模块,用于执行所述应对策略以模拟用户的操作,从所述网站获取任务。进一步地,本专利技术实施例提供的获取任务的装置,还包括:网站搜索模块,用于将预设的与发布任务的网站相关的至少一个检索关键词发送给搜索引擎,获取所述搜索引擎返回的发布任务的网站的搜索结果,所述搜索结果中包含一个或多个发布网站的地址链接。进一步地,所述网页内容通过网络爬虫技术获取。进一步地,所述解析模块,具体用于对所述多个网页内容所包含的任务的关键词进行解析,确定获取任务的方式;所述获取任务的方式包括但不限于:通过点击按钮来获取、通过填写预制的信息来获取和回答设定的问题来获取。进一步地,所述应对策略确定模块,具体用于当所述获取的任务的方式为通过点击按钮来获取时,确定所述应对策略为点击预设的与所述任务步骤对应的各按钮选项;当所述获取的任务的方式为通过填写预制的信息来获取时,确定所述应对策略为填写预设的与所述任务步骤对应的各预制的信息;当所述获取的任务的方式为回答设定的问题来获取时,确定所述应对策略为填写预设的与所述任务步骤对应的问题答案。本专利技术实施例提供的获取任务的方法及装置,对每个发布任务的网站,对网站包含的多个网页内容进行解析,确定获取任务的方式,再根据获取任务的方式,确定对应的应对策略,执行应对策略以模拟用户的操作,从网站获取任务,这样,通过自动化的方式获取网页内容、模拟用户获取任务的操作,较现有技术中通过用户人为上网搜索并人为获取任务的方式,大大提高了获取任务的效率。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例中获取任务的方法的流程图;图2为本专利技术实施例中网页内容的示意图之一;图3为本专利技术实施例中网页内容的示意图之二;图4为本专利技术实施例中获取任务的装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。下面对本专利技术实施例提供的获取任务的方法的具体实施方式进行详细的说明。本专利技术实施例提供的获取任务的方法,如图1所示,包括下述步骤:S11、针对每个发布任务的网站,对网站所包含的多个网页内容分别进行解析,确定获取任务的方式;S12、根据确定出的获取任务的方式,确定预先定义的与方式对应的应对策略;S13、执行应对策略以模拟用户的操作,从网站获取任务。为了克服现有技术中人工零散接受任务并处理任务的方式的缺点,在本专利技术实施例中,将获取任务的过程通过机器自动实现,这样,使得获取任务的方式速度和效率都大大的提高。下面进一步地对上述各步骤进行详细的说明。由于在互联网中存在数量巨大的发布任务的网站,本专利技术实施例提供的上述获取任务的方法的S11中,如何获取这些发布任务的网站的地址,可以通过多种方式得到,一个较佳的实施方式,可以通过将相关的检索关键词或者其他检索元素发送至搜索引擎实现,这些搜索关键词或者其他检索元素(例如图片等)可预先根据这些发布任务的网站的内容、想要获取的任务的类型等来确定,具体的确定方法可以参照现有技术,在此不再限定。具体来说,即将预设的与发布任务的网站相关的至少一个检索关键词发送给搜索引擎,然后获取搜索引擎返回的发布任务的网站的搜索结果,搜索结果中包含一个或多个发布网站的地址链接。进一步地,上述S11中,网站所包含的多个网页内容,在具体实施时,可以利用网络爬虫技术从每个发布任务的网站,获取该网站下多个网页。网络爬虫技术的具体实施方式可以参照现有技术。从网站中获取其多个网页之后,需要对网页的内容进行解析,例如对网页中各元素进行解析,例如标题、文档内容、图片等进行解析,确定该网页内容中是否包含与发布任务有关的内容。一旦通过解析网页内容确定该网页内容发布有相关的任务,则根据该网页包含的任务的关键词进一步进行解析,确定获取任务的方式。现有在发布任务的网站获取任务的方式有多种,例如采用点通过点击按钮来获取、通过填写预制的信息来获取和回答设定的问题来获取。举例来说,通过点击按钮来获取,即网页在发布任务的文字内容下面通过按钮的方式与接受任务的用户来交互,例如图2中所示的,在文字内容下面设置有“下一步”、“确定”、“同意”、“不同意”“接受本文档来自技高网...
一种获取任务的方法及装置

【技术保护点】
一种获取任务的方法,其特征在于,包括:针对每个发布任务的网站,对所述网站所包含的多个网页内容分别进行解析,确定获取任务的方式;根据确定出的获取任务的方式,确定预先定义的与所述方式对应的应对策略;执行所述应对策略以模拟用户的操作,从所述网站获取任务。

【技术特征摘要】
1.一种获取任务的方法,其特征在于,包括:针对每个发布任务的网站,对所述网站所包含的多个网页内容分别进行解析,确定获取任务的方式;根据确定出的获取任务的方式,确定预先定义的与所述方式对应的应对策略;执行所述应对策略以模拟用户的操作,从所述网站获取任务。2.如权利要求1所述的方法,其特征在于,所述发布任务的网站通过下述方式确定:将预设的与发布任务的网站相关的至少一个检索关键词发送给搜索引擎,获取所述搜索引擎返回的发布任务的网站的搜索结果,所述搜索结果中包含一个或多个发布网站的地址链接。3.如权利要求1所述的方法,其特征在于,所述网页内容通过网络爬虫技术获取。4.如权利要求1-3任一项所述的方法,其特征在于,对所述网站所包含的多个网页内容分别进行解析,确定获取任务的方式,具体包括:对所述多个网页内容所包含的任务的关键词进行解析,确定获取任务的方式;所述获取任务的方式包括但不限于:通过点击按钮来获取、通过填写预制的信息来获取和回答设定的问题来获取。5.如权利要求4所述的方法,其特征在于,根据确定出的获取任务的方式,确定预先定义的与所述方式对应的应对策略,包括:当所述获取的任务的方式为通过点击按钮来获取时,确定所述应对策略为点击预设的与所述任务步骤对应的各按钮选项;当所述获取的任务的方式为通过填写预制的信息来获取时,确定所述应对策略为填写预设的与所述任务步骤对应的各预制的信息;当所述获取的任务的方式为回答设定的问题来获取时,确定所述应对策略为填写预设的与所...

【专利技术属性】
技术研发人员:龚云波
申请(专利权)人:无锡天脉聚源传媒科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1