信息收集方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:17994540 阅读:29 留言:0更新日期:2018-05-19 11:43
一种信息收集方法,所述方法包括:当浏览器的网页开启时,获取所述网页的网页内容;从所述网页内容中确定符合要求的目标邮件地址;收集所述目标邮件地址。本发明专利技术能提高邮件地址收集的效率。

Information collection method, device, electronic device and computer readable storage medium

An information collection method includes: when the web page of the browser is opened, the content of the web page is obtained; the target email address that meets the requirements is determined from the content of the web page, and the target email address is collected. The invention can improve the efficiency of mail address collection.

【技术实现步骤摘要】
信息收集方法、装置、电子设备及计算机可读存储介质
本专利技术涉及信息
,尤其涉及一种信息收集方法、装置、电子设备及计算机可读存储介质。
技术介绍
目前,企业可以使用多种方式与客户沟通,而邮件地址通常是最常见的联系方式之一。对于主营外贸业务的企业来说,业务员需要大量地浏览与客户业务相关的网站网页,使用搜索引擎搜索客户相关的信息,并从这些网站网页的相关信息中找到邮件地址。由于网页的信息比较繁杂,业务员通常需要比较细心地浏览网页的每条信息,当发现有邮件地址时,一个一个地复制邮件地址并整理收集起来,整个过程非常费时费力,还容易漏掉未被发现的邮件地址,使得邮件地址收集的效率极其低下。
技术实现思路
技术方案:一种信息收集方法,所述方法包括:当浏览器的网页开启时,获取所述网页的网页内容;从所述网页内容中确定符合要求的目标邮件地址;收集所述目标邮件地址。在一种可能的实现方式中,所述从所述网页内容中确定符合要求的目标邮件地址包括:使用预设的邮件字符表达式,对所述网页内容进行匹配,获得所述网页内容中的多个邮件地址;从所述多个邮件地址中过滤掉包括预设关键字符的邮件地址,获得符合要求的目标邮件地址。在一种可能的实现方式中,所述从所述网页内容中确定符合要求的目标邮件地址包括:使用预设的邮件字符表达式,对所述网页内容进行匹配,获得所述网页内容中的多个邮件地址;对所述多个邮件地址进行查重,获得第一邮件地址;从所述第一邮件地址中过滤掉包括预设关键字符的邮件地址,获得符合要求的目标邮件地址。在一种可能的实现方式中,所述对所述多个邮件地址进行查重,获得第一邮件地址包括:在所述多个邮件地址中包括由人工触发操作所述网页而出现的邮件地址的情况下,对所述多个邮件地址进行查重,获得第一邮件地址;或在所述多个邮件地址是通过多次查找所述网页内容而获得的情况下,对所述多个邮件地址进行查重,获得第一邮件地址。在一种可能的实现方式中,所述收集所述目标邮件地址包括:在自动模式下,收集所述目标邮件地址;或在手动模式下,当接收到输入的收集指令时,响应所述收集指令,收集所述目标邮件地址。一种信息收集装置,所述信息收集装置包括:获取单元,用于当浏览器的网页开启时,获取所述网页的网页内容;确定单元,用于从所述网页内容中确定符合要求的目标邮件地址;收集单元,用于收集所述目标邮件地址。在一种可能的实现方式中,所述确定单元包括:使用预设的邮件字符表达式,对所述网页内容进行匹配,获得所述网页内容中的多个邮件地址;从所述多个邮件地址中过滤掉包括预设关键字符的邮件地址,获得符合要求的目标邮件地址。在一种可能的实现方式中,所述确定单元包括:使用预设的邮件字符表达式,对所述网页内容进行匹配,获得所述网页内容中的多个邮件地址;对所述多个邮件地址进行查重,获得第一邮件地址;从所述第一邮件地址中过滤掉包括预设关键字符的邮件地址,获得符合要求的目标邮件地址。一种电子设备,所述电子设备包括存储器及处理器,所述存储器用于存储至少一个指令,所述处理器用于执行存储器中存储的计算机程序以实现所述的信息收集方法。一种计算机可读存储介质,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现所述的信息收集方法。有益效果:由以上技术方案,本专利技术中,当浏览器的网页开启时,电子设备可以获取所述网页的网页内容,从所述网页内容中确定符合要求的目标邮件地址,并收集所述目标邮件地址。可见,通过本专利技术的实施例,当浏览器的网页开启时,可以通过电子设备来收集网页内容中符合要求的目标邮件地址,而不需要人工来一个一个地查找邮件地址,不仅能够避免漏掉邮件地址,同时,还能够提高邮件地址收集的效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1是本专利技术公开的一种信息收集方法的较佳实施例的流程图。图2是本专利技术公开的一种信息收集装置的较佳实施例的功能模块图。图3是本专利技术实现信息收集方法的较佳实施例的电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。其中,本专利技术的信息收集方法可以应用在一个或者多个所述电子设备中。所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、可编程门阵列(Field-ProgrammableGateArray,FPGA)、数字处理器(DigitalSignalProcessor,DSP)、嵌入式设备等。所述电子设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(PersonalDigitalAssistant,PDA)、交互式网络电视(InternetProtocolTelevision,IPTV)等。请参见图1,图1是本专利技术公开的一种信息收集方法的较佳实施例的流程图。其中,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。S11、当浏览器的网页开启时,电子设备获取所述网页的网页内容。本专利技术中,浏览器通常具备扩展能力,在使用浏览器时,可以安装一些插件来增强浏览器的功能,比如翻译、截图、代理服务器等功能的插件。可以利用浏览器的这种扩展能力,编辑邮件地址收集扩展程序,以帮助业务员挖掘出网页中的邮件地址。本专利技术中,当浏览器的网页开启时,搜索引擎搜索相关客户信息时,扩展程序可以启动程序代码,以便电子设备获取所述网页的网页内容。网页内容的形式可以包括但不限于文字信息、图片信息、字符信息、数字信息等。S12、电子设备从所述网页内容中确定符合要求的目标邮件地址。本专利技术中,网页内容中可能存在邮件地址也可能不存在邮件地址,即使存在邮件地址,也不一定是符合要求的邮件地址,电子设备需要从所述网页内容中确定符合要求的目标邮件地址。可选的,所述从所述网页内容中确定符合要求的目标邮件地址包括:使用预设的邮件字符表达式,对所述网页内容进行匹配,获得所述网页内容中的多个邮件地址;从所述多个邮件地址中过滤掉包括预设关键字符的邮件地址,获得符合要求的目标邮件地址。在该可选的实施方式中,邮件地址通常具备特定的格式,电子设备可以预先设置邮件字符表达式,比如含有字母、数字、下划线中的至少一个并且含有字符@的表达式,以及含有代替字符@的表达式如example[at]mail.com或者example#mail.com。此外,为了屏蔽掉个人邮件地址或常见邮件地址,电子设备还可以预设一些关键字符,包含本文档来自技高网...
信息收集方法、装置、电子设备及计算机可读存储介质

【技术保护点】
一种信息收集方法,其特征在于,所述方法包括: 当浏览器的网页开启时,获取所述网页的网页内容; 从所述网页内容中确定符合要求的目标邮件地址; 收集所述目标邮件地址。

【技术特征摘要】
1.一种信息收集方法,其特征在于,所述方法包括:当浏览器的网页开启时,获取所述网页的网页内容;从所述网页内容中确定符合要求的目标邮件地址;收集所述目标邮件地址。2.根据权利要求1所述的方法,其特征在于,所述从所述网页内容中确定符合要求的目标邮件地址包括:使用预设的邮件字符表达式,对所述网页内容进行匹配,获得所述网页内容中的多个邮件地址;从所述多个邮件地址中过滤掉包括预设关键字符的邮件地址,获得符合要求的目标邮件地址。3.根据权利要求1所述的方法,其特征在于,所述从所述网页内容中确定符合要求的目标邮件地址包括:使用预设的邮件字符表达式,对所述网页内容进行匹配,获得所述网页内容中的多个邮件地址;对所述多个邮件地址进行查重,获得第一邮件地址;从所述第一邮件地址中过滤掉包括预设关键字符的邮件地址,获得符合要求的目标邮件地址。4.根据权利要求3所述的方法,其特征在于,所述对所述多个邮件地址进行查重,获得第一邮件地址包括:在所述多个邮件地址中包括由人工触发操作所述网页而出现的邮件地址的情况下,对所述多个邮件地址进行查重,获得第一邮件地址;或在所述多个邮件地址是通过多次查找所述网页内容而获得的情况下,对所述多个邮件地址进行查重,获得第一邮件地址。5.根据权利要求1至4任一项所述的方法,其特征在于,所述收集所述目标邮件地址包括:在自动模式下,收集所述...

【专利技术属性】
技术研发人员:陈思国
申请(专利权)人:深圳市小满科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1