一种数据信息采集方法及系统技术方案

技术编号:36511579 阅读:10 留言:0更新日期:2023-02-01 15:40
本申请公开了一种数据信息采集方法及系统,应用于跨平台商品信息同步管理系统,所述数据信息采集方法,包括:获取浏览器当前访问页面的网址信息,识别所述网址信息中包含的第一域名;判断所述网址信息中是否包含商品详情的链接信息;若包含,则生成采集按钮,并展示所述采集按钮;接收采集指令;检测所述是否已登录所述数据信息匹配管理系统;若已登录,根据所述第一域名选择数据信息采集方式;执行所述采集指令;获取所述商品详情信息。实现了商品详情信息的快速采集,简化了商家将商品上架的操作步骤。操作步骤。操作步骤。

【技术实现步骤摘要】
一种数据信息采集方法及系统


[0001]本申请涉及计算机信息处理领域,特别涉及一种数据信息采集方法及系统。

技术介绍

[0002]随着经济全球化以及电子商务的快速发展,通过电子购物平台进行跨境商品交易的行为逐渐成为人们日常生活的组成部分。
[0003]商家在跨境电商平台上开设电商平台店铺,使用ERP软件对自己的多个电商平台店铺进行管理, 商家将同一商品在多个平台进行上架销售时,需要填充对应的商品信息,商品信息不仅包括商品的分类信息,还包括商品的主题信息,例如:颜色、尺码、产地等,不同的主题信息对应的主题信息内容值也不同,例如颜色包括:蓝色、绿色等,分类信息不同的商品所对应的主题信息也不同,即使分类信息相同的商品在不同的电商平台上其对应的主题信息的命名方式也会不同。
[0004]各个电商平台的定位不同、销售方式不同,目标用户也有所不同,例如有只面向本地区用户提供服务的本地电商平台,有面向跨地区、跨国家的用户提供服务的跨境电商平台,因此,商家可以将商品在多个平台间进行转卖,为了便于理解,商家进行采购商品的电商平台,我们可以称之为第一电商平台,商家进行销售商品的电商平台,我们称之为第二电商平台,当商家将商品信息从第一电商平台上架到第二电商平台进行出售展示时,需要根据第二电商平台的规则填充商品的分类信息、主题信息。这种跨平台的商品转卖方式跟商家将仓库商品上架到销售电商平台存在一定的不同,商家将仓库商品上架到第二电商平台,商品的商品信息都是固定的,只需要根据第二电商平台的分类信息和主题信息进行内容值匹配即可,而跨平台的商品转卖则需要先获取到采购电商平台的商品信息,再进行匹配。
[0005]现阶段针对商家将商品信息从第一电商平台上架到第二电商平台进行出售展示所面临的问题是如何获取第一电商平台的商品信息,以及如何实现同一商品的分类信息和主题信息完成数据信息匹配后在不同电商平台进行上架。

技术实现思路

[0006]本申请提供一种数据信息采集方法及系统,用于采集浏览器当前访问页面的商品的详情信息,并将采集到的商品详情信息发送至数据信息匹配管理系统,实现了商品详情信息的快速获取,简化了商家的操作步骤,提高了工作效率。
[0007]一种数据信息采集方法,应用于跨平台商品信息同步管理系统,所述跨平台商品信息同步管理系统包括数据信息采集系统和数据信息匹配管理系统,所述跨平台商品信息同步管理系统与电商平台服务器相连接,所述电商平台服务器包括多个站点,特征在于,所述数据信息采集方法包括:获取浏览器当前访问页面的网址信息,识别所述网址信息中包含的第一域名;判断所述网址信息中是否包含商品详情的链接信息;
若包含,则生成采集按钮,并展示所述采集按钮;接收采集指令;判断是否已登录所述数据信息匹配管理系统;若已登录,根据所述第一域名选择数据信息采集方式;执行所述采集指令;获取商品详情信息。
[0008]进一步地,述获取浏览器当前访问页面的网址信息,识别所述网址信息中包含的第一域名,包括:预先配置域名信息列表,所述域名信息列表中包含一个或多个域名信息;识别判断所述浏览器当前访问页面的网址信息中包含的第一域名是否属于所述域名信息列表中的一个。
[0009]进一步地,所述判断网址信息中是否包含商品详情的链接信息,包括:预先配置表示所述商品详情的关键词列表,所述关键词列表中包含多个表示所述商品详情的关键词;识别所述网址信息,检索所述网址信息中是否包含有属于所述关键词列表中的表示所述商品详情的关键词;若包含有所述表示所述商品详情的关键词,则判断所述网址信息中包含所述商品详情的链接信息。
[0010]进一步地,所述根据所述第一域名选择数据信息采集方式,包括:根据第一域名判断所述当前访问页面的网址信息是否为可进行数据信息请求访问的网址信息;若判断为否,则抓取所述浏览器当前访问页面的页面图片信息。
[0011]进一步地,所述根据第一域名判断所述当前访问页面的网址信息是否为可进行数据信息请求访问的网址信息,还包括:若所述当前访问页面的网址信息是可进行数据信息请求访问的网址信息;根据所述网址信息进入开发人员工具界面;检索所述开发人员工具界面的主页面信息中是否包含所述商品详情信息的全部内容。
[0012]进一步地,若所述开发人员工具界面的主页面信息中不包含所述商品详情信息的全部内容;则对所述开发人员工具界面的所有页面信息进行逐个访问,获取所述商品详情信息。
[0013]进一步地,所述获取所述商品详情信息之后,还包括:所述数据信息匹配管理系统接收所述商品详情信息;所述数据信息匹配管理系统接收所述页面图片信息;所述数据信息匹配管理系统根据所述商品详情信息得到商品的第一标识信息;所述数据信息匹配系统根据所述页面图片信息得到商品的第一标识信息。
[0014]进一步地,所述第一标识信息,包括:第一网址信息、第一分类信息、第一主题信息、第一内容值信息以及商品图片信
息;其中,所述第一网址信息即所述浏览器当前访问页面的网址信息。
[0015]一种数据信息采集系统,应用于跨平台商品信息同步管理系统,所述跨平台商品信息同步管理系统包括数据信息采集系统和数据信息匹配管理系统,所述跨平台商品信息同步管理系统与电商平台服务器相连接,所述电商平台服务器包括多个站点,特征在于,所述数据信息采集系统,包括:获取单元,用于获取浏览器当前访问页面的网址信息;识别单元,用于识别所述网址信息中包含的第一域名,识别所述网址信息中包含的用于标识商品详情链接的关键词信息;判断单元,用于判断所述网址信息中是否包含商品详情的链接信息;判断是否已登录所述数据信息匹配管理系统;生成单元,用于生成采集按钮,并展示所述采集按钮;选择单元,用于根据所述第一域名选择数据信息采集方式;处理单元,用于根据采集指令采集商品的详情信息;用于抓取所述浏览器当前访问页面的页面图片信息;发送单元,用于将商品详情信息发送至所述数据信息匹配管理系统;用于将所述页面图片信息发送至所述数据信息匹配管理系统。
[0016]本申请公开的一种数据信息采集方法及系统,通过识别浏览器当前访问页面的网址信息生成采集按钮,接收商家的“采集”指令,进入商品详情的开发主页面获取商品详情信息对应的数据信息,并将商品详情信息发送至数据信息匹配管理系统进行数据信息匹配,实现了商品详情信息的智能采集,简化了商家的操作步骤,实现了商品信息在多平台间的快速上架,提高了工作效率。
附图说明
[0017]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1示出了本申请实施例提供的一种商品信息同步管理系统结构示意图;图2示出了本申请实施例提供的一种商品信息同步管理系统连接示意图;图3示出了本申请实施例提供的一种数据信息采集方法的步骤示意图;图4示出了本申请实施例提供的一种跨平台数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据信息采集方法,应用于跨平台商品信息同步管理系统,所述跨平台商品信息同步管理系统包括数据信息采集系统和数据信息匹配管理系统,所述跨平台商品信息同步管理系统与电商平台服务器相连接,所述电商平台服务器包括多个站点,特征在于,所述数据信息采集方法包括:获取浏览器当前访问页面的网址信息,识别所述网址信息中包含的第一域名;判断所述网址信息中是否包含商品详情的链接信息;若包含,则生成采集按钮,并展示所述采集按钮;接收采集指令;判断是否已登录所述数据信息匹配管理系统;若已登录,根据所述第一域名选择数据信息采集方式;执行所述采集指令;获取商品详情信息。2.根据权利要求1所述的一种数据信息采集方法,其特征在于,所述获取浏览器当前访问页面的网址信息,识别所述网址信息中包含的第一域名,包括:预先配置域名信息列表,所述域名信息列表中包含一个或多个域名信息;识别判断所述浏览器当前访问页面的网址信息中包含的所述第一域名是否属于所述域名信息列表中的一个。3.根据权利要求1所述的一种数据信息采集方法,其特征在于,所述判断所述网址信息中是否包含商品详情的链接信息,包括:预先配置表示所述商品详情的关键词列表,所述关键词列表中包含多个用于表示所述商品详情的关键词;识别所述网址信息,检索所述网址信息中是否包含有属于所述关键词列表中的表示所述商品详情的关键词;若包含有所述表示所述商品详情的关键词,则判断所述网址信息中包含所述商品详情的链接信息。4.根据权利要求1所述的一种数据信息采集方法,其特征在于,所述根据所述第一域名选择数据信息采集方式,包括:根据所述第一域名判断所述当前访问页面的网址信息是否为可进行数据信息请求访问的网址信息;若判断为否,则抓取所述浏览器当前访问页面的页面图片信息。5.根据权利要求4所述的一种数据信息采集方法,其特征在于,所述根据所述第一域名判断所述当前访问页面的网址信息是否为可进行数据信息请求访问的网址信息,还包括:若所述当前访问页面的网址信息是可进行数据信息请求访问的网址信息;根据所述网址信息进入到开发人员工具界面;检索所述开发人员工具界面的主页面信...

【专利技术属性】
技术研发人员:李学敏王志超杨智杰梅松辉
申请(专利权)人:深圳美云集网络科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1