System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及舆情分析与监测,尤其是涉及一种电商舆情监测方法、装置、设备和存储介质。
技术介绍
1、随着互联网的快速发展和电子商务的兴起,电子商务平台(如淘宝等)已成为人们购物的主要渠道之一。消费者在购买产品前通常会查阅其他用户对产品的评价和反馈,以了解产品的质量、性能和可靠性。因此,电商平台的用户评论数据具有极大的商业价值,它可以用于改进产品、推动销售、了解市场趋势以及提升用户体验。
2、现有技术中,通常利用网络爬虫技术从电商网站上抓取商品评论数据,然后运用文本挖掘、情感分析、大数据处理等技术进行评价意见挖掘和消费者情感趋势分析。然而,电商平台通常采用反爬虫措施,现有技术无法有效地克服限制,导致数据采集存在困难和不稳定性,难以有效地采集和处理用户评论数据,导致无法准确理解用户评论数据中的情感和观点,难以进行有效的商品舆情分析与监测。
技术实现思路
1、本专利技术的目的是提供一种电商舆情监测方法、装置、设备和存储介质,以解决现有技术无法有效地采集和处理电商评论数据导致难以进行商品舆情分析与监测的技术问题。
2、本专利技术的目的,可以通过如下技术方案实现:
3、方案一,一种电商舆情监测方法,包括:
4、根据预设的非爬虫算法从若干电商平台采集目标商品对应的多个用户评论数据,将各所述用户评论数据作为一个消息插入到消息队列中,并将各所述用户评论数据存储到第一数据库中;
5、周期性地从所述消息队列中提取多个消息构成一个待消耗队列,从
6、利用预设的舆情分析算法根据所述第二数据库中清洗过的所述用户评论数据进行商品舆情分析和统计计算,得到舆情分析结果;
7、根据预设的数据展示模板对所述舆情分析结果进行可视化展示。
8、可选地,所述根据预设的非爬虫算法从若干电商平台采集目标商品对应的多个用户评论数据,包括:
9、从mongodb数据库中获取目标商品对应的商品id;
10、利用预设的非爬虫算法根据所述商品id从若干电商平台采集数据,得到所述目标商品对应的多个用户评论数据。
11、可选地,所述利用预设的非爬虫算法根据所述商品id从若干电商平台采集数据,包括:
12、通过对电商平台的各版本app进行中间代理人抓包,获取可下发临时用户凭证的接口;
13、通过预设的代理ip,利用编程语言对所述接口进行模拟,获取所述接口下发的临时用户凭证;
14、根据所述临时用户凭证从若干电商平台进行数据采集。
15、可选地,所述将各所述用户评论数据作为一个消息插入到消息队列中,包括:
16、将各所述用户评论数据作为一个消息插入到messagequeue消息队列中。
17、可选地,所述将各所述用户评论数据存储到第一数据库中,包括:
18、将各所述用户评论数据存储到ssdb数据库中。
19、可选地,所述利用预设的数据清洗算法对所述多个用户评论数据进行数据清洗,包括:
20、将预设的数据清洗规则封装在scrapy框架的爬虫中;
21、利用包含所述scrapy框架的数据清洗算法,周期性地对所述多个用户评论数据进行数据清洗。
22、可选地,所述利用预设的舆情分析算法根据所述第二数据库中清洗过的所述用户评论数据进行商品舆情分析和统计计算,包括:
23、利用预设的舆情分析算法通过接口调用自然语言处理算法,根据预设的业务需求规则和预设的统计指标,对清洗过的所述用户评论数据进行舆情分析和统计计算。
24、方案二,一种电商舆情监测装置,包括:
25、数据采集模块,用于根据预设的非爬虫算法从若干电商平台采集目标商品对应的多个用户评论数据,将各所述用户评论数据作为一个消息插入到消息队列中,并将各所述用户评论数据存储到第一数据库中;
26、数据清洗模块,用于周期性地从所述消息队列中提取多个消息构成一个待消耗队列,从所述第一数据库中获取所述待消耗队列对应的多个用户评论数据,利用预设的数据清洗算法对所述多个用户评论数据进行数据清洗,将清洗过的所述多个用户评论数据存储到第二数据库中;
27、舆情分析模块,用于利用预设的舆情分析算法根据所述第二数据库中清洗过的所述用户评论数据进行商品舆情分析和统计计算,得到舆情分析结果;
28、数据展示模块,用于根据预设的数据展示模板对所述舆情分析结果进行可视化展示。
29、方案三,一种电子设备,包括:处理器和存储器;
30、其中,所述存储器存储计算机程序,所述处理器执行所述计算机程序时实现方案一所述的方法的步骤。
31、方案四,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述的方法的步骤。
32、基于上述技术方案,本专利技术带来的有益效果是:
33、针对不同产品、时间段或关键词定制化采集策略,通过非爬虫算法从若干电商平台采集目标商品的多个用户评论数据,将采集到的用户评论数据存储到临时数据库并插入到消息队列中,可克服电商网站的反爬虫措施,使系统能够适应各种数据的获取需求,能够稳定而迅速地获取大规模的用户评论数据,实现对电商平台用户评论数据的高效采集。周期性地从消息队列中提取待消耗队列,利用封装了自定义数据清洗规则的数据清洗算法对多个用户评论数据进行清洗并存储,能够根据业务需求对数据进行有效清洗。舆情分析算法调用先进的自然语言处理技术和情感分析算法,能根据业务需求规则和统计指标进行文本分析、情感倾向分析、关键词提取和主题建模等操作,可对采集的用户评论数据进行更高效、精确和全面地处理,能提供更全面更有深度的商品舆情信息。并利用个性化定制的数据展示模板对舆情分析结果进行可视化展示,支持灵活的用户定制选项,用户界面更加友好,以便能够轻松访问和利用电商平台的用户评论数据。
34、本专利技术可以稳定地获取大规模电商平台的用户评论数据,高效、精确和全面地处理用户评论数据,可准确理解用户评论数据中的情感和观点,能够进行有效的商品舆情分析与监测。
本文档来自技高网...【技术保护点】
1.一种电商舆情监测方法,其特征在于,包括:
2.根据权利要求1所述的电商舆情监测方法,其特征在于,所述根据预设的非爬虫算法从若干电商平台采集目标商品对应的多个用户评论数据,包括:
3.根据权利要求2所述的电商舆情监测方法,其特征在于,所述利用预设的非爬虫算法根据所述商品ID从若干电商平台采集数据,包括:
4.根据权利要求1所述的电商舆情监测方法,其特征在于,所述将各所述用户评论数据作为一个消息插入到消息队列中,包括:
5.根据权利要求1所述的电商舆情监测方法,其特征在于,所述将各所述用户评论数据存储到第一数据库中,包括:
6.根据权利要求1所述的电商舆情监测方法,其特征在于,所述利用预设的数据清洗算法对所述多个用户评论数据进行数据清洗,包括:
7.根据权利要求1所述的电商舆情监测方法,其特征在于,所述利用预设的舆情分析算法根据所述第二数据库中清洗过的所述用户评论数据进行商品舆情分析和统计计算,包括:
8.一种电商舆情监测装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:处
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种电商舆情监测方法,其特征在于,包括:
2.根据权利要求1所述的电商舆情监测方法,其特征在于,所述根据预设的非爬虫算法从若干电商平台采集目标商品对应的多个用户评论数据,包括:
3.根据权利要求2所述的电商舆情监测方法,其特征在于,所述利用预设的非爬虫算法根据所述商品id从若干电商平台采集数据,包括:
4.根据权利要求1所述的电商舆情监测方法,其特征在于,所述将各所述用户评论数据作为一个消息插入到消息队列中,包括:
5.根据权利要求1所述的电商舆情监测方法,其特征在于,所述将各所述用户评论数据存储到第一数据库中,包括:
【专利技术属性】
技术研发人员:邱健,
申请(专利权)人:创优数字科技广东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。