电子商务客户虚假评价识别系统技术方案

技术编号:11973280 阅读:139 留言:0更新日期:2015-08-28 10:46
本发明专利技术涉及互联网领域,特别涉及电子商务客户虚假评价识别系统。包括客户机、网络连接装置以及虚假评价识别模块;其中所述虚假评价识别模块,包括:评价内容相似性判断模块、评价ID相似性判断模块以及评价ID作弊因子判断模块;所述客户机通过网络连接装置来获取目标商品的相关评价数据信息,通过所述虚假评价识别块来分别判断出目标商品评价中的虚假评价内容和虚假评价ID;所述虚假评价识别模块将判断出的结果返回给客户机中,通过客户机将虚假评价标记出来;本发明专利技术分别判断出疑似的虚假评价内容和评价ID,并通过客户机将判断结果标记出来,为买家规避商品虚假评价而引起的交易风险。

【技术实现步骤摘要】

本专利技术设及互联网领域,特别设及电子商务客户虚假评价识别系统
技术介绍
在当代,随着互联网的普及,电子商务已经成为一种被广泛利用的商业贸易方式。 买卖双方主要是通过电商的网页或者是软件进行交易活动。由于电子商务没有传统的实体 店面,对销售人员的数量要求也不高,所W相比传统交易模式更能够控制运营成本,因而有 着更大的价格优势。但是,有很多不法商家为了提高自己的销量从而雇佣专业刷评价团队 也制造大量的虚假评价来对自己的商品进行虚假的宣传,从而欺骗消费者来提高自己的真 实销量。 目前电子商务的发展迅猛,体量巨大,电商环境中的卖家数量众多,用户在进行购 买决定时难W判断商品描述的真实性,对商品评价的依赖度很高,由于卖家评价作弊而造 成的商品的性能好评度虚高的情况引起的买家利益损失的情况严重。在该样的情况下,如 何对电子商务中商家的评价作弊行为进行识别和判断成电子商务发展过程中亟待解决的 问题;在判断虚假评价过程中如何全面的科学的将虚假评价识别出来,对于商品购买者和 电商环境管理者来说具有重要的意义;目前现有技术中还缺乏准确有效的相关设备来实现 相关的判断。
技术实现思路
为了解决现有技术中存在的问题,本专利技术提供了电子商务客户虚假评价识别系 统,分别通过评价内容相似性判断模块和评价ID相似性判断模块来识别目标商品评价数 据中的相同和相似评价内容,W及相同或者相似的评价ID,在判断出相同和相似ID的基础 上通过评价ID作弊因子判断模块,来鉴别出该些相同或者相似评价ID所发出商品评价的 频率是否明显高于正常的阔值,如果高于正常的阔值则将该些ID判断为虚假评价ID本发 明实现了目标商品评价中虚假评价的自动识别,为电商环境管理者和商品消费者提供了简 单可靠的评价辨识工具。 为了实现上述专利技术目的,本专利技术提供了W下技术方案: 电子商务客户虚假评价识别系统,包括客户机、网络连接装置W及虚假评价判断 识别模块;其中所述虚假评价判断识别模块,包括评价内容相似性判断模块、评价ID相似 性判断模块W及评价ID作弊因子判断模块;所述客户机通过网络连接装置来获取目标商 品的相关评价数据信息(目前通过爬虫技术可W很方便的获取到目标网页中的相关信息, 提取的速度快,可分析数据的总量巨大,所提取数据的分析方法成熟,成本低廉),并将信息 分别输出到所述评价内容相似性判断模块和所述评价ID相似性判断模块中;所述评价ID 作弊因子判断模块将评价ID判断结果返回到客户机中;所述评价ID相似性判断模块的输 出端与所述评价ID作弊因子判断模块的输入端相连;所述评价内容相似性判断模块将评 价内容判断结果返回到客户机中。通过客户机对识别出来的虚假评价内容和评价ID进行 相应处理,系统结构更加简化,成本降低。本系统工作时,所述客户机将获取到的目标商品评价信息分别输出到所述评价内 容相似性判断模块和所述评价ID相似性判断模块中;所述评价内容相似性判断模块判断 出目标商品评价信息中的相同和相似评价内容,并将判断结果返回到所述虚假评价标记模 块中;目前如果商家想要通过虚假交易和评价来提高系统显示商品的销量和好评情况,所 需要的虚假评价的数量较大,在该样的情况下人为捏造的评价往往在评价内容上具有较高 的相似性,或者就直接W相同的内容出现,本专利技术中的评价内容相似性判断模块通过比较 目标商品评价数据中的内容文本的相似性(目前文本相似性比较的判断方法已经比较成 熟,比如说可W采取余弦相似比较算法来判断文本内容之间的相似程度,当相似程度超过 预设的阔值,则可认为被比较的文本内容相似,具体的比较过程不再寶述),统计内容相同 评价的数量,判断出内容相似的评价;并将判断的结果返回到所述客户机中。[000引同时,所述评价ID相似性判断模块通过文本相似比较判断出目标商品评价信息 中的相同和相似评价ID,并将判断结果输入到所述评价ID作弊因子判断模块中,所述评价 ID作弊因子判断模块通过对目标ID作弊可能性进行分析,判断出作弊的虚假评价ID;并将 判断结果返回到客户机中。目前职业刷评价团队会人工或者利用自动注册机来注册很多小 号(所谓的小号是指,同一个人注册和使用的不同的ID号),该些职业评价团队所注册和 使用的小号ID具有一定规律性;一般情况下职业评价师所注册的一系列ID号也是根据系 统推荐或者自动生成的,该样的方式所产生的ID号会具有较大的关联性和相似性,比如说 ABC1、ABC2、ABC3、ABC4、ABC5.....ABCn。通过对评价ID的文本相似性比较就可W判断出 相同或者相似评价内容所对应的评价ID是否相同或者相似;如果相同或者相似,那么该些ID为虚假ID的可能性很高。本专利技术目标商品的评价内容和评价ID的相似性进行分别判 断,判断出的虚假评价的范围更大,判断结果更加全面。 进一步的,为了进一步提高虚假评价判断的准确性,使判断的结果更加严格,所述 评价ID相似性判断模块将判断结果输入到所述评价ID作弊因子判断模块中;所述评价ID 作弊因子判断模块在判断出的相同或者相似ID的基础上,分析对应ID发出评价的频率和 时间,将对应ID发出评价的频率与目标商品评价的平均评价频率进行比较,如果其比值高 于设定的阔值,则将该些评价ID判断为虚假评价ID,通过评价ID作弊因子判断模块对评价 ID进行进一步的判断,判断结果准确性较高。 进一步的,所述虚假评价标记模块将所述评价内容相似性判断模块所判断出的相 同和相似评价内容标记出来;所述虚假评价标记模块将所述评价ID作弊因子判断模块所 判断出的虚假评价ID标记出来。 进一步的,所述客户机将目标商品信息中即满足虚假评价内容又满足虚假评价ID 的对应评价进行着重标记。通过着重标记,商品买家和电商环境的管理者可W对虚假评价 进行层次化和更科学合理的处理。通过本系统对目标商品虚假评价的判断效率高,虚假评 价判断结果更加全面。 作为一种优选,所述评价内容相似性判断模块为内容相似性判断服务器;所述评 价ID相似性判断模块为ID相似性判断服务器;所述评价ID作弊因子判断模块为作弊因子 判断服务器。服务器在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面表现 优秀,通过服务器来完成相关的ID相似性,内容相似性的相关判断,可快速处理大量电商 目标商品的相关数据,处理速度快,效率高。 与现有技术相比,本专利技术的有益效果;本专利技术提供电子商务客户虚假评价识别系 统。通过客户机访问目标商品的网址,爬取对应商品网页的评价数据;并通过所述虚假评价 识别模块对爬取到的评价数据进行判断,分别分析评价数据中评价内容、评价ID为虚假评 价内容或者虚假评价ID的可能性,所述虚假评价识别模块将判断出来的结果返回给所述 客户机,并通过所述客户机将虚假评价内容和虚假评价ID分别标记出来。 本专利技术通过对目标商品评价数据中的评价内容和评价ID进行分别的判断识别, 判断出的虚假评价覆盖范围更加全面,针对职业刷评价团队注册的系列虚假评价ID进行 了针对性的判断和识别,在判断出相同当前第1页1 2 本文档来自技高网...

【技术保护点】
电子商务客户虚假评价识别系统,其特征在于,包括客户机、网络连接装置以及虚假评价判断识别模块;其中所述虚假评价判断识别模块,包括评价内容相似性判断模块、评价ID相似性判断模块以及评价ID作弊因子判断模块;所述客户机通过网络连接装置来获取目标商品的相关评价数据信息,并将信息分别输出到所述评价内容相似性判断模块和所述评价ID相似性判断模块中;所述评价ID相似性判断模块的输出端与所述评价ID作弊因子判断模块的输入端相连;所述评价ID作弊因子判断模块将评价ID判断结果返回到客户机中;所述评价内容相似性判断模块将评价内容判断结果返回到客户机中。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴雨浓何宏靖刘世林
申请(专利权)人:成都数联铭品科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1