【技术实现步骤摘要】
一种被推荐对象的过滤方法及系统
本申请涉及数据处理技术,尤其涉及一种被推荐对象的过滤方法及系统。
技术介绍
在电子商务网站中,一般需要对电子商务产品进行过滤,以便从中选择出高质量的优质产品来向用户进行推荐,例如将被推荐的产品的对应信息放置于电子商务网站的首页等等,从而使得用户能够不通过搜索和过多的产品浏览操作即可获得优质产品的信息,更为便捷的进行购物。现有技术中,一般通过人工肉眼选择需要向用户推荐的产品,或者直接根据电子商务产品的成交量等来选择需要向用户推荐的产品,但是通过上述方式选择出来的被推荐的产品往往由于人工选择的倾向性或者选择依据的单一而造成选择结果与用户预期之间的偏差,导致产品推荐的不准确。也即是说,当将这些选择出来的产品向用户进行推荐时,往往并不能获得客户的认同,从而用户仍然需要通过搜索并对搜索到的产品进行浏览而最终实现购物,这样,电子商务网站所属的第一服务器需要进行优质产品的选择和推荐处理,然而这种选择和推荐处理并未减少用户购物中的操作,反而由于需要进行优质产品的选择和推荐处理,从而增加了第一服务器的数据处理压力,降低了第一服务器的数据处理速度;而且,第一服务器需要将对于产品的推荐数据发送到各个用户所在的客户端,以便向用户进行展现,第一服务器和客户端之间的推荐数据传输也占用了两者之间的传输带宽,浪费了网络传输资源。
技术实现思路
有鉴于此,本申请要解决的技术问题是,提供一种被推荐对象的过滤方法及系统,能够提高第一服务器的数据处理速度,且减少第一服务器与客户端之间的传输带宽占用。为此,本申请实施例采用如下技术方案:一种被推荐对象的过滤方法,包括:获 ...
【技术保护点】
一种被推荐对象的过滤方法,其特征在于,包括:获取被推荐对象的文本信息的文本识别概率;并且,获取被推荐对象的提供方的行为信息的行为识别概率;根据所述文本识别概率和行为识别概率确定被推荐对象的第一概率;判断所述第一概率是否大于预设概率阈值,如果是,将被推荐对象的第一预设信息发送至客户端,以便客户端在指定位置向用户展现被推荐对象的第一预设信息。
【技术特征摘要】
1.一种被推荐对象的过滤方法,其特征在于,包括:获取被推荐对象的文本信息的文本识别概率;并且,获取被推荐对象的提供方的行为信息的行为识别概率;所述被推荐对象为产品,所述文本信息为:产品的描述信息、标题或关键字,所述行为信息为:所述产品被用户在网页上的操作动作信息;所述文本识别概率根据被推荐对象在文本参数下的概率值,以及文本参数对应的概率值在文本识别概率中的权重值计算得到;所述行为识别概率根据被推荐对象的提供方在行为参数下的概率值,以及行为参数对应的概率值在行为识别概率中的权重值计算得到;根据所述文本识别概率和行为识别概率确定被推荐对象的第一概率;判断所述第一概率是否大于预设概率阈值,如果是,将被推荐对象的第一预设信息发送至客户端,以便客户端在指定位置向用户展现被推荐对象的第一预设信息,所述第一预设信息为:所述产品的除文字信息以外的其他信息。2.根据权利要求1所述的方法,其特征在于,所述文本识别概率具体通过以下方式计算得到:根据被推荐对象的样本,确定样本的各种文本参数对应的概率值在文本识别概率中的权重值;根据被推荐对象的文本信息计算被推荐对象在每一种文本参数下的概率值;根据被推荐对象在每一种文本参数下的概率值以及各种文本参数对应的概率值在文本识别概率中的权重值,计算被推荐对象的文本信息的文本识别概率。3.根据权利要求2所述的方法,其特征在于,根据被推荐对象的样本,确定样本的各种文本参数对应的概率值在文本识别概率中的权重值包括:获取被推荐对象的样本,将所述样本划分为第一样本库和第二样本库;对于每个样本,从样本的各种文本参数中分别提取各种文本参数所包含的词条;建立每一种文本参数的词条库,每一种文本参数的词条库中包括:该种文本参数所包含的各个词条在第一样本库样本的该种文本参数中的数量和第二样本库样本的该种文本参数中的数量;对于每一样本,根据每一种文本参数的词条库计算该种样本在该种文本参数下的概率值,根据计算得到的概率值确定各种文本参数对应的概率值在文本识别概率中的权重值。4.根据权利要求2所述的方法,其特征在于,根据被推荐对象的文本信息计算被推荐对象在每一种文本参数下的概率值包括:接收被推荐对象的文本信息,从文本信息中确定各种文本参数,从被推荐对象的各种文本参数中分别提取各种文本参数所包含的词条;对于被推荐对象的每一种文本参数中的每一词条,从对应的文本参数词条库中获取该词条在第一样本库样本的该种文本参数中的数量和第二样本库样本的该种文本参数中的数量;根据获取到的所述数量计算被推荐对象在对应文本参数下的概率值,得到被推荐对象在每一种文本参数下的概率值。5.根据权利要求4所述的方法,其特征在于,对于每一样本,根据每一种文本参数的词条库计算该样本在该种文本参数下的概率值包括:根据每一种文本参数的词条库计算词条在该种文本参数下的出现概率;对于每一样本的每一种文本参数,根据该样本的该种文本参数所包含的所有词条在该种文本参数下的出现概率,计算该样本在该种文本参数下的第一概率值和第二概率值;根据该样本在该种文本参数下的第一概率值和第二概率值计算该样本在该种文本参数下的概率值;根据获取到的所述数量计算被推荐对象在对应文本参数下的概率值包括:根据获取到的所述数量计算词条在该种文本参数下的出现概率;对于每一被推荐对象的每一种文本参数,根据该被推荐对象的该种文本参数所包含的所有词条在该种文本参数下的出现概率,计算该被推荐对象在该种文本参数下的第一概率值和第二概率值;根据该被推荐对象在该种文本参数下的第一概率值和第二概率值计算该对推荐对象在该种文本参数下的概率值。6.根据权利要求5所述的方法,其特征在于,计算词条的出现概率之后进一步包括:对词条在文本参数下的出现概率进行修正处理,得到词条在文本参数下的出现概率的修正值;相应的,根据该种文本参数所包含的所有词条的出现概率的修正值计算样本或者被推荐对象的该种文本参数所对应的概率值。7.根据权利要求6所述的方法,其特征在于,计算词条的出现概率的计算公式为:P(W)=(HCW*LT)/(HCW*LT+LCW*HT);其中,HCW为词条W在第一样本库样本的对应文本参数中出现的次数;LCW为词条W在第二样本库样本的对应文本参数中出现的次数;LT为第二样本库中样本的总数;HT为第一样本库中样本总数;对词条的出现概率进行修正处理包括:根据以下公式计算得到词条的出现概率的修正值:f(W)=(s*X+n*P(W))/(s+n);其中,n=HCW+LCW;X,s为常数;根据该种文本参数所包含的所有词条的出现概率的修正值计算样本的该种文本参数所对应的概率值包括:根据所有词条的出现概率的修正值计算第一概率值P1=1-(1-f(1))(1-f(2))…(1-f(m))^(1/m),第二概率值P2=1-(f(1)*f(2)...f(m))^(1/m),m为对应文本参数所包含的词条的总数量;则样本的该种文本参数所对应的概率值S=(P1-P2)/(P1+P2);根据该种文本参数所包含的所有词条的出现概率的修正值计算被推荐对象的该种文本参数所对应的概率值包括:根据所有词条的出现概率的修正值计算第一概率值P1=1-(1-f(1))(1-f(2))…(1-f(m))^(1/m),第二概率值P2=1-(f(1)*f(2)...f(m))^(1/m),m为对应文本参数所包含的词条的总数量;则被推荐对象的该种文本参数所对应的概率值S=(P1-P2)/(P1+P2);计算被推荐对象的文本信息的文本识别概率的计算公式为:X1=S1*T1+S2*T2…+Sq*Tq;其中,X1为文本识别概率,T1、T2、…、Tq为对应文本参数的权重值,S1、S2、…、Sq为q个文本参数对应的概率值。8.根据权利要求1所述的方法,其特征在于,所述行为识别概率具体通过以下方式计算得到:根据被推荐对象提供方的样本,确定样本的各种行为参数对应的概率值在行为识别概率中的权重值;根据被推荐对象提供方的行为信息计算被推荐对象提供方在每一种行为参数下的概率值;根据被推...
【专利技术属性】
技术研发人员:张新波,叶军,徐洋,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。