转化率估计的方法和装置制造方法及图纸

技术编号:16501193 阅读:32 留言:0更新日期:2017-11-04 11:49
本发明专利技术公开了一种转化率估计的方法和装置,涉及计算机领域。该方法的一具体实施方式包括:根据样本数据计算样本转化率;利用样本转化率确定转化率置信区间。该实施方式能够在样本数量较小、样本数据较为稀疏的情况下对转化率进行区间估计,从而提高转化率估计的可靠性。

Method and device for estimating conversion rate

The invention discloses a method and a device for estimating the conversion rate, relating to the computer field. A specific implementation of this method includes: sample conversion rate is calculated according to sample data; confidence interval of conversion rate is determined by sample conversion rate. This method can be used to estimate the conversion rate under the condition that the sample size is small and the sample data is sparse, so as to improve the reliability of the conversion estimation.

【技术实现步骤摘要】
转化率估计的方法和装置
本专利技术涉及计算机领域,尤其涉及一种转化率估计的方法和装置。
技术介绍
转化率估计一直是计算广告领域的核心问题。目前,一般使用机器学习算法或基于概率模型的参数估计进行转化率估计。对于后者,现有技术一般采用点估计方法,如极大似然估计,来估计转化率。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:1.实际应用中,样本数量往往较小,数据较为稀疏,这使得点估计方法计算的转化率可靠性较低,进而使通过转化率计算的各种衍生指标稳定性较差。同时,点估计方法只能计算出转化率的一个估计值,无法为后续处理提供更加丰富的参数。2.在计算广告领域,由点估计方法得到的不同广告平台之间的质量评价差异较大,与真实的广告平台质量差异不符。3.在计算广告领域,样本往往不服从伯努利分布,因此无法进行转化率的区间估计。
技术实现思路
有鉴于此,本专利技术实施例提供一种转化率估计的方法和装置,能够在样本数量较小、样本数据较为稀疏的情况下对转化率进行区间估计,从而提高转化率估计的可靠性。为实现上述目的,根据本专利技术的一个方面,提供了一种转化率估计的方法和装置。本专利技术实施例的转化率估计的方法包括:根据样本数据计算样本转化率;利用样本转化率确定转化率置信区间。可选地,所述样本数据包括:在前事件发生次数、转化事件发生次数、以及产生转化的在前事件发生次数。可选地,所述根据样本数据计算样本转化率包括:利用下列公式计算样本转化率;其中,p为样本转化率,n为在前事件发生次数,c为转化事件发生次数,n+为产生转化的在前事件发生次数。可选地,所述样本数据、所述样本转化率、以及所述转化率置信区间对应于同一平台;以及所述方法进一步包括:基于下层平台的样本数据,利用下列公式确定上层平台的转化率置信区间;其中,所述下层平台隶属于所述上层平台,i为正整数,ni为第i个下层平台的在前事件发生次数,ci为第i个下层平台的转化事件发生次数,为第i个下层平台的产生转化的在前事件发生次数,z为预设置信度对应的临界值,为所述上层平台的中间转化率,为所述上层平台对应于所述预设置信度的转化率置信区间。可选地,所述方法进一步包括:根据所述转化率置信区间、利用下列公式计算质量指标;其中,s为质量指标,psup为所述转化率置信区间的置信上限,pinf为所述转化率置信区间的置信下限,pbm为预设转化率基数。为实现上述目的,根据本专利技术的又一方面,提供了一种转化率估计的装置。本专利技术实施例的转化率估计的装置包括:样本转化率计算模块,可用于根据样本数据计算样本转化率;置信区间确定模块,可用于利用样本转化率确定转化率置信区间。可选地,所述样本数据包括:在前事件发生次数、转化事件发生次数、以及产生转化的在前事件发生次数。可选地,所述样本转化率计算模块用于利用下列公式计算样本转化率;其中,p为样本转化率,n为在前事件发生次数,c为转化事件发生次数,n+为产生转化的在前事件发生次数。可选地,所述装置进一步包括:质量指标计算模块,用于根据所述转化率置信区间、利用下列公式计算质量指标;其中,s为质量指标,psup为所述转化率置信区间的置信上限,pinf为所述转化率置信区间的置信下限,pbm为预设转化率基数。为实现上述目的,根据本专利技术的又一方面,提供了一种电子设备。本专利技术的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术所提供的转化率估计的方法。为实现上述目的,根据本专利技术的再一方面,提供了一种计算机可读存储介质。本专利技术的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术所提供的转化率估计的方法。根据本专利技术的技术方案,上述专利技术中的一个实施例具有如下优点或有益效果:通过提出规范化的样本转化率计算方法,使得处理的样本服从伯努利分布,解决了现有技术中因样本不符合伯努利分布而无法进行转化率区间估计的问题;通过获取转化率的置信区间,从而能够为后续处理提供更为丰富的参数,同时大大提高转化率估计的可靠性;通过基于转化率置信区间灵活计算质量指标,从而获得与真实情况较为吻合的平台质量评价,克服了现有技术中平台质量评价准确性较低的缺陷;通过对数据较为稀疏的下层平台进行数据上卷,综合各下层平台的数据进行转化率估计,提升了估计准确性,同时可实现对上层平台的质量评价。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的转化率估计的方法的主要步骤示意图;图2是根据本专利技术实施例的转化率估计的方法的广告平台质量评价示意图;图3是根据本专利技术实施例的转化率估计的方法的平台层次示意图;图4是根据本专利技术实施例的转化率估计的装置的主要部分的示意图;图5是根据本专利技术实施例可以应用于其中的示例性系统架构图;图6是用来实现本专利技术实施例的转化率估计的方法的电子设备的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。本专利技术的实施例的技术方案通过提出规范化的样本转化率计算方法,使得处理的样本服从伯努利分布,解决了现有技术中因样本不符合伯努利分布而无法进行转化率区间估计的问题;通过获取转化率的置信区间,从而能够为后续处理提供更为丰富的参数,同时大大提高转化率估计的可靠性;通过基于转化率置信区间灵活计算质量指标,从而获得与真实情况较为吻合的平台质量评价,克服了现有技术中平台质量评价准确性较低的缺陷;通过对数据较为稀疏的下层平台进行数据上卷,综合各下层平台的数据进行转化率估计,提升了估计准确性,同时可实现对上层平台的质量评价。实施例一图1是根据本实施例的转化率估计的方法的主要步骤示意图。如图1所示,本专利技术实施例的转化率估计的方法主要包括如下步骤:步骤S101:根据样本数据计算样本转化率。本步骤的目的在于通过一种规范化的计算方法计算样本转化率,经过上述处理的样本即服从伯努利分布,进而可以对转化率进行区间估计。在本实施例中,转化是指前一种事件的发生引起后一种事件发生的过程。本文将所述前一种事件称为在前事件,将所述后一种事件称为转化事件。现有技术中的转化率一般采用转化事件发生次数与在前事件发生次数的比值来近似,但在实际应用中,一次在前事件往往会引起一次以上的转化事件,这就使得处理的样本不服从伯努利分布,因而无法进行转化率的区间估计。因此,在本实施例中,采用新的方法计算样本转化率,进而根据样本转化率进行区间估计,解决了现有技术的上述问题。本实施例中的样本转化率指的是基于样本数据计算的、与服从伯努利分布的样本对应的转化率,其具体计算方法将在下文详细介绍。特别地,本实施例中的转化率可以是计算广告领域中广告投放到广告点击的转化率、广告点击到产生购买行为的转化率,也可以是数据分析领域点击广告到进入下载页的转化率、进入下载页到点击下载的转化率、点击下载到下载成功本文档来自技高网...
转化率估计的方法和装置

【技术保护点】
一种转化率估计的方法,其特征在于,包括:根据样本数据计算样本转化率;利用样本转化率确定转化率置信区间。

【技术特征摘要】
1.一种转化率估计的方法,其特征在于,包括:根据样本数据计算样本转化率;利用样本转化率确定转化率置信区间。2.根据权利要求1所述的方法,其特征在于,所述样本数据包括:在前事件发生次数、转化事件发生次数、以及产生转化的在前事件发生次数。3.根据权利要求2所述的方法,其特征在于,所述根据样本数据计算样本转化率包括:利用下列公式计算样本转化率;其中,p为样本转化率,n为在前事件发生次数,c为转化事件发生次数,n+为产生转化的在前事件发生次数。4.根据权利要求1所述的方法,其特征在于,所述样本数据、所述样本转化率、以及所述转化率置信区间对应于同一平台;以及所述方法进一步包括:基于下层平台的样本数据,利用下列公式确定上层平台的转化率置信区间;其中,所述下层平台隶属于所述上层平台,i为正整数,ni为第i个下层平台的在前事件发生次数,ci为第i个下层平台的转化事件发生次数,为第i个下层平台的产生转化的在前事件发生次数,z为预设置信度对应的临界值,为所述上层平台的中间转化率,为所述上层平台对应于所述预设置信度的转化率置信区间。5.根据权利要求1-4任一所述的方法,其特征在于,所述方法进一步包括:根据所述转化率置信区间、利用下列公式计算质量指标;

【专利技术属性】
技术研发人员:寿如阳林睿袁一方
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1