一种文案热度预估方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39064301 阅读:18 留言:0更新日期:2023-10-12 19:57
本发明专利技术提供了一种文案热度预估方法、装置、电子设备及存储介质,通过统计挖掘列举各特征词的历史热度特征,给出对当前文案在未来预估热度的可解释和可视化的参考值;一方面展示了历史数据丰富程度的和强大的获取能力,也能体现出对数据特征维度进行细致分析的业务能力,同时也能方便与品牌客户更好的沟通并增加说服力。而且,通过调整计算公式的各项参数,也可以较好的实现对结果的可控性。另外,该方法还可以从特征类别的维度进行分析建模和预估,以及通过特征词组合的方式来增加该方法的特征维度和提高预估的准确度等。特征维度和提高预估的准确度等。

【技术实现步骤摘要】
一种文案热度预估方法、装置、电子设备及存储介质


[0001]本专利技术涉及互联网
,具体而言,涉及一种文案热度预估方法、装置、电子设备及存储介质。

技术介绍

[0002]在品牌营销的社交媒体传播中,作为文字创意核心的特征词的选用,是品牌主和创意制作团队都非常重视,并需要反复斟酌和打磨的重点元素。这些特征词包括:当前品牌所宣扬的成分、功效、使用场景,所针对的用户痛点,以及结合当下热点并能映衬品牌特点的热门话术等。并且,在营销特征词的选用中,还需要参考其在当下和历史中热度的变化规律,尽量选用呈现热度递增趋势的特征词及类别。
[0003]比如,在节日期间选用带有喜庆色彩或情感表达类别的特征词;选取环保、安全、健康等在历史数据中呈明显热度上升的特征类别;以及选用跟近期热点事件有相关性、容易引发共鸣的特征词等。
[0004]在选择了合适的特征词并构建营销文案后,品牌主通常还希望能够给出本次营销文案的预估传播热度,以便做到对预算投入和效果产出的可量化把控。传播热度,主要是指社交媒体中的文章数量。特征词的热度,就是提及该特征词的社交媒体数量。
[0005]因此,如何提供一种有效的文案热度预估方法,是目前亟待解决的问题。

技术实现思路

[0006]为了改善上述问题,本专利技术提供了一种文案热度预估方法、装置、电子设备及存储介质。
[0007]本专利技术实施例的第一方面,提供了一种文案热度预估方法,所述方法包括:
[0008]获取原始的文本数据,对文本数据中的特征词进行挖掘提取,得到特征词的历史热度;
[0009]基于热度变化规律进行统计建模,建立热度预估模型;所述热度变化规律包括周期性热度规律、突发性热度规律、伴随性热度规律、默认热度变化规律;
[0010]针对待预估的文案,过滤掉其中的停用词和无营销价值的词后,通过所述热度预估模型对文案的热度进行预估。
[0011]可选地,基于所述周期性热度规律建模的方法包括:
[0012]对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;
[0013]从特征词的历史平滑热度中,选取热度最高的N天数据;
[0014]去掉这N天中热度较小的日期数据;
[0015]对于剩余的N'天热度数据,按预设的日期窗口值进行分组,得到高热日期组;
[0016]若得到的日期组数所为使用历史数据所跨越的完整年数的nz倍,并且每个完整历史年度里均包含nz个高热日期组,则初步判断符合周期热度变化规律;
[0017]基于高热日期组的分布情况,计算特征词的热度分布满足周期规律的第一置信
度。
[0018]可选地,基于所述突发性热度规律建模的方法包括:
[0019]对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;
[0020]基于预设的突发事件判断规则,获取热度突发的初始日期区间;
[0021]判断在预设的突发热度判断时间内,是否内出现多个满足所述突发事件判断规则的突发热度区间,如果有,则将日期最靠前的区间作为真正的初始热度区间;
[0022]根据初始热度区间的日期跨度和热度倍增数,得到其后续突发热度判断时间内的再次出现热度上升的参考信息;
[0023]基于热度区间的日期跨度和最高热度,计算特征词的热度分布满足突发热度规律的第二置信度。
[0024]可选地,基于所述伴随性热度规律建模的方法包括:
[0025]对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;
[0026]从历史数据中,按天计算热度均值,提取达到第一热度阈值的特征词数据;
[0027]按月计算热度均值,按月提取达到第二热度阈值的特征词数据;
[0028]根据提取的方式,分别计算提取了数据的特征词,两两之间的热度变化的相关性系数,作为第三置信度;
[0029]将相关系数超过设定阈值的两两特征词组合入库保存。
[0030]可选地,基于所述默认热度变化规律建模的方法包括:
[0031]对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;
[0032]通过数据拟合的方式,用历史年份数据里相同日期的热度构建拟合公式,用于预估后一年度该特征词在相同日期的热度。
[0033]可选地,所述通过所述热度预估模型对文案的热度进行预估的步骤,具体包括:
[0034]遍历文案中经过过滤后有价值的特征词,获取特征词对应的滑动平均后的历史热度数据;
[0035]针对每个特征词,分别判断是否属于周期热度变化规律的热度分布,并计算第一置信度;
[0036]针对每个特征词,分别判断是否在最近的突发热度判断时间内出现过突发性热度变化,并计算第二置信度;
[0037]针对每个特征词,分别检索提取与之存在热度正相关的特征词集合,包括历史整体和在之后突发热度判断时间中存在较高的热度相关性的特征词;
[0038]针对每个特征词,分别构建基于相同历史日期热度的线性拟合公式,作为缺省的预估后续每天热度的基准量;
[0039]整合上述热度变化规律因素,计算得到为后续参考的热度预估信息;
[0040]根据所述热度预估信息,对每个后续需要预估热度的日期进行热度预估。
[0041]可选地,所述根据所述热度预估信息,对每个后续需要预估热度的日期进行热度预估的步骤,具体包括:
[0042]对每个后续需要预估热度的日期,遍历文案中每个有价值的特征词;
[0043]针对每个特征词,判断该日期内周期热度规律条件是否成立,如果成立,则获取第一置信度W1以及历史年度中该周期时段热度均值的线性拟合估计值H1;
[0044]针对每个特征词,判断该日期内突发热度规律条件是否成立,如果成立,则获取第二置信度W2以及本次突发热度的各高热时段的热度均值H2;
[0045]针对每个特征词,提取存在高相关性的关联的特征词集合,计算这些存在相关性且满足预估热度条件的特征词的参考预估热度,选择参考预估热度与第三置信度乘积最大的关联的特征词,将选择的特征词与当前特征词之间的第三置信度作为H3,将乘积数值作为当前特征词的参考伴随预估热度H3;
[0046]针对每个特征词,通过基于历史相同日期的热度线性拟合公式,得到当天的预估热度H0;
[0047]根据公式计算当前特征词的实际预估热度Hp,
[0048]Hp=a*H0+(1

a)*(H1*W1+H2*W2+H3*W3)/(W1+W2+W3)
[0049]其中a为调节系数;
[0050]根据公式计算得到文案整体在当天的热度预估值Hd:
[0051]Hd=Σ(Ii*Hpi)/ΣIi
[0052]其中,Hd为当前文案的在当天的预估热度;Ii为第i个特征词的重要度权重,Hpi为第i个特征词在当天的实际预估热度。
[0053]本专利技术实施例的第二方面,提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文案热度预估方法,其特征在于,所述方法包括:获取原始的文本数据,对文本数据中的特征词进行挖掘提取,得到特征词的历史热度;基于热度变化规律进行统计建模,建立热度预估模型;所述热度变化规律包括周期性热度规律、突发性热度规律、伴随性热度规律、默认热度变化规律;针对待预估的文案,过滤掉其中的停用词和无营销价值的词后,通过所述热度预估模型对文案的热度进行预估。2.根据权利要求1所述的文案热度预估方法,其特征在于,基于所述周期性热度规律建模的方法包括:对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;从特征词的历史平滑热度中,选取热度最高的N天数据;去掉这N天中热度较小的日期数据;对于剩余的N'天热度数据,按预设的日期窗口值进行分组,得到高热日期组;若得到的日期组数所为使用历史数据所跨越的完整年数的nz倍,并且每个完整历史年度里均包含nz个高热日期组,则初步判断符合周期热度变化规律;基于高热日期组的分布情况,计算特征词的热度分布满足周期规律的第一置信度。3.根据权利要求2所述的文案热度预估方法,其特征在于,基于所述突发性热度规律建模的方法包括:对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;基于预设的突发事件判断规则,获取热度突发的初始日期区间;判断在预设的突发热度判断时间内,是否内出现多个满足所述突发事件判断规则的突发热度区间,如果有,则将日期最靠前的区间作为真正的初始热度区间;根据初始热度区间的日期跨度和热度倍增数,得到其后续突发热度判断时间内的再次出现热度上升的参考信息;基于热度区间的日期跨度和最高热度,计算特征词的热度分布满足突发热度规律的第二置信度。4.根据权利要求3所述的文案热度预估方法,其特征在于,基于所述伴随性热度规律建模的方法包括:对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;从历史数据中,按天计算热度均值,提取达到第一热度阈值的特征词数据;按月计算热度均值,按月提取达到第二热度阈值的特征词数据;根据提取的方式,分别计算提取了数据的特征词,两两之间的热度变化的相关性系数,作为第三置信度;将相关系数超过设定阈值的两两特征词组合入库保存。5.根据权利要求4所述的文案热度预估方法,其特征在于,基于所述默认热度变化规律建模的方法包括:对特征词的历史热度按天进行滑动平均处理,得到特征词的历史平滑热度;通过数据拟合的方式,用历史年份数据里相同日期的热度构建拟合公式,用于预估后一年度该特征词在相同日期的热度。6.根据权利要求5中所述的文案热度预估方法,其特征在于,所述通过所述热度预估模
型对文案的热度进行预估的步骤,具体包括:遍历文案中经过过滤后有价值的特征词,获取特征词对应的滑动平均后的历史热度数据;针对每个特征词,分别判断是否属于周期热度变化规律的热度分布,并计算第一置信度;针对每个特征词,分别判断是否在最近的突发热度判断时间内出现过突发性热度变化,并计算第二置信度;针...

【专利技术属性】
技术研发人员:唐亮曹特磊赵伟
申请(专利权)人:时趣互动北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1