计算机实现的方法、设备和计算机程序产品技术

技术编号:37355769 阅读:15 留言:0更新日期:2023-04-27 07:06
本公开的实施例涉及计算机实现的方法、设备和计算机程序产品。该方法包括提取发布时间处在第一时段内的一组文档各自的主题;确定主题各自的语义信息和在一组文档中出现的频率;以及基于主题的语义信息和所述频率,根据预测模型,确定在第二时段内与主题相关联的文档的数目。该第二时段在第一时段之后。本公开的实施例能够基于主题的语义信息和频率,来更好地预测该主题在未来出现的趋势。预测该主题在未来出现的趋势。预测该主题在未来出现的趋势。

【技术实现步骤摘要】
计算机实现的方法、设备和计算机程序产品


[0001]本公开的实施例总体涉及计算机领域,具体涉及计算机实现的方法、设备和计算机程序产品。

技术介绍

[0002]随着诸如大数据、物联网和人工智能等各种技术的出现和广泛应用,产生了不同领域的海量数据。从海量数据中可以高效且透明地获取和融合各种知识,并且可以对未来的科技发展方向等进行预测。例如,可以根据海量数据来对各种主题诸如热门技术主题在未来的受关注情况进行预测。然而,对不同主题的未来受关注趋势进行预测的准确性有待进一步提高。

技术实现思路

[0003]本公开的实施例提供了计算机实现的方法、设备和计算机程序产品。
[0004]在本公开的第一方面,提供了一种计算机实现的方法。该方法包括提取发布时间处在第一时段内的一组文档各自的主题;确定主题各自的语义信息和在一组文档中出现的频率;以及基于主题的语义信息和频率,根据预测模型,确定在第二时段内与主题相关联的文档的数目,该第二时段在第一时段之后。
[0005]在本公开的第二方面,提供了一种电子设备。该电子设备包括至少一个处理单元和至少一个存储器。至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。该指令当由至少一个处理单元执行时使得电子设备执行动作,该动作包括提取发布时间处在第一时段内的一组文档各自的主题;确定主题各自的语义信息和在一组文档中出现的频率;以及基于主题的语义信息和频率,根据预测模型,确定在第二时段内与主题相关联的文档的数目,该第二时段在第一时段之后。
[0006]在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被有形地存储在非瞬态计算机存储介质中并且包括机器可执行指令。该机器可执行指令在由设备执行时使该设备执行根据本公开的第一方面所描述的方法的任意步骤。
[0007]提供
技术实现思路
部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
[0008]通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
[0009]图1示出了根据本公开的一些实施例能够在其中实现的示例环境的示意性框图;
[0010]图2示出了根据本公开的一些实施例的预测模型的示意图;
[0011]图3示出了根据本公开的一些实施例的用于主题趋势预测的示例方法的流程图;
[0012]图4示出了根据本公开的一些实施例的主题提取的示例框图;
[0013]图5示出了根据本公开的一些实施例的主题提取结果的示意图;
[0014]图6示出了根据本公开的一些实施例的主题趋势预测的示例输出结果与常规方案的输出结果的示意图;
[0015]图7示出了根据本公开的一些实施例的主题趋势预测的又一输出结果的示意图;以及
[0016]图8示出了可以用来实施本公开内容的实施例的示例设备的示意性框图。
[0017]在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
[0018]下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0019]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0020]在本公开的实施例中,术语“模型”能够处理输入并且提供相应输出。以神经网络模型为例,其通常包括输入层、输出层以及在输入层与输出层之间的一个或多个隐藏层。在深度学习应用中使用的模型(也称为“深度学习模型”)通常包括许多隐藏层,从而延长网络的深度。神经网络模型的各个层按顺序相连以使得前一层的输出被用作后一层的输入,其中输入层接收神经网络模型的输入,而输出层的输出作为神经网络模型的最终输出。神经网络模型的每个层包括一个或多个节点(也称为处理节点或神经元),每个节点处理来自上一层的输入。在本文中,术语“神经网络”、“模型”、“网络”和“神经网络模型”可互换使用。
[0021]如上所述,已经提出了一些方案来根据大量数据对各种主题诸如热门技术主题在未来的受关注情况进行预测。在一些常规方案中,通常根据各种主题在过去一段时间期间的受关注的频率来对各种主题在未来一段时间期间将会受关注的频率进行预测。例如,通过某一主题在发表于过去一段时间期间的论文中所出现的频率,来预测在未来一段时间期间将会发表的关于该主题的论文的数目。
[0022]然而,这种常规的主题趋势预测方式仅考虑了主题在过去一段时间期间的受关注频率,而没有考虑到影响主题趋势的其他因素。例如,某些主题彼此之间具有一定的相关性。某一主题的未来变化趋势有可能影响与之相关的其他主题的未来变化趋势。这种常规的主题趋势预测方式没有考虑到这种主题之间的相互影响。因而,这种常规方案的主题趋势预测的准确度有待进一步提高。
[0023]本公开的实施例提出了一种计算机实现的方法,以解决上述问题和/或其他潜在问题中的一个或多个。在该方案中,提取发布时间处在过去的一段时间内的一组文档各自
的主题。该方案还包括确定不同主题各自的语义信息和在该一组文档中出现的频率。该方案还包括基于主题的语义信息和频率,根据预测模型,确定在未来的一段时间内与该主题相关联的文档的数目。
[0024]以此方式,能够不仅考虑到主题在过去一段时间内出现的频率,还进一步考虑到主题本身的语义。通过考虑频率和语义两者,能够更好地对主题在未来受关注的趋势进行预测。特别是对于语义之间存在联系的多个主题,能够更好地对其未来趋势进行预测。以这样,所获得的主题未来趋势预测更有意义。
[0025]下面将参考附图来详细描述本公开的基本原理和若干示例实施例。
[0026]图1示出了根据本公开的一些实施例的用于对主题未来趋势进行预测的环境100的示意图。应当理解,图1示出的实体、元素和模块的数目和布置仅是示例,环境100中可以包括不同数目和不同布置方式的实体、元素和模块。
[0027]在图1的环境100中,计算系统120提取一组文档110各自的主题。该一组文档110中的每个文档的发布时间或发表时间处在第一时段内。例如,该一组文档110中的文档可以是期刊论文、新闻报道、专业书籍等多种类型的文档。计算系统120可以采用预设的算法或者预训练的主题提取模型等来提取一组文档110各自本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法,包括:提取发布时间处在第一时段内的一组文档各自的主题;确定所述主题各自的语义信息和在所述一组文档中出现的频率;以及基于所述主题的所述语义信息和所述频率,根据预测模型,确定在第二时段内与所述主题相关联的文档的数目,所述第二时段在所述第一时段之后。2.根据权利要求1所述的方法,其中确定所述语义信息包括:确定所述主题在所述第一时段内的语义表示时间序列。3.根据权利要求2所述的方法,其中确定所述语义表示时间序列包括:针对所述第一时段内的时间间隔点,基于所述一组文档中的发布时间不晚于所述时间间隔点的文档中对应于所述主题的单词或者对应于所述主题的短语中的单词,根据语义编码模型,确定所述语义表示时间序列在所述时间间隔点处的语义表示。4.根据权利要求1所述的方法,其中确定所述频率包括确定所述主题在所述第一时段内的频率表示时间序列。5.根据权利要求4所述的方法,其中确定所述频率表示时间序列包括:针对所述第一时段内的时间间隔点,基于所述一组文档中的发布时间不晚于所述时间间隔点的文档中与所述主题相对应的文档的数目,确定所述频率表示时间序列在所述时间间隔点处的频率表示。6.根据权利要求5所述的方法,其中确定在所述时间间隔点处的所述频率表示包括:基于所述数目,使用位置扩展编码,确定所述频率表示,所述频率表示具有预定的维度,所述预定的维度大于一维。7.根据权利要求1所述的方法,其中提取所述一组文档各自的主题包括:使用主题分类模型,提取所述一组文档各自的预定数目的主题。8.根据权利要求1所述的方法,其中确定在所述第二时段内与所述主题相关联的文档的数目包括:确定所述主题在所述第二时段内的数目时间序列,所述数目时间序列包括在所述第二时段内的各个时间间隔点处与所述主题相关联的文档的数目。9.一种电子设备,包括:至少一个处理器;以及存储有计算机程序指令的至少一个存储器,所述至少一个存储器和所述计算机程序指令被配置为,与所述至少一个处理器一起,使得所述电子设备执行动作,所述动作包括:提取发布时间处在第一时段内的一...

【专利技术属性】
技术研发人员:王子嘉倪嘉呈贾真
申请(专利权)人:伊姆西IP控股有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1