对象筛选方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:35133314 阅读:23 留言:0更新日期:2022-10-05 10:07
本申请实施例提供了一种对象筛选方法、装置、电子设备、存储介质及程序产品,涉及人工智能、图像处理、大数据等领域,该方法基于已构建的能量模型,确定目标对象数据集的各个数据子集被筛选出的概率分布信息,其中,针对任一数据子集,基于能量模型对目标对象顺序变换后的数据子集确定的概率分布信息是相同的,即能量模型具有置换不变性,可以实现基于能量模型的对象筛选过程与目标对象数据集中各个目标对象的顺序无关,进而根据概率分布信息,从各个数据子集中确定至少一个目标数据子集,以得到对象筛选结果,能够实现较高的对象筛选精度。能够实现较高的对象筛选精度。能够实现较高的对象筛选精度。

【技术实现步骤摘要】
对象筛选方法、装置、电子设备、存储介质及程序产品


[0001]本申请涉及机器学习
,具体而言,本申请涉及一种对象筛选方法、装置、电子设备、存储介质及程序产品。

技术介绍

[0002]子集抽样是机器学习领域重要的研究问题,并且在现实生活中有广泛的应用场景,例如商品推荐等。
[0003]现有的子集抽样方法往往和抽样顺序相关,例如在商品推荐的场景中,推荐完第一个商品后,第一个商品会影响推荐第二个商品的选择。
[0004]然而,在现实生活中,子集抽样受集合中元素排列顺序的影响,会降低抽样精度。

技术实现思路

[0005]本申请实施例的目的旨在能解决子集抽样受集合中元素排列顺序的影响,导致的抽样精度降低的问题。
[0006]根据本申请实施例的一个方面,提供了一种对象筛选,该方法包括:
[0007]获取目标对象数据集,目标对象数据集中包括多个待筛选的目标对象;
[0008]基于已构建的能量模型,确定目标对象数据集的各个数据子集被筛选出的概率分布信息,其中,针对任一数据子集,基于能量模型对目标对象顺序变换后的数据子集确定的概率分布信息是相同的;
[0009]根据概率分布信息,从各个数据子集中确定至少一个目标数据子集,以得到对象筛选结果。
[0010]根据本申请实施例的另一个方面,提供了一种对象筛选装置,该装置包括:
[0011]获取模块,用于获取目标对象数据集,目标对象数据集中包括多个待筛选的目标对象;
[0012]确定模块,用于基于已构建的能量模型,确定目标对象数据集的各个数据子集被筛选出的概率分布信息,其中,针对任一数据子集,基于能量模型对目标对象顺序变换后的数据子集确定的概率分布信息是相同的;
[0013]筛选模块,用于根据概率分布信息,从各个数据子集中确定至少一个目标数据子集,以得到对象筛选结果。
[0014]根据本申请实施例的又一个方面,提供了一种电子设备,该电子设备包括:存储器、处理器及存储在存储器上的计算机程序,处理器执行计算机程序以实现本申请实施例提供的对象筛选方法的步骤。
[0015]根据本申请实施例的再一个方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现本申请实施例提供的对象筛选方法的步骤。
[0016]根据本申请实施例的还一个方面,提供了一种计算机程序产品,该计算机程序产
品包括计算机程序,计算机程序被处理器执行时实现本申请实施例提供的对象筛选方法的步骤。
[0017]本申请实施例提供的对象筛选方法、装置、电子设备、存储介质及程序产品,基于已构建的能量模型,确定目标对象数据集的各个数据子集被筛选出的概率分布信息,其中,针对任一数据子集,基于能量模型对目标对象顺序变换后的数据子集确定的概率分布信息是相同的,即能量模型具有置换不变性,可以实现基于能量模型的对象筛选过程与目标对象数据集中各个目标对象的顺序无关,进而根据概率分布信息,从各个数据子集中确定至少一个目标数据子集,以得到对象筛选结果,能够实现较高的对象筛选精度。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
[0019]图1为本申请实施例提供的一种对象筛选方法的流程示意图;
[0020]图2为本申请实施例提供的目标对象数据集及各个数据子集的关系的示意图;
[0021]图3为本申请实施例提供的子集的各置换结果的示意图;
[0022]图4为本申请实施例提供的建模置换不变性的示意图;
[0023]图5为本申请实施例提供的一种图像检测结果的示意图;
[0024]图6为本申请实施例提供的药物发现中的化合物选择的示意图;
[0025]图7为本申请实施例提供的一种实施环境的架构示意图;
[0026]图8为本申请实施例提供的一种对象筛选装置的结构示意图;
[0027]图9为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0028]下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
[0029]本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本
所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。
[0030]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[0031]首先对本申请涉及的几个名词进行介绍和解释:
[0032](1)人工智能(Artificial Intelligence,AI):AI是利用数字计算机或者数字计
算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0033](2)机器学习(Machine Learning,ML):ML是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
[0034](3)集合函数:集合函数的处理对象(即定义域)是集合。
[0035](4)变分(Variations):变分法是处理泛函(以函数为变量的函数)的数学手段,它最终寻求的是极值函数,使得泛函取得极大值或极小值。变分推断(Variational Inference,VI)是变分法在推断问题中的应用,针对无法直接求得的后验概率密度,通过推断一个分布来近似后验概率密度,便可将推断问题转换为一个泛函优化问题。
[0036](5)平均场(Mean Field,MF):平均场理论平是将模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象筛选方法,其特征在于,包括:获取目标对象数据集,所述目标对象数据集中包括多个待筛选的目标对象;基于已构建的能量模型,确定所述目标对象数据集的各个数据子集被筛选出的概率分布信息,其中,针对任一数据子集,基于所述能量模型对目标对象顺序变换后的数据子集确定的概率分布信息是相同的;根据所述概率分布信息,从所述各个数据子集中确定至少一个目标数据子集,以得到对象筛选结果。2.根据权利要求1所述的对象筛选方法,其特征在于,所述任一数据子集的概率与通过以下方式得到的特征变换结果成正比:将所述任一数据子集中的各目标对象分别映射为第一维度的向量,得到所述任一数据子集的第一特征变换结果;将所述任一数据子集中的目标对象的个数作为向量的第二维度,并将所述第一特征变换结果基于所述第二维度进行融合,得到融合结果;将所述融合结果进行非线性变换,得到第二特征变换结果。3.根据权利要求1所述的对象筛选方法,其特征在于,所述基于已构建的能量模型,确定所述目标对象数据集的各个数据子集被筛选出的概率分布信息,包括:确定所述各个数据子集分别被筛选出的概率表示;将各个所述概率表示进行指数归一化,得到所述各个数据子集被筛选出的概率分布信息。4.根据权利要求1

3任一项所述的对象筛选方法,其特征在于,所述基于已构建的能量模型,确定所述目标对象数据集的各个数据子集被筛选出的概率分布信息,包括:基于优化后的变分模型来变分推断所述能量模型针对所述各个数据子集的输出结果,得到所述各个数据子集被筛选出的概率分布信息,其中,所述优化后的变分模型使得所述概率分布信息与所述输出结果之间的距离最小化。5.根据权利要求4所述的对象筛选方法,其特征在于,所述变分模型是通过以下方式进行优化的:获取与所述目标对象的类型相关的训练样本,所述训练样本包括第一集合样本和第二集合样本,所述第二集合样本是所述第一集合样本的子集;基于所述训练样本,对所述变分模型的参数进行迭代优化;其中,对于每次优化,基于所述变分模型,计算所述第一集合样本的变分参数,若基于所述变分参数和所述第二集合样本,确定满足训练结束条...

【专利技术属性】
技术研发人员:欧子菁卞亚涛徐挺洋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1