分析样本的方法、电子设备和计算机程序产品技术

技术编号:36733268 阅读:11 留言:0更新日期:2023-03-04 10:02
本公开的实施例提供了一种分析样本的方法、电子设备和计算机程序产品。该方法包括获取与一组样本相关联的一组特征表示。在此,一组样本具有用于指示一组样本的分类的分类信息。该方法还包括调整一组特征表示,使得与相同分类对应的样本的特征表示之间的距离小于第一距离阈值。该方法还包括基于经调整的一组特征表示和分类信息,训练分类模型。在此,分类模型被配置为接收输入样本并确定输入样本的分类。以此方式,能够使用少量的样本训练出相对精确的分类模型,从而降低计算时间和所需的计算容量。计算容量。计算容量。

【技术实现步骤摘要】
分析样本的方法、电子设备和计算机程序产品


[0001]本公开的实施例涉及计算机领域,并且更具体地,涉及分析样本的方法、电子设备和计算机程序产品。

技术介绍

[0002]在进行机器学习时,会使用大量的样本进行训练。由于收集和注释用于训练的大量样本会使得成本很高,因此从有限数量的训练样本来进行训练越来越受到关注。利用较少样本进行训练的机器学习也被称为小样本学习(Few

Shot Learning)。对此,已知有两种研究方向,其中一种是研究训练模型,以使模型能够适于利用较少的样本来进行训练。而另一种是,研究对训练集中的少量样本的处理,以提高样本的泛化性能。

技术实现思路

[0003]本公开的实施例提供了一种分析样本的方案。
[0004]在本公开的第一方面中,提供了一种分析样本的方法,包括获取与一组样本相关联的一组特征表示,一组样本具有用于指示一组样本的分类的分类信息。该方法还包括调整一组特征表示,使得与相同分类对应的样本的特征表示之间的距离小于第一距离阈值。该方法还包括基于经调整的一组特征表示和分类信息,训练分类模型。分类模型被配置为接收输入样本并确定输入样本的分类。
[0005]在本公开的第二方面中,提供了一种分析样本的方法,包括获取输入样本。该方法还包括利用分类模型处理所述输入样本,以确定所述输入样本的分类。分类模型是基于本公开的第一方面的方法被训练的。
[0006]在本公开的第三方面中,提供了一种电子设备。该电子设备包括处处理器;以及与所述处理器耦合的存储器,存储器具有存储于其中的指令,指令在被处理器执行时使所述设备执行动作,动作包括获取与一组样本相关联的一组特征表示,一组样本具有用于指示一组样本的分类的分类信息。动作还包括调整一组特征表示,使得与相同分类对应的样本的特征表示之间的距离小于第一距离阈值。动作还包括基于经调整的一组特征表示和分类信息,训练分类模型,分类模型被配置为接收输入样本并确定输入样本的分类。
[0007]在本公开的第四方面中,提供了一种电子设备。该电子设备包括处理器;以及与处理器耦合的存储器,存储器具有存储于其中的指令,指令在被处理器执行时使所述设备执行动作,动作包括获取输入样本。动作还包括利用分类模型处理所述输入样本,以确定输入样本的分类,其中分类模型是基于本公开的第一方面的方法被训练的。
[0008]在本公开的第五方面中,提供了一种计算机程序产品,计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器执行根据第一方面和/或第二方面的方法。
[0009]提供
技术实现思路
部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识本公开的关键特征或主要特征,也无意
限制本公开的范围。
附图说明
[0010]通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。在附图中:
[0011]图1示出了本公开的实施例可以在其中被实现的示例环境的示意图;
[0012]图2示出了根据本公开的实施例的分析样本的示例方法的流程图;
[0013]图3A示出了根据本公开的一些实施例的特征表示的示例分布的示意图;
[0014]图3B示出了根据本公开的一些实施例的经校准的示例分布的示意图;
[0015]图3C示出了根据本公开的一些实施例的经调整的示例分布的示意图;
[0016]图4示出了根据本公开的实施例的样本分类的示例方法的流程图;以及
[0017]图5示出了可以用来实施本公开的实施例的示例设备的框图。
具体实施方式
[0018]下面将参考附图中示出的若干示例实施例来描述本公开的原理。虽然附图中显示了本公开的优选实施例,但应当理解,描述这些实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。
[0019]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0020]如上文所讨论的,从少量样本中进行训练是困难的,因为仅从少量的训练样本中可能无法概括出样本真实的分布特性,进而无法训练出准确的模型。
[0021]对此,本公开提出了一种分析样本的方案。通过获取与样本相关联的特征表示,得到比原来的原本数据维度低的、能够表征原来样本的特征数据。通过对特征表示进行调整,使得与相同分类对应的样本的特征表示在特征空间中的分布更加集中,从而使得与不同分类对应的特征表示的分布更容易被区分。通过使用经调整的特征表示及其分类信息来训练模型,能够使训练出的模型更加准确,从而只使用少量的样本便能够完成对模型的训练。
[0022]示例环境
[0023]图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。如图1所示,环境100包括计算设备140,计算设备140例如可以是具有较强计算能力的设备,其示例包括但不限于:云侧服务器、智能手机、笔记本电脑、平板电脑、台式机或边缘计算设备等。
[0024]根据本公开的实施例,计算设备140可以获取一组样本,并通过特征提取器获得了样本的特征表示空间110。在特征表示空间110中,示出了与第一分类对应的样本的特征表示111在特征表示空间110中的第一特征分布121、与第二分类对应的样本的特征表示112在特征表示空间110中的第二特征分布122、与第三分类对应的样本的特征表示113在特征表
示空间110中的第三特征分布123、与第四分类对应的样本的特征表示114在特征表示空间110中的第四特征分布124以及与第五分类对应的样本的特征表示115在特征表示空间110中的第二特征分布125。计算设备140利用特征表示的特征分布所具有的特性来训练分类器。在图1中示出了与所训练出的分类器对应的分类空间130。分类空间130根据样本的特征分布被划分为与第一分类对应的样本所属于的第一分类区域131、与第二分类对应的样本所属于的第二分类区域132、与第三分类对应的样本所属于的第三分类区域133、与第四分类对应的样本所属于的第四分类区域134以及与第五分类对应的样本所属于的第五分类区域135。利用划分的区域便能够判断样本对应于哪个分类。
[0025]应当理解,图1中所示出的具体样本的分类以及数量仅是示例性的,不旨在作为对本公开的限定。
[0026]示例方法
[0027]下文将结合图2至图4来详细说明本公开的示例实施例。图2示出了根据本公开的实施例的分析样本的示例方法200的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分析样本的方法,包括:获取与一组样本相关联的一组特征表示,所述一组样本具有用于指示所述一组样本的分类的分类信息;调整所述一组特征表示,使得与相同分类对应的样本的特征表示之间的距离小于第一距离阈值;以及基于经调整的所述一组特征表示和所述分类信息,训练分类模型,所述分类模型被配置为接收输入样本并确定所述输入样本的分类。2.根据权利要求1所述的方法,其中获取与一组样本相关联的一组特征表示包括:利用特征提取模型处理所述一组样本,以确定与所述一组样本相关联的一组初始特征表示;校准所述一组初始特征表示的分布,使得特征表示的分布的偏度小于偏度阈值;以及基于经校准的所述一组初始特征表示,确定与所述一组样本相关联的所述一组特征表示。3.根据权利要求1所述的方法,其中调整所述一组特征表示包括:调整所述一组特征表示,使得与不同分类对应的样本的特征表示之间的距离大于第二距离阈值。4.根据权利要求3所述的方法,其中调整所述一组特征表示包括:通过使基于以下项的损失函数最小化来确定调整矩阵:所述一组特征表示中特征表示对之间的特征距离和与所述特征距离相关联的距离参数;以及基于所述调整矩阵来调整所述一组特征表示。5.根据权利要求4所述的方法,其中所述距离参数是基于所述特征表示对是否具有相同分类而被确定的。6.一种对样本分类的方法,包括:获取输入样本;以及利用分类模型处理所述输入样本,以确定所述输入样本的分类,其中所述分类模型是基于以下过程而被训练的:获取与一组样本相关联的一组特征表示,所述一组样本具有用于指示所述一组样本的分类的分类信息;调整的所述一组特征表示,使得与相同分类对应的样本的特征表示之间的距离小于第一距离阈值;以及基于经调整的所述一组特征表示和所述分类信息,训练分类模型。7.一种电子设备,包括:处理器;以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被处理器执行时使所述设备执行动作,所述动作包括:获取与一组样本相关联的一组特征表示,所述一组样本具有用于指示所述一组样本的分类的分...

【专利技术属性】
技术研发人员:王子嘉倪嘉呈贾真杨文彬
申请(专利权)人:伊姆西IP控股有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1