System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型评估的方法、装置、电子设备和计算机程序产品制造方法及图纸_技高网

模型评估的方法、装置、电子设备和计算机程序产品制造方法及图纸

技术编号:43483359 阅读:5 留言:0更新日期:2024-11-29 16:55
本公开的实施例涉及模型评估的方法、装置、电子设备和计算机程序产品。该方法包括基于指示从多个评估策略中选择用于评估目标模型的评估策略的用户输入,发送用于执行所选择的评估策略的请求。此外,该方法还包括获取请求的执行结果,执行结果至少包括目标模型的评估结果。通过本公开的实施例,能够高效地完成模型评估,提高评估效率,缩短模型的开发周期,加快模型的迭代,并且还能够降低开发模型评估任务的难度,使更多用户能够参与模型的评估过程。

【技术实现步骤摘要】

本申请涉及计算机,尤其具体地涉及模型评估的方法、装置、电子设备以及计算机程序产品。


技术介绍

1、大模型通过海量数据训练,具备了强大的泛化能力和卓越的性能,能够应对复杂的任务和多样的应用场景。不仅如此,大模型还在医学、金融、自动驾驶等多个领域展现出巨大的潜力和应用前景,推动了人工智能技术的全面发展和广泛应用,成为当前科技创新的重要驱动力。

2、大模型在各个领域的应用越来越广泛,其性能和可靠性直接影响实际应用效果。通过模型评估,可以揭示大模型在不同应用场景下的表现差异,并为模型优化提供依据。因此,大模型的评估变得尤为重要。


技术实现思路

1、本公开的实施例提供了一种模型评估的方法、装置、电子设备、计算机程序产品以及介质。

2、根据本公开的第一方面,提供了一种模型评估的方法。该方法包括基于指示从多个评估策略中选择用于评估目标模型的评估策略的用户输入,发送用于执行所选择的所述评估策略的请求,所述多个评估策略被发布在策略系统上,所述策略系统被配置为:创建所述评估策略的策略文件,所述策略文件被保存在数据库中;设置用于执行所述评估策略所需的依赖项;以及将所述评估策略发布到所述策略系统中的策略服务上。此外,该方法还包括获取所述请求的执行结果,所述执行结果至少包括所述目标模型的评估结果。

3、根据本公开的第二方面,提供了一种模型评估的装置。该装置包括请求发送模块,被配置为基于指示从多个评估策略中选择用于评估目标模型的评估策略的用户输入,发送用于执行所选择的所述评估策略的请求,所述多个评估策略被发布在策略系统上,所述策略系统包括:策略创建模块,被配置为创建所述评估策略的策略文件,所述策略文件被保存在数据库中;依赖设置模块,被配置为设置用于执行所述评估策略所需的依赖项;以及策略发布模块,被配置为将所述评估策略发布到所述策略系统中的策略服务上。此外,该装置还包括结果获取模块,被配置为获取所述请求的执行结果,所述执行结果至少包括所述目标模型的评估结果。

4、根据本公开的第三方面,提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器,存储器具有存储于其中的指令,指令在被处理器执行时使电子设备执行根据第一方面所述的方法。

5、在本公开的第四方面中,提供了一种计算机可读存储介质。该计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,所述计算机可执行指令在被执行时使得计算机执行本公开的第一方面的方法的步骤。

6、在本公开的第五方面中,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据第一方面所述的方法。

7、
技术实现思路
部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识要求保护的主题的关键特征或主要特征,也无意限制要求保护的主题的范围。

本文档来自技高网...

【技术保护点】

1.一种模型评估的方法,包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1所述的方法,其中所述评估策略包括运行策略和评分策略,并且接收所述用户输入包括:

4.根据权利要求3所述的方法,其中发送用于执行所选择的所述评估策略的请求包括:

5.根据权利要求4所述的方法,其中获取所述请求的所述执行结果包括获取所述第一请求的第一执行结果,并且所述方法还包括:

6.根据权利要求4所述的方法,其中获取所述请求的所述执行结果包括获取所述第二请求的第二执行结果,并且所述方法还包括:

7.根据权利要求1所述的方法,其中所述评估策略的标识符为所述策略文件在所述数据库的数据表中的键值。

8.根据权利要求7所述的方法,还包括:

9.根据权利要求8所述的方法,其中执行所述评估策略所需的依赖项在依赖文件中指定,并且将所述评估策略发布到所述策略系统中的所述策略服务中包括:

10.根据权利要求8所述的方法,其中所述评估策略包括已发布的功能函数。

11.一种模型评估的装置,包括:</p>

12.一种电子设备,包括:

13.一种计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,所述计算机可执行指令用于执行根据权利要求1至10中的任一项所述的方法。

...

【技术特征摘要】

1.一种模型评估的方法,包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1所述的方法,其中所述评估策略包括运行策略和评分策略,并且接收所述用户输入包括:

4.根据权利要求3所述的方法,其中发送用于执行所选择的所述评估策略的请求包括:

5.根据权利要求4所述的方法,其中获取所述请求的所述执行结果包括获取所述第一请求的第一执行结果,并且所述方法还包括:

6.根据权利要求4所述的方法,其中获取所述请求的所述执行结果包括获取所述第二请求的第二执行结果,并且所述方法还包括:

7.根据权利要求1所述的方法,其中所述评估策略的标识符...

【专利技术属性】
技术研发人员:廖敏张洋付尧孟嘉霖刘武利张晓亮刘柏缨
申请(专利权)人:北京火山引擎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1