System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型检测方法及相关设备技术_技高网

模型检测方法及相关设备技术

技术编号:44894716 阅读:8 留言:0更新日期:2025-04-08 00:34
本申请公开一种模型检测方法及相关设备,用以解决现有技术存在的如何识别大模型是否出现AI幻觉的问题。方法包括:获取模型输出的第一预测语句,以及确定所述预测语句中包括的多个专有名词;确定每个所述专有名词的第一兼容度,得到多个第一兼容度,所述第一兼容度用于表征所述专有名词的义素与第一词的义素的兼容程度,所述第一词与所述专有名词同属于所述第一预测语句;基于所述多个第一兼容度和所述多个第一兼容度呈现的数值分布,确定所述模型是否出现人工智能幻觉。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种模型检测方法、装置、设备、计算机可读存储介质与计算机程序产品。


技术介绍

1、大模型(large model),是指具有数百万或数十亿个参数的深度神经网络模型,这种模型经过专门的训练过程,能够对大规模数据进行复杂的处理和任务处理。

2、在实际场景中,向大模型询问一个不存在的历史事件,大模型也可能会提供一个虚构的预测语句,这种现象被称为人工智能(artificial intelligence,ai)幻觉。

3、如何识别大模型是否出现ai幻觉,以便根据识别结果执行相应操作,如对在出现ai幻觉的情况下输出的预测语句进行纠错、重新训练大模型等,是当前亟待解决的问题。


技术实现思路

1、本申请实施例提供一种模型检测方法、装置、设备、计算机可读存储介质和计算机程序产品。

2、本申请实施例采用下述技术方案:

3、一种模型检测方法,包括:获取模型输出的第一预测语句,以及确定所述第一预测语句中包括的多个专有名词;确定每个所述专有名词的第一兼容度,得到多个第一兼容度,所述第一兼容度用于表征所述专有名词的义素与第一词的义素的兼容程度,所述第一词与所述专有名词同属于所述第一预测语句;基于所述多个第一兼容度和所述多个第一兼容度呈现的数值分布,确定所述模型是否出现人工智能幻觉。

4、一种模型检测装置,包括:获取单元,用于获取模型输出的第一预测语句,以及确定所述第一预测语句中包括的多个专有名词;兼容度确定单元,用于确定每个所述专有名词的第一兼容度,得到多个第一兼容度,所述第一兼容度用于表征所述专有名词的义素与第一词的义素的兼容程度,所述第一词与所述专有名词同属于所述第一预测语句;检测结果确定单元,用于基于所述多个第一兼容度和所述多个第一兼容度呈现的数值分布,确定所述模型是否出现人工智能幻觉。

5、一种计算设备,包括:存储器及处理器,其中,所述存储器,用于存储计算机程序;所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述计算机程序,以用于执行上述的方法。

6、一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述的方法。

7、一种计算机程序产品,所述计算机程序产品存储有指令,所述指令在由计算机执行时,使得所述计算机实施上述方法。

8、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:

9、ai模型若未出现ai幻觉,则其输出的预测语句中的专有名词的第一兼容度会较高;同时,多个专有名词的第一兼容度呈现的数值分布也会与预期数值分布类型相匹配。本申请实施例基于上述特点,以“多个专有名词的第一兼容度”以及“多个第一兼容度呈现的数值分布”,作为判断ai模型是否出现ai幻觉的判断依据,从而提供了一种有效识别大模型是否出现ai幻觉的方案。

本文档来自技高网...

【技术保护点】

1.一种模型检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述多个第一兼容度和所述多个第一兼容度呈现的数值分布,确定所述模型是否出现人工智能幻觉,包括:

3.根据权利要求1所述的方法,其特征在于,在确定所述模型出现人工智能幻觉之后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述从预设词库中获取第四词,包括:

5.如权利要求1所述的方法,其特征在于,所述确定所述专有名词的第一兼容度,包括:

6.如权利要求3或4所述的方法,其特征在于,所述模型基于第一训练样本训练得到,所述方法还包括:

7.一种模型检测装置,其特征在于,包括:

8.一种计算设备,其特征在于,包括:存储器及处理器,其中,

9.一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现权利要求1~6任一权项所述的方法。

10.一种计算机程序产品,其特征在于,所述计算机程序产品存储有指令,所述指令在由计算机执行时,使得所述计算机实施权利要求1~6任一权项所述的方法。

...

【技术特征摘要】

1.一种模型检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述多个第一兼容度和所述多个第一兼容度呈现的数值分布,确定所述模型是否出现人工智能幻觉,包括:

3.根据权利要求1所述的方法,其特征在于,在确定所述模型出现人工智能幻觉之后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述从预设词库中获取第四词,包括:

5.如权利要求1所述的方法,其特征在于,所述确定所述专有名词的第一兼容度,包括:

6....

【专利技术属性】
技术研发人员:白安琪
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1