System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 智能对话方法及相关装置、电子设备和存储介质制造方法及图纸_技高网

智能对话方法及相关装置、电子设备和存储介质制造方法及图纸

技术编号:44068597 阅读:5 留言:0更新日期:2025-01-17 16:06
本申请公开了一种智能对话方法及相关装置、电子设备和存储介质,其中,智能对话方法包括:基于待回复的第一语句,提取得到初始语句特征;基于初始语句特征进行线性量化,得到量化语句特征,并按照智能对话模型中网络层的执行顺序,逐个加载网络层的目标计算参数;基于量化语句特征与目标量化参数,得到第一输出特征,并基于初始语句特征与量化语句特征之间的差异语句特征和目标权重参数,得到第二输出特征;融合第一输出特征和第二输出特征,作为新的初始语句特征,并返回基于初始语句特征进行线性量化,得到量化语句特征的步骤,直至各个网络层执行完毕,得到用于回复的第二语句。上述方案,能够升设备智能对话的响应速度和响应精度。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种智能对话方法及相关装置、电子设备和存储介质


技术介绍

1、随着诸如大语言模型等智能对话模型的爆发式发展,智能对话模型已经逐渐推广应用到诸如生活、办公、商务、教育、开发众多场景。

2、但是,由于智能对话模型通常具有亿级别、十亿级别,甚至千亿级别的海量参数,故无论是存储还是前向推理,都需要较大的硬件成本。有鉴于此,如何减少智能对话的内存消耗,以提升设备智能对话的响应速度,尽可能地确保设备智能对话的响应精度,成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种智能对话方法及相关装置、电子设备和存储介质,能够减少智能对话的内存消耗,以提升设备智能对话的响应速度,并尽可能地确保设备智能对话的响应精度。

2、为了解决上述技术问题,本申请第一方面提供了一种智能对话方法,包括:基于待回复的第一语句,提取得到初始语句特征;基于初始语句特征进行线性量化,得到量化语句特征,并按照智能对话模型中网络层的执行顺序,逐个加载网络层的目标计算参数;其中,网络层的目标计算参数包括网络层关于线性量化的目标量化参数和网络层用于补偿量化误差的目标权重参数;基于量化语句特征与目标量化参数,得到第一输出特征,并基于初始语句特征与量化语句特征之间的差异语句特征和目标权重参数,得到第二输出特征;融合第一输出特征和第二输出特征,作为新的初始语句特征,并返回基于初始语句特征进行线性量化,得到量化语句特征的步骤,直至各个网络层执行完毕,得到用于回复的第二语句。

3、为了解决上述技术问题,本申请第二方面提供了一种智能对话装置,包括:提取模块、量化模块、执行模块和循环模块,提取模块,用于基于待回复的第一语句,提取得到初始语句特征;量化模块,用于基于初始语句特征进行线性量化,得到量化语句特征,并按照智能对话模型中网络层的执行顺序,逐个加载网络层的目标计算参数;其中,网络层的目标计算参数包括网络层关于线性量化的目标量化参数和网络层用于补偿量化误差的目标权重参数;执行模块,用于基于量化语句特征与目标量化参数,得到第一输出特征,并基于初始语句特征与量化语句特征之间的差异语句特征和目标权重参数,得到第二输出特征;循环模块,用于融合第一输出特征和第二输出特征,作为新的初始语句特征,并返回基于初始语句特征进行线性量化,得到量化语句特征的步骤,直至各个网络层执行完毕,得到用于回复的第二语句。

4、为了解决上述技术问题,本申请第三方面提供了一种电子设备,至少包括相互耦接的存储器和处理器,存储器中至少存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的智能对话方法。

5、为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的智能对话方法。

6、上述方案,基于待回复的第一语句,提取得到初始语句特征,基于初始语句特征进行线性量化,得到量化语句特征,并按照智能对话模型中网络层的执行顺序,逐个加载网络层的目标计算参数,且网络层的目标计算参数包括网络层关于线性量化的目标量化参数和网络层用于补偿量化误差的目标权重参数,再基于量化语句特征与目标量化参数,得到第一输出特征,并初始语句特征与量化语句特征之间的差异语句特征和目标权重参数,得到第二输出特征,从而融合第一输出特征和第二输出特征,作为新的初始语句特征,并返回基于初始语句特征进行线性量化,得到量化语句特征的步骤,直至各个网络层执行完毕,得到用于回复的第二语句,故一方面能够通过线性量化减少智能对话的内存消耗,另一方面通过用于补偿量化误差的目标权重参数和初始语句特征与量化语句特征之间差异语句特征,有助于尽可能地补偿由于存在离群值等因素而导致的量化误差。故此,能够减少智能对话的内存消耗,以提升设备智能对话的响应速度,并尽可能地确保设备智能对话的响应精度。

本文档来自技高网...

【技术保护点】

1.一种智能对话方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述目标权重参数的获取步骤包括:

3.根据权利要求1所述的方法,其特征在于,所述目标量化参数包括所述网络层在线性量化时的第一比例系数、所述网络层经线性量化之后的量化权重参数和在执行所述网络层之前用于对所述初始语句特征线性量化的第二比例系数,所述基于所述量化语句特征与所述目标量化参数,得到第一输出特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述量化语句特征、所述量化权重参数和所述第一比例系数均以矩阵表示,且所述第二比例系数以标量表示,所述基于所述量化语句特征、所述量化权重参数、所述第一比例系数和所述第二比例系数执行点乘运算,得到所述第一输出特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述初始语句特征与所述量化语句特征之间的差异语句特征和所述目标权重参数,得到第二输出特征,包括:

6.根据权利要求1所述的方法,其特征在于,所述目标量化参数至少包括所述网络层在线性量化时的第一比例系数,所述第一比例系数包含所述网络层各个通道的量化比例系数,所述第一比例系数的获取步骤包括:

7.根据权利要求1所述的方法,其特征在于,所述目标量化参数至少包括在执行所述网络层之前用于对所述初始语句特征线性量化的第二比例系数,对于任一所述网络层,所述第二比例系数的获取步骤包括:

8.根据权利要求1所述的方法,其特征在于,所述目标量化参数至少包括所述网络层在线性量化时的第一比例系数,以及在执行所述网络层之前用于对所述初始语句特征线性量化的第二比例系数,在利用所述智能对话模型进行智能对话之前,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述目标量化参数还包括所述网络层经线性量化之后的量化权重参数,所述方法还包括:

10.一种智能对话装置,其特征在于,包括:

11.一种电子设备,其特征在于,至少包括相互耦接的存储器和处理器,所述存储器中至少存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至9任一项所述的智能对话方法。

12.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至9任一项所述的智能对话方法。

...

【技术特征摘要】

1.一种智能对话方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述目标权重参数的获取步骤包括:

3.根据权利要求1所述的方法,其特征在于,所述目标量化参数包括所述网络层在线性量化时的第一比例系数、所述网络层经线性量化之后的量化权重参数和在执行所述网络层之前用于对所述初始语句特征线性量化的第二比例系数,所述基于所述量化语句特征与所述目标量化参数,得到第一输出特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述量化语句特征、所述量化权重参数和所述第一比例系数均以矩阵表示,且所述第二比例系数以标量表示,所述基于所述量化语句特征、所述量化权重参数、所述第一比例系数和所述第二比例系数执行点乘运算,得到所述第一输出特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述初始语句特征与所述量化语句特征之间的差异语句特征和所述目标权重参数,得到第二输出特征,包括:

6.根据权利要求1所述的方法,其特征在于,所述目标量化参数至少包括所述网络层在线性量化时的第一比例系数,所述第一比例系数包含所述网络层各个通道的量化比...

【专利技术属性】
技术研发人员:吕亚飞涂思奇于振华
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1