System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 对象分析方法、装置、计算机设备、可读存储介质和程序产品制造方法及图纸_技高网

对象分析方法、装置、计算机设备、可读存储介质和程序产品制造方法及图纸

技术编号:44453571 阅读:3 留言:0更新日期:2025-02-28 18:59
本申请涉及一种对象分析方法、装置、计算机设备、计算机可读存储介质和程序产品。该方法包括:获取目标对象对应的原始文本向量;原始文本向量包括原始文本向量对应的目标信息源;根据候选信息源与候选描述向量的对应关系确定目标信息源对应的目标描述向量;候选信息源为预先存储的多个形式的信息发布平台或渠道,每个候选信息源包含对应的候选描述向量,候选描述向量为各候选信息源的特征补充;基于预设大语言模型的子模型对目标描述向量和原始文本向量进行分析处理,得到原始文本向量的第一对象情绪向量;基于目标描述向量、原始文本向量、第一对象情绪向量和预设大语言模型确定目标对象对应的分析结果。采用本方法能够提高分析结果的准确度。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种数据分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、目前随着计算机技术的发展,基于自然语言处理技术对目标对象进行发展趋势分析的方式层出不穷。

2、传统技术中,常通过自然语言处理技术对内容进行文本分析,例如,目标是市场的变化趋势或者某个病人的身体健康状态,输入可以是市场相关的新闻、或者患者的各项检查报告这类文本资料。常见的自然语言处理流程要先对文章进行分词操作,并对各个单词进行分类和词频统计,最后基于对单词分类以及文本资料中相应分类词语数量的多寡,对观众的评价或患者的健康情况做判断,并用既有的一些规则对其进行趋势判断。

3、然而,这种基于传统语言学知识来分析文本信息的方法,其由于需要大量的前期先验知识和对应领域的积累,并且其考虑的方向有限,效果有限且无法快速迁移到其他领域。

4、目前也有一些基于大语言模型的情绪分析、趋势分析方法,其利用大语言模型的较强分类能力,让其对输入文本在人为圈定的方向上进行评价,再根据这些结果利用先验知识进行趋势分析和情绪判断。但由于其是在人为确定的方向上做判断,但各种输入信息的不确定性强、人为引入的方向不全面等因素导致其准确性较差。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种对象分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种对象分析方法,包括:

3、获取目标对象对应的原始文本向量;所述原始文本向量包括所述原始文本向量对应的目标信息源;

4、根据候选信息源与候选描述向量的对应关系确定所述目标信息源对应的目标描述向量;所述候选信息源为预先存储的多个形式的信息发布平台或渠道,每个所述候选信息源包含对应的所述候选描述向量,所述候选描述向量为各所述候选信息源的特征补充;

5、基于预设大语言模型的子模型对所述目标描述向量和所述原始文本向量进行分析处理,得到所述原始文本向量的第一对象情绪向量;

6、基于所述目标描述向量、所述原始文本向量、所述第一对象情绪向量和所述预设大语言模型确定所述目标对象对应的分析结果。

7、在其中一个实施例中,所述获取目标对象对应的原始文本向量之前,所述方法还包括:

8、获取多个候选信息源对应的待训练的初始描述向量、各所述候选信息源对应的样本数据和各所述样本数据对应的第一样本标签和第二样本标签;

9、根据预设大语言模型、各所述候选信息源对应的样本数据和各所述样本数据对应的第一样本标签对各所述候选信息源对应的初始描述向量进行训练,得到多个中间候选描述向量;

10、基于训练完成的子模型对所述样本数据进行分析处理,得到各所述样本数据对应的第二对象情绪向量;

11、根据预设大语言模型、所述样本数据、各所述样本数据对应的第一样本标签和所述第二对象情绪向量,对各所述候选信息源对应的中间候选描述向量进行再次训练,得到多个候选描述向量。

12、在其中一个实施例中,所述根据预设大语言模型、各所述候选信息源对应的样本数据和各所述样本数据对应的第一样本标签对各所述候选信息源对应的初始描述向量进行训练,得到多个中间候选描述向量,包括:

13、针对每一所述候选信息源,根据预设大语言模型对各所述候选信息源对应的样本数据和所述初始描述向量进行分析处理,得到初始分析结果;

14、根据所述初始分析结果和所述第一样本标签确定所述初始描述向量对应的第一损失值;

15、基于所述第一损失值对所述初始描述向量进行调整,得到新的初始描述向量,直至所述新的初始描述向量对应的第一损失值满足第一损失条件,得到多个中间候选描述向量。

16、在其中一个实施例中,所述基于训练完成的子模型对所述样本数据进行分析处理,得到各所述样本数据对应的第二对象情绪向量之前,所述方法还包括:

17、针对每一样本数据,将所述样本数据与所述样本数据对应的中间候选描述向量进行拼接,得到第一输入向量;

18、根据预设大语言模型的子模型对各所述第一输入向量与预设历史描述文本进行对比分析,得到初始情绪向量;

19、基于所述初始情绪向量和所述第二样本标签对所述子模型进行训练,得到训练完成的子模型。

20、在其中一个实施例中,所述基于所述初始情绪向量和所述第二样本标签对所述子模型进行训练,得到训练完成的子模型,包括:

21、基于所述初始情绪向量和所述第二样本标签确定所述子模型的第二损失值;

22、根据所述第二损失值对所述子模型的模型参数进行调整,直至所述第二损失值满足第二损失条件,得到训练完成的子模型。

23、在其中一个实施例中,所述子模型包含所述目标对象对应的历史描述文本;所述基于预设大语言模型的子模型对所述目标描述向量和所述原始文本向量进行分析处理,得到所述原始文本向量的第一对象情绪向量,包括:

24、将所述目标描述向量和所述原始文本向量进行拼接,得到第二输入向量;

25、根据所述子模型对所述历史描述文本和所述第二输入向量进行对比分析,并基于对比分析结果,确定所述原始文本向量对所述目标对象的状态影响,得到所述原始文本向量对应的第一对象情绪向量。

26、第二方面,本申请还提供了一种对象分析装置,包括:

27、第一获取模块,用于获取目标对象对应的原始文本向量;所述原始文本向量包括所述原始文本向量对应的目标信息源;

28、确定模块,用于根据候选信息源与候选描述向量的对应关系确定所述目标信息源对应的目标描述向量;所述候选信息源为预先存储的多个形式的信息发布平台或渠道,每个所述候选信息源包含对应的所述候选描述向量,所述候选描述向量为各所述候选信息源的特征补充;

29、第一分析模块,用于基于预设大语言模型的子模型对所述目标描述向量和所述原始文本向量进行分析处理,得到所述原始文本向量的第一对象情绪向量;

30、第二分析模块,用于基于所述目标描述向量、所述原始文本向量、所述第一对象情绪向量和所述预设大语言模型确定所述目标对象对应的分析结果;

31、在其中一个实施例中,所述装置还包括:

32、第二获取模块,用于获取多个候选信息源对应的待训练的初始描述向量、各所述候选信息源对应的样本数据和各所述样本数据对应的第一样本标签和第二样本标签;

33、第一训练模块,用于根据预设大语言模型、各所述候选信息源对应的样本数据和各所述样本数据对应的第一样本标签对各所述候选信息源对应的初始描述向量进行训练,得到多个中间候选描述向量;

34、第三分析模块,用于基于训练完成的子模型对所述样本数据进行分析处理,得到各所述样本数据对应的第二对象情绪向量;

35、第二训练模块,用于根据预设大语言模型、所述样本数据、各所述样本数据对应的第一样本本文档来自技高网...

【技术保护点】

1.一种对象分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标对象对应的原始文本向量之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据预设大语言模型、各所述候选信息源对应的样本数据和各所述样本数据对应的第一样本标签对各所述候选信息源对应的初始描述向量进行训练,得到多个中间候选描述向量,包括:

4.根据权利要求2所述的方法,其特征在于,所述基于训练完成的子模型对所述样本数据进行分析处理,得到各所述样本数据对应的第二对象情绪向量之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述初始情绪向量和所述第二样本标签对所述子模型进行训练,得到训练完成的子模型,包括:

6.根据权利要求1所述的方法,其特征在于,所述子模型包含所述目标对象对应的历史描述文本;所述基于预设大语言模型的子模型对所述目标描述向量和所述原始文本向量进行分析处理,得到所述原始文本向量的第一对象情绪向量,包括:

7.一种对象分析装置,其特征在于,所述装置包括:p>

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种对象分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标对象对应的原始文本向量之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据预设大语言模型、各所述候选信息源对应的样本数据和各所述样本数据对应的第一样本标签对各所述候选信息源对应的初始描述向量进行训练,得到多个中间候选描述向量,包括:

4.根据权利要求2所述的方法,其特征在于,所述基于训练完成的子模型对所述样本数据进行分析处理,得到各所述样本数据对应的第二对象情绪向量之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述初始情绪向量和所述第二样本标签对所述子模型进行训练,得到训练完成的子模型,包括:

6.根据权...

【专利技术属性】
技术研发人员:白帆
申请(专利权)人:中电金信软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1