System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 金融投资风险提示方法和装置制造方法及图纸_技高网

金融投资风险提示方法和装置制造方法及图纸

技术编号:41769073 阅读:1 留言:0更新日期:2024-06-21 21:46
本发明专利技术提供了一种金融投资风险提示方法和装置,涉及人工智能及金融技术领域,方法包括:获取金融投资论坛最近预设时间段内的评论文本数据;将评论文本数据根据文本长度划分成长文本数据和短文本数据并分别输入长文本情绪预测模型和短文本情绪预测模型,记录模型所输出的对应的情绪分类标签;获取评论文本数据所对应的用户画像数据;根据预设规则对不同用户画像所对应的情绪分类标签进行赋权;计算赋权后三类情绪分类标签的占比并提示占比结果。本发明专利技术对于金融投资论坛不同标签用户发布的长、短评论,采用了不同的模型训练方法,一方面兼顾了模型训练的准确性及泛化能力,一方面还充分利用大数据用户画像增加了最终情绪结果的可解释性和置信能力。

【技术实现步骤摘要】

本专利技术涉及人工智能及金融,尤其涉及一种金融投资风险提示方法和装置


技术介绍

1、现有的金融领域评论情绪分析模型大都是基于研报、财经新闻等权威金融长文本语料数据集进行预训练得到的结果,而用户评论篇幅分化较大,有的只有几个字,对于抽取特征词有更大的难度。目前针对金融论坛用户评论分析的方案中,不论是长/短评论都使用同一种模型进行训练分类,在模型预测能力上仍有改进的空间。

2、金融论坛为每个投资品种都提供了评论区,但是目前除了一些敏感词过滤和排序设置,缺少有人工智能分析角度的解读。而且在加权市场情绪的时候,不同身份的人发布的评论可能具有不同的权威性,比如基金持有者和纯观望者的评论情绪可信性会有区别,但是目前金融评论区并未应用用户画像分析的方法来为市场情绪分析提供一种可解释性更高的方案,即现有的金融投资风险提示的准确性仍有待改进。


技术实现思路

1、有鉴于此,本专利技术提供一种金融投资风险提示方法和装置,以解决上述提及的至少一个问题。

2、为了实现上述目的,本专利技术采用以下方案:

3、根据本专利技术的第一方面,提供一种金融投资风险提示方法,所述方法包括:获取金融投资论坛最近预设时间段内的评论文本数据;将所述评论文本数据根据文本长度划分成长文本数据和短文本数据;将所述长文本数据和所述短文本数据分别输入长文本情绪预测模型和短文本情绪预测模型,并记录所述长文本情绪预测模型和所述短文本情绪预测模型所输出的对应的情绪分类标签,所述情绪分类标签包括积极、消极和中立标签;获取评论文本数据所对应的用户画像数据;根据预设规则对不同用户画像所对应的情绪分类标签进行赋权;计算赋权后三类情绪分类标签的占比,并在金融投资论坛显著位置显示占比结果。

4、作为本专利技术的一个实施例,上述方法还包括:获取金融投资论坛的历史评论数据;将所述历史评论数据根据文本长度划分成长文本历史数据和短文本历史数据;人工对所述长文本历史数据和所述短文本历史数据进行情绪分类标签标记;对标记好的所述长文本历史数据和所述短文本历史数据进行预处理;利用预处理后的所述长文本历史数据和所述短文本历史数据分别进行模型训练获得所述长文本情绪预测模型和所述短文本情绪预测模型。

5、作为本专利技术的一个实施例,上述方法中利用预处理后的所述长文本历史数据进行模型训练获得所述长文本情绪预测模型包括:将预处理后的长文本历史数据划分为训练集、验证集和测试集;使用训练集对finbert预训练模型进行拟合;使用验证集来设置超参数并观测损失函数;使用测试集来评估最终模型分类表现;将调优后的finbert预训练模型作为长文本情绪预测模型进行保存。

6、作为本专利技术的一个实施例,上述方法中利用预处理后的所述短文本历史数据进行模型训练获得所述短文本情绪预测模型包括:利用调优后的所述finbert预训练模型对预处理后的所述短文本历史数据进行特征提取以获得特征向量;将所述特征向量作为textrnn模型的训练数据进行模型训练来输出情绪分类标签;将训练好的textrnn模型作为短文本情绪预测模型进行保存。

7、作为本专利技术的一个实施例,上述方法中计算赋权后三类情绪分类标签的占比包括:将每类情绪分类标签中的所有情绪分类标签对应的赋权分数进行相加,得到三类情绪分类标签各自的总分数;计算每类情绪分类标签总分数在三类分数总和中的占比得到对应的占比结果。

8、作为本专利技术的一个实施例,上述方法还包括:获取金融投资论坛最近预设时间段内的图片评论数据及视频评论数据;将所述图片评论数据作为预训练的图像情绪预测模型的输入,并记录所述图像情绪预测模型所输出的对应的情绪分类标签;将所述视频评论数据作为预训练的视频情绪预测模型的输入,并记录所述视频情绪预测模型所输出的对应的情绪分类标签;所述获取评论文本数据所对应的用户画像数据进一步包括:获取评论文本数据、图片评论数据及视频评论数据所对应的用户画像数据。

9、作为本专利技术的一个实施例,上述方法还包括:获取金融投资论坛用户对于占比结果准确性的反馈;基于所述反馈定期对所述长文本情绪预测模型和所述短文本情绪预测模型、赋权规则进行优化迭代,以提高模型预测准确性。

10、根据本专利技术的第二方面,提高一种金融投资风险提示装置,所述装置包括:文本数据获取单元,用于获取金融投资论坛最近预设时间段内的评论文本数据;数据划分单元,用于将所述评论文本数据根据文本长度划分成长文本数据和短文本数据;标签获取单元,用于将所述长文本数据和所述短文本数据分别输入长文本情绪预测模型和短文本情绪预测模型,并记录所述长文本情绪预测模型和所述短文本情绪预测模型所输出的对应的情绪分类标签,所述情绪分类标签包括积极、消极和中立标签;画像获取单元,用于获取评论文本数据所对应的用户画像数据;赋权单元,用于根据预设规则对不同用户画像所对应的情绪分类标签进行赋权;占比计算及显示单元,用于计算赋权后三类情绪分类标签的占比,并在金融投资论坛显著位置显示占比结果。

11、作为本专利技术的一个实施例,上述装置还包括:模型预训练单元,用获取金融投资论坛的历史评论数据;将所述历史评论数据根据文本长度划分成长文本历史数据和短文本历史数据;人工对所述长文本历史数据和所述短文本历史数据进行情绪分类标签标记;对标记好的所述长文本历史数据和所述短文本历史数据进行预处理;利用预处理后的所述长文本历史数据和所述短文本历史数据分别进行模型训练获得所述长文本情绪预测模型和所述短文本情绪预测模型。

12、作为本专利技术的一个实施例,上述模型预训练单元利用预处理后的所述长文本历史数据进行模型训练获得所述长文本情绪预测模型包括:将预处理后的长文本历史数据划分为训练集、验证集和测试集;使用训练集对finbert预训练模型进行拟合;使用验证集来设置超参数并观测损失函数;使用测试集来评估最终模型分类表现;将调优后的finbert预训练模型作为长文本情绪预测模型进行保存。

13、作为本专利技术的一个实施例,上述模型预训练单元利用预处理后的所述短文本历史数据进行模型训练获得所述短文本情绪预测模型包括:利用调优后的所述finbert预训练模型对预处理后的所述短文本历史数据进行特征提取以获得特征向量;将所述特征向量作为textrnn模型的训练数据进行模型训练来输出情绪分类标签;将训练好的textrnn模型作为短文本情绪预测模型进行保存。

14、作为本专利技术的一个实施例,上述占比计算及显示单元计算赋权后三类情绪分类标签的占比包括:将每类情绪分类标签中的所有情绪分类标签对应的赋权分数进行相加,得到三类情绪分类标签各自的总分数;计算每类情绪分类标签总分数在三类分数总和中的占比得到对应的占比结果。

15、作为本专利技术的一个实施例,上述装置还包括:图片及视频数据获取单元,用于获取金融投资论坛最近预设时间段内的图片评论数据及视频评论数据;所述标签获取单元还用于将所述图片评论数据作为预训练的图像情绪预测模型的输入,并记录所述图像情绪预测模型所输出的对应的情绪分类标签;本文档来自技高网...

【技术保护点】

1.一种金融投资风险提示方法,其特征在于,所述方法包括:

2.如权利要求1所述的金融投资风险提示方法,其特征在于,所述方法还包括:

3.如权利要求2所述的金融投资风险提示方法,其特征在于,利用预处理后的所述长文本历史数据进行模型训练获得所述长文本情绪预测模型包括:

4.如权利要求3所述的金融投资风险提示方法,其特征在于,利用预处理后的所述短文本历史数据进行模型训练获得所述短文本情绪预测模型包括:

5.如权利要求1所述的金融投资风险提示方法,其特征在于,所述计算赋权后三类情绪分类标签的占比包括:

6.如权利要求1所述的金融投资风险提示方法,其特征在于,所述方法还包括:

7.如权利要求1所述的金融投资风险提示方法,其特征在于,所述方法还包括:

8.一种金融投资风险提示装置,其特征在于,所述装置包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。

...

【技术特征摘要】

1.一种金融投资风险提示方法,其特征在于,所述方法包括:

2.如权利要求1所述的金融投资风险提示方法,其特征在于,所述方法还包括:

3.如权利要求2所述的金融投资风险提示方法,其特征在于,利用预处理后的所述长文本历史数据进行模型训练获得所述长文本情绪预测模型包括:

4.如权利要求3所述的金融投资风险提示方法,其特征在于,利用预处理后的所述短文本历史数据进行模型训练获得所述短文本情绪预测模型包括:

5.如权利要求1所述的金融投资风险提示方法,其特征在于,所述计算赋权后三类情绪分类标签的占比包括:

6...

【专利技术属性】
技术研发人员:崔馨方
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1