System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 舆情分析模型的训练方法、装置、设备及存储介质制造方法及图纸_技高网

舆情分析模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:41796320 阅读:2 留言:0更新日期:2024-06-24 20:20
本申请提供一种舆情分析模型的训练方法、装置、设备及存储介质。该方法包括:收集目标网站的舆情数据;对所述舆情数据进行清洗,并基于无监督算法对清洗后的舆情数据进行标注;基于无监督算法对预设的知识库进行挖掘,构建多个业务场景对应的专有词库,将标注后的舆情数据与多个专有词库作为数据源;基于神经网络模型对所述数据源包含的信息进行多任务抽取,得到舆情分析模型。本申请的方法通过对数据源包含的信息进行多任务抽取,有利于利用多个子任务之间的潜在信息,有利于提高舆情分析模型进行舆情预测的准确率。

【技术实现步骤摘要】

本申请涉及舆情分析,尤其涉及一种舆情分析模型的训练方法、装置、设备及存储介质


技术介绍

1、舆论情况,简称舆情,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,公众对某一事件或问题的看法和态度的总体表现。企业为了在信息庞大且繁杂的网络新闻、论坛观点等舆情信息中筛选和挖掘出真正有用的信息,需要对舆情进行识别与分析。

2、在一些相关技术中,可通过网络舆情监控技术对舆情进行识别和分析。在舆情分析过程中,情感分析技术作为舆情分析的关键方法之一,致力于识别和理解文本中的情感倾向。通过情感分析,可以分析公众对特定话题、时间或产品的态度,从而为决策者提供有价值的信息。

3、但是由于汽车领域的舆论情况较为复杂,情感分析技术进行情感分析的准确率较低,进而导致网络舆情监控技术应用在汽车领域时,存在准确率较低的问题。


技术实现思路

1、本申请提供一种舆情分析模型的训练方法、装置、设备及存储介质,用以解决相关技术中,网络舆情监控技术应用在汽车领域时,存在准确率较低的问题。

2、第一方面,本申请提供一种舆情分析模型的训练方法,包括:

3、收集目标网站的舆情数据;

4、对舆情数据进行清洗,并基于无监督算法对清洗后的舆情数据进行标注;

5、基于无监督算法对预设的知识库进行挖掘,构建多个业务场景对应的专有词库,将标注后的舆情数据与多个专有词库作为数据源;

6、基于神经网络模型对数据源包含的信息进行多任务抽取,得到舆情分析模型。

7、第二方面,本申请提供一种舆情分析模型的训练装置,包括:

8、收集模块,用于收集目标网站的舆情数据;

9、处理模块,用于对舆情数据进行清洗,并基于无监督算法对清洗后的舆情数据进行标注;

10、处理模块,还用于基于无监督算法对预设的知识库进行挖掘,构建多个业务场景对应的专有词库,将标注后的舆情数据与多个专有词库作为数据源;

11、处理模块,还用于基于神经网络模型对数据源包含的信息进行多任务抽取,得到舆情分析模型。

12、第三方面,本申请提供一种电子设备,包括:处理器、存储器,存储器中存储代码,处理器运行存储器中存储的代码,以执行如第一方面中任一项的方法。

13、第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一项的方法。

14、本申请提供一种舆情分析模型的训练方法、装置、设备及存储介质,该方法包括:收集目标网站的舆情数据,对舆情数据进行清洗,并基于无监督算法对清洗后的舆情数据进行标注。基于无监督算法对预设的知识库进行挖掘,构建多个业务场景对应的专有词库,将标注后的舆情数据与多个专有词库作为数据源。基于神经网络模型对数据源包含的信息进行多任务抽取,得到舆情分析模型。本申请的方法通过对知识库进行挖掘能够得到知识库中潜在的一些信息,使得数据源包含的信息更加全面,因此基于该数据源对神经网络模型进行训练,有利于提高舆情分析模型的预测准确率。同时,对数据源包含的信息进行多任务抽取,能够充分利用多个子任务之间的潜在信息,进一步有利于提高舆情分析模型预测的准确率。

本文档来自技高网...

【技术保护点】

1.一种舆情分析模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于无监督算法对清洗后的舆情数据进行标注,包括:

3.根据权利要求1所述的方法,其特征在于,所述神经网络模型为多任务联合抽取模型;所述基于神经网络模型对所述数据源包含的信息进行多任务抽取,得到舆情分析模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述输入文本集对神经网络模型进行训练之前,还包括:

6.根据权利要求4所述的方法,其特征在于,所述方法还包括:

7.根据权利要求4所述的方法,其特征在于,所述方法还包括:

8.一种舆情分析模型的训练装置,其特征在于,包括:

9.一种电子设备,包括:处理器、存储器,所述存储器中存储代码,所述处理器运行所述存储器中存储的代码,以执行如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.一种舆情分析模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于无监督算法对清洗后的舆情数据进行标注,包括:

3.根据权利要求1所述的方法,其特征在于,所述神经网络模型为多任务联合抽取模型;所述基于神经网络模型对所述数据源包含的信息进行多任务抽取,得到舆情分析模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述输入文本集对神经网络模型进行训练之前,还包括:

<...

【专利技术属性】
技术研发人员:熊彬伍迪
申请(专利权)人:武汉路特斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1