舆情情感热度计算方法及装置制造方法及图纸

技术编号:28623322 阅读:13 留言:0更新日期:2021-05-28 16:19
本发明专利技术提供了一种舆情情感热度计算方法及装置,涉及数据分析领域,可应用于金融领域和其他领域,所述方法具体包含:获取预定网页上与待分析的信用卡相关的数据资源和动态信息;对所述数据资源进行文本清洗和特征抽取并转换为词向量矩阵;根据所述词向量矩阵和预设的情感分析模型分析获得各文本的情感类别信息;将所述情感类别信息和所述动态信息带入预设的量化函数中获得舆情情感热度值。

【技术实现步骤摘要】
舆情情感热度计算方法及装置
本专利技术涉及数据分析领域,可应用于金融领域和其他领域,尤指一种舆情情感热度计算方法及装置。
技术介绍
新闻、论坛、自媒体等是客户日常生活中最常接触的资讯来源,也揭示着产品的大众口碑,尤其是信用卡领域,网络上存在各种关于信用卡使用方面的评价。搜集、处理、洞察口碑和情绪已经成为各个银行了解信用卡客户的重要步骤,负面信息更是成为舆论监测的核心价值点,预警负面信息显得必要且迫切。网络上实现舆情预警的通用方法为:通过网络爬虫技术对相关网站上符合主题的原始数据进行爬取,然后通过预处理模块对获取到的数据进行去重、消噪及特征提取,最后利用数据挖掘的方法实现文本分类,从而实现网络舆情的分析和预警。伴随着深度神经网络的发展,文本分类从机器学习的方法扩展到卷积神经网络、循环神经网络、生成对抗网络等,取得了一定的成果。但是目前舆情分析的重点多在于舆情信息的好坏分类,没有结合到该舆情的情感热度和扩散速度,更难以将舆情热度量化成指标供预警分析中使用。
技术实现思路
本专利技术目的在于针对网络文本分类环节中没有考虑舆情热度的弱点,提供一种舆情情感热度计算方法及装置,予以根据动态信息的重要性程度给出文本信息的热度,结合情绪分类和信息热度给出一种快速计算综合得分的方法。为达上述目的,本专利技术所提供的舆情情感热度计算方法,具有包含:获取预定网页上与待分析的信用卡相关的数据资源和动态信息;对所述数据资源进行文本清洗和特征抽取并转换为词向量矩阵;根据所述词向量矩阵和预设的情感分析模型分析获得各文本的情感类别信息;将所述情感类别信息和所述动态信息带入预设的量化函数中获得舆情情感热度值。在上述舆情情感热度计算方法中,优选的,所述方法还包含:获取所述数据资源中各条文本信息中的表情信息;根据所述表情信息和文本内容对所述文本信息进行情感类别标注;以所述文本信息及对应的情感类别作为输出数据,以所述词向量矩阵作为输入数据训练LSTM模型获得情感分析模型。在上述舆情情感热度计算方法中,优选的,根据所述表情信息和文本内容对所述文本信息进行情感类别标注包含:根据所述表情信息对应文本信息中的出现频率,根据所述出现频率和预存的各表情信息对应的情感类别获得表情情感信息;通过文本分析算法分析所述文本内容的倾向情感信息;根据所述表情情感信息和所述倾向情感信息对所述文本信息进行情感类别标注。在上述舆情情感热度计算方法中,优选的,获取预定网页上与待分析的信用卡相关的数据资源包含:通过爬虫技术获取预定网页上与待分析的信用卡相关的数据资源及所述数据资源的链接地址;通过所述链接地址按预设周期采集最新动态的数据资源。在上述舆情情感热度计算方法中,优选的,所述文本清洗包含:去噪处理、中文分词处理和停用词处理;所述去噪处理包含参考正则表达式去除所述数据资源中各文本信息内的噪声信息;所述中文分词处理包含根据结巴分词工具对各文本信息逐个分词;所述停用词处理包含通过预设的停用词表过滤掉各文本信息中的停用词。在上述舆情情感热度计算方法中,优选的,所述特征提取包含:通过Word2Vec模型将文本清洗过后的词文本转化为词向量,根据所述数据资源中各文本信息对应的词向量生成词向量矩阵。在上述舆情情感热度计算方法中,优选的,将所述情感类别信息和所述动态信息带入预设的量化函数中获得舆情情感热度值包含:根据所述动态信息获得预存的权值系数;通过所述权值系数调整所述量化函数,利用调整后的所述量化函数、所述情感类别信息和所述动态信息计算获得所述动态信息对应的文本信息的舆情情感热度值。在上述舆情情感热度计算方法中,优选的,所述方法还包含:根据所述数据资源中各文本信息对应的舆情情感热度值总和与预设阈值的比较结果生成预警信号。本专利技术还提供一种舆情情感热度计算装置,所述装置包含:数据采集模块、数据预处理模块和舆情分析模块;所述数据采集模块用于获取预定网页上与待分析的信用卡相关的数据资源和动态信息;所述数据预处理模块用于对所述数据资源进行文本清洗和特征抽取并转换为词向量矩阵;所述舆情分析模块用于根据所述词向量矩阵和预设的情感分析模型分析获得各文本的情感类别信息;以及,将所述情感类别信息和所述动态信息带入预设的量化函数中获得舆情情感热度值。在上述舆情情感热度计算装置中,优选的,所述装置还包含模型训练模块,所述模型训练模块用于获取所述数据资源中各条文本信息中的表情信息;根据所述表情信息和文本内容对所述文本信息进行情感类别标注;以所述文本信息及对应的情感类别作为输出数据,以所述词向量矩阵作为输入数据训练LSTM模型获得情感分析模型。在上述舆情情感热度计算装置中,优选的,所述模型训练模块包含标注单元,所述标注单元用于根据所述表情信息对应文本信息中的出现频率,根据所述出现频率和预存的各表情信息对应的情感类别获得表情情感信息;通过文本分析算法分析所述文本内容的倾向情感信息;根据所述表情情感信息和所述倾向情感信息对所述文本信息进行情感类别标注。在上述舆情情感热度计算装置中,优选的,所述数据采集模块包含:通过爬虫技术获取预定网页上与待分析的信用卡相关的数据资源及所述数据资源的链接地址;通过所述链接地址按预设周期采集最新动态的数据资源。在上述舆情情感热度计算装置中,优选的,所述数据预处理模块包含去噪单元、分词单元和过滤单元;所述去噪单元用于参考正则表达式去除所述数据资源中各文本信息内的噪声信息;所述分词单元用于根据结巴分词工具对各文本信息逐个分词;所述过滤单元用于通过预设的停用词表过滤掉各文本信息中的停用词。在上述舆情情感热度计算装置中,优选的,所述数据预处理模块包含特征提取单元,所述特征提取单元用于通过Word2Vec模型将文本清洗过后的词文本转化为词向量,根据所述数据资源中各文本信息对应的词向量生成词向量矩阵。在上述舆情情感热度计算装置中,优选的,所述舆情分析模块还包含权值设置单元,所述权值设置单元用于根据所述动态信息获得预存的权值系数;通过所述权值系数调整所述量化函数,利用调整后的所述量化函数、所述情感类别信息和所述动态信息计算获得所述动态信息对应的文本信息的舆情情感热度值。在上述舆情情感热度计算装置中,优选的,所述装置还包含预警模块,所述预警模块用于根据所述数据资源中各文本信息对应的舆情情感热度值总和与预设阈值的比较结果生成预警信号。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。本专利技术的有益技术效果在于:有效融合了情感分析和热度分析,可以快速获取客户对信用卡舆论事件的情感和关注程度,对互联网舆情信息做到快速预警并聚焦到热点信息,相关部门能快速掌握网络预舆情发展动态快速做出调整。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,并不构成对本专利技术的限定。在附图中:本文档来自技高网...

【技术保护点】
1.一种舆情情感热度计算方法,其特征在于,所述方法包含:/n获取预定网页上与待分析的信用卡相关的数据资源和动态信息;/n对所述数据资源进行文本清洗和特征抽取并转换为词向量矩阵;/n根据所述词向量矩阵和预设的情感分析模型分析获得各文本的情感类别信息;/n将所述情感类别信息和所述动态信息带入预设的量化函数中获得舆情情感热度值。/n

【技术特征摘要】
1.一种舆情情感热度计算方法,其特征在于,所述方法包含:
获取预定网页上与待分析的信用卡相关的数据资源和动态信息;
对所述数据资源进行文本清洗和特征抽取并转换为词向量矩阵;
根据所述词向量矩阵和预设的情感分析模型分析获得各文本的情感类别信息;
将所述情感类别信息和所述动态信息带入预设的量化函数中获得舆情情感热度值。


2.根据权利要求1所述的舆情情感热度计算方法,其特征在于,所述方法还包含:
获取所述数据资源中各条文本信息中的表情信息;
根据所述表情信息和文本内容对所述文本信息进行情感类别标注;
以所述文本信息及对应的情感类别作为输出数据,以所述词向量矩阵作为输入数据训练LSTM模型获得情感分析模型。


3.根据权利要求2所述的舆情情感热度计算方法,其特征在于,根据所述表情信息和文本内容对所述文本信息进行情感类别标注包含:
根据所述表情信息对应文本信息中的出现频率,根据所述出现频率和预存的各表情信息对应的情感类别获得表情情感信息;
通过文本分析算法分析所述文本内容的倾向情感信息;
根据所述表情情感信息和所述倾向情感信息对所述文本信息进行情感类别标注。


4.根据权利要求1所述的舆情情感热度计算方法,其特征在于,获取预定网页上与待分析的信用卡相关的数据资源包含:
通过爬虫技术获取预定网页上与待分析的信用卡相关的数据资源及所述数据资源的链接地址;
通过所述链接地址按预设周期采集最新动态的数据资源。


5.根据权利要求1所述的舆情情感热度计算方法,其特征在于,所述文本清洗包含:去噪处理、中文分词处理和停用词处理;
所述去噪处理包含参考正则表达式去除所述数据资源中各文本信息内的噪声信息;
所述中文分词处理包含根据结巴分词工具对各文本信息逐个分词;
所述停用词处理包含通过预设的停用词表过滤掉各文本信息中的停用词。


6.根据权利要求1所述的舆情情感热度计算方法,其特征在于,所述特征提取包含:通过Word2Vec模型将文本清洗过后的词文本转化为词向量,根据所述数据资源中各文本信息对应的词向量生成词向量矩阵。


7.根据权利要求1所述的舆情情感热度计算方法,其特征在于,将所述情感类别信息和所述动态信息带入预设的量化函数中获得舆情情感热度值包含:
根据所述动态信息获得预存的权值系数;
通过所述权值系数调整所述量化函数,利用调整后的所述量化函数、所述情感类别信息和所述动态信息计算获得所述动态信息对应的文本信息的舆情情感热度值。


8.根据权利要求7所述的舆情情感热度计算方法,其特征在于,所述方法还包含:根据所述数据资源中各文本信息对应的舆情情感热度值总和与预设阈值的比较结果生成预警信号。


9.一种舆情情感热度计算装置,其特征在于,所述装置包含:数据采集模块、数据预处理模块和舆情分析模块;
所述数据采集模块用于获取预定网页上与待分析的信用卡相关的数据资源和动态信息;...

【专利技术属性】
技术研发人员:廖智
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1