资讯信息分析方法及装置制造方法及图纸

技术编号:32361900 阅读:7 留言:0更新日期:2022-02-20 03:30
本发明专利技术提供了一种资讯信息分析方法及装置,可用于大数据技术领域,该方法包括:基于关键字爬取网络上的资讯信息;对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的影响度;根据所述资讯信息的情感分类结果和影响度,确定所述资讯信息的情感分析结果。本发明专利技术可以实现对资讯信息的准确分析。息的准确分析。息的准确分析。

【技术实现步骤摘要】
资讯信息分析方法及装置


[0001]本专利技术涉及大数据
,尤其涉及一种资讯信息分析方法及装置。

技术介绍

[0002]网络资讯作为一种十分重要的资讯表现形式,在不同机构之间也会转载,相互影响,图1为资讯信息转载示意图,因此,网络中充斥着大量的相同的信息,会导致资讯信息分析失真,比如词频统计、情感分析等会因为统计相同信息失去相应的真实度。因此,现有的资讯信息分析方法存在分析结果不准确的问题。

技术实现思路

[0003]本专利技术实施例提出一种资讯信息分析方法,用以实现对资讯信息的准确分析,该方法包括:
[0004]基于关键字爬取网络上的资讯信息;
[0005]对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;
[0006]将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;
[0007]构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的影响度;
[0008]根据所述资讯信息的情感分类结果和影响度,确定所述资讯信息的情感分析结果。
[0009]本专利技术实施例提出一种资讯信息分析装置,用以实现对资讯信息的准确分析,该装置包括:
[0010]资讯信息爬取模块,用于基于关键字爬取网络上的资讯信息;
[0011]预处理模块,用于对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;
[0012]分类模块,用于将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;
[0013]影响度计算模块,用于构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的影响度;
[0014]情感分析结构确定模块,用于根据所述资讯信息的情感分类结果和影响度,确定所述资讯信息的情感分析结果。
[0015]本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述资讯信息分析方法。
[0016]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现资讯信息分析方法。
[0017]本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程
序,所述计算机程序被处理器执行时实现资讯信息分析方法。
[0018]在本专利技术实施例中,基于关键字爬取网络上的资讯信息;对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的影响度;根据所述资讯信息的情感分类结果和影响度,确定所述资讯信息的情感分析结果。在上述过程中,在通过情感分类模型获得资讯信息的情感分类结果后,考虑了资讯信息重复的情况,计算了资讯信息的影响度,进而确定的资讯信息的情感分析结果更准确。
附图说明
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0020]图1为资讯信息转载示意图;
[0021]图2为本专利技术实施例中资讯信息分析方法的流程图;
[0022]图3为本专利技术实施例中网络拓扑的示意图一;
[0023]图4为本专利技术实施例中网络拓扑的示意图二;
[0024]图5为本专利技术实施例中网络拓扑的示意图三;
[0025]图6为本专利技术实施例中资讯信息分析装置的示意图;
[0026]图7为本专利技术实施例中计算机设备的示意图。
具体实施方式
[0027]为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。
[0028]在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
[0029]图2为本专利技术实施例中资讯信息分析方法的流程图,如图2所示,包括:
[0030]步骤201,基于关键字爬取网络上的资讯信息;
[0031]步骤202,对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;
[0032]步骤203,将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;
[0033]步骤204,构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的
影响度;
[0034]步骤205,根据所述资讯信息的情感分类结果和影响度,确定所述资讯信息的情感分析结果。
[0035]在本专利技术实施例中,在通过情感分类模型获得资讯信息的情感分类结果后,考虑了资讯信息重复的情况,计算了资讯信息的影响度,进而确定的资讯信息的情感分析结果更准确。
[0036]具体实施时,资讯信息在网站之间转载,被转载的资讯信息的特征为:1、信息标题与源网站(信息发布的网站,称为一级发布机构)中转载的信息标题相同;2、在资讯信息中信息标题的下方,会注明转载出处(发布来源);多次被转载的资讯信息被认为具有高认可度,在进行分析时根据转载次数赋予较高的权重。
[0037]在步骤201中,基于关键字爬取网络上的资讯信息;
[0038]其中,关键字可以自由定义,例如,“油价”,可爬取出“史无前例!原油期货暴跌至负值,负油价时代来了?”等资讯信息。上述资讯信息可以是各大资讯网站爬取的资讯信息。
[0039]在步骤202中,对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息。
[0040]在一实施例中,对爬取的资讯信息进行预处理,包括:
[0041]依次采用如下方法对爬取的资讯信息进行预处理:
[0042]去空格处理,标点及转义字符处理,分词处理,停用词处理。
[0043]上述处理可选择地使用,例如,若没有空格,可不进行空格处理。
[0044]在步骤203中,将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果。
[0045]在一实施例中,所述情感分类模型为BiL本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种资讯信息分析方法,其特征在于,包括:基于关键字爬取网络上的资讯信息;对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的影响度;根据所述资讯信息的情感分类结果和影响度,确定所述资讯信息的情感分析结果。2.如权利要求1所述的资讯信息分析方法,其特征在于,对爬取的资讯信息进行预处理,包括:依次采用如下方法对爬取的资讯信息进行预处理:去空格处理,标点及转义字符处理,分词处理,停用词处理。3.如权利要求1所述的资讯信息分析方法,其特征在于,所述情感分类模型为BiLSTM情感分类模型。4.如权利要求3所述的资讯信息分析方法,其特征在于,所述情感分类模型的训练步骤包括:爬取网络上的历史资讯信息;对爬取的历史资讯信息进行预处理,获得符合预设格式要求的资讯信息;对符合预设格式要求的资讯信息进行情感标签标注;将标注后的资讯信息分为训练集数据和验证集数据;基于训练集数据训练BiLSTM情感分类模型,获得训练后的BiLSTM情感分类模型;基于验证集数据验证所述训练后的BiLSTM情感分类模型,直至满足预设精度,获得训练好的BiLSTM情感分类模型。5.如权利要求1所述的资讯信息分析方法,其特征在于,所述资讯信息的属性包括信息标题、发布机构、时间、发布来源、作者和信息内容。6.如权利要求5所述的资讯信息分析方法,其特征在于,构建所述资讯信息的网络拓扑...

【专利技术属性】
技术研发人员:张辉
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1