System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于信息分析领域,尤其涉及一种舆情分析方法及系统。
技术介绍
1、舆情是“舆论情况”的简称,它指的是在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。
2、随着事件的进展和网民的讨论而不断变化,由于舆情传播广泛和其即时性,需对舆情进行及时的分析和管控,现有舆情在进行传播时,会通过谐音或隐含词进行转播,导致对舆情管理难度增大,针对上述问题,亟需研制一种更为成熟的舆情分析方法及系统。
技术实现思路
1、本专利技术实施例的目的在于提供一种舆情分析方法及系统,旨在解决上述
技术介绍
中提出的问题。
2、本专利技术实施例是这样实现的,一方面,一种舆情分析方法,所述方法包括:
3、设置靶向要点词汇;
4、基于靶向要点词汇,生成靶向要点词汇识别点;
5、获取舆情信息;
6、识别舆情信息类别,生成直接舆情信息和间接舆情信息;
7、导入直接舆情信息和间接舆情信息,基于靶向要点词汇识别点,生成分级舆情处理方案。
8、作为本专利技术的进一步方案,所述设置靶向要点词汇具体包括:
9、设置并存储一级敏感级要点词汇;
10、设置并存储二级敏感集要点词汇;
11、设置并存储三级敏感集要点词汇。
12、作为本专利技术的再进一步方案,所述基于靶向要点词汇,
13、分别导入一级敏感级要点词汇、二级敏感级要点词汇、三级敏感级要点词汇;
14、将一级敏感级要点词汇、二级敏感级要点词汇、三级敏感级要点词汇转换为拼音,生成一级要点拼音、二级要点拼音、三级要点拼音;
15、对一级要点拼音、二级要点拼音、三级要点拼音进行分割处理;
16、生成一级要点音节组、二级要点音节组、三级要点音节组。
17、作为本专利技术的又进一步方案,所述识别舆情信息类别,生成直接舆情信息和间接舆情信息具体包括:
18、对舆情信息进行文本特征和表情特征检索;
19、若检索到文本特征;
20、提取舆情信息中的文本信息,生成第一文本样本;
21、若检索到表情特征;
22、对舆情信息进行表情语义转换处理,生成第二文本样本。
23、作为本专利技术的进一步方案,所述导入直接舆情信息和间接舆情信息,基于靶向要点词汇识别点,生成分级舆情处理方案具体包括:
24、获取第一文本样本和第二文本样本;
25、将第一文本样本和第二文本样本作为hmm的观测序列输入;
26、利用hmm的前向算法或后向算法,计算文本中每个位置上的词边界概率,生成第一词边界概率;
27、基于第一词边界概率,生成第一音节组集;
28、分别判断第一音节组集中若干个音节组与一级要点音节组、二级要点音节组、三级要点音节组中音节组的相似度;
29、若第一音节组集中存在与一级要点音节组中音节组相似度大于相似度阈值的音节组:
30、生成监测处理方案。
31、作为本专利技术的进一步方案,所述识别舆情信息类别,生成直接舆情信息和间接舆情信息具体还包括:
32、若第一音节组集中存在与二级要点音节组中音节组相似度大于相似度阈值的音节组;
33、生成回应沟通方案。
34、作为本专利技术的进一步方案,所述识别舆情信息类别,生成直接舆情信息和间接舆情信息具体还包括:
35、若第一音节组集中存在与三级要点音节组中音节组相似度大于相似度阈值的音节组;
36、生成公关方案。
37、作为本专利技术的进一步方案,另一方面,一种舆情分析系统,所述系统包括:
38、靶向要点词汇模块,用于设置靶向要点词汇;
39、第一生成模块,用于基于靶向要点词汇,生成靶向要点词汇识别点;
40、获取模块,用于获取舆情信息;
41、识别模块,用于识别舆情信息类别;
42、第二生成模块,用于生成直接舆情信息和间接舆情信息;
43、导入模块,用于导入直接舆情信息和间接舆情信息;
44、第三生成模块,用于基于靶向要点词汇识别点,生成分级舆情处理方案。
45、作为本专利技术的进一步方案,所述第一生成模块具体包括:
46、导入单元,用于分别导入一级敏感级要点词汇、二级敏感级要点词汇、三级敏感级要点词汇;
47、第一转换单元,用于将一级敏感级要点词汇、二级敏感级要点词汇、三级敏感级要点词汇转换为拼音;
48、第一生成单元,用于生成一级要点拼音、二级要点拼音、三级要点拼音;
49、分割单元,用于对一级要点拼音、二级要点拼音、三级要点拼音进行分割处理;
50、第二生成单元,用于生成一级要点音节组、二级要点音节组、三级要点音节组。
51、作为本专利技术的进一步方案,所述第二生成模块具体包括:
52、检索单元,用于对舆情信息进行文本特征和表情特征检索;
53、提取单元,用于若检索到文本特征,提取舆情信息中的文本信息;
54、第三生成单元,用于生成第一文本样本;
55、第二转换单元,用于若检索到表情特征,对舆情信息进行表情语义转换处理;
56、第四生成单元,用于生成第二文本样本。
57、本专利技术实施例提供的一种舆情分析方法及系统,本方法和系统可对多模态的舆情信息进行识别分析,将靶向要点词汇和舆情信息进行拆解,防止利用谐音进行舆情的隐匿传播,进一步提高了对舆情的识别管控能力和处理能力。
本文档来自技高网...【技术保护点】
1.一种舆情分析方法及系统,其特征在于,所述方法包括:
2.根据权利要求1所述的舆情分析方法,其特征在于,所述设置靶向要点词汇具体包括:
3.根据权利要求1所述的舆情分析方法,其特征在于,所述基于靶向要点词汇,生成靶向要点词汇识别点具体包括:
4.根据权利要求1所述的舆情分析方法,其特征在于,所述识别舆情信息类别,生成直接舆情信息和间接舆情信息具体包括:
5.根据权利要求4所述的舆情分析方法,其特征在于,所述导入直接舆情信息和间接舆情信息,基于靶向要点词汇识别点,生成分级舆情处理方案具体包括:
6.根据权利要求5所述的舆情分析方法,其特征在于,所述识别舆情信息类别,生成直接舆情信息和间接舆情信息具体还包括:
7.根据权利要求5所述的舆情分析方法,其特征在于,所述识别舆情信息类别,生成直接舆情信息和间接舆情信息具体还包括:
8.一种舆情分析系统,其特征在于,所述系统包括:
9.根据权利要求8所述的舆情分析方法,其特征在于,所述第一生成模块具体包括:
10.根据权利要求8所述的
...【技术特征摘要】
1.一种舆情分析方法及系统,其特征在于,所述方法包括:
2.根据权利要求1所述的舆情分析方法,其特征在于,所述设置靶向要点词汇具体包括:
3.根据权利要求1所述的舆情分析方法,其特征在于,所述基于靶向要点词汇,生成靶向要点词汇识别点具体包括:
4.根据权利要求1所述的舆情分析方法,其特征在于,所述识别舆情信息类别,生成直接舆情信息和间接舆情信息具体包括:
5.根据权利要求4所述的舆情分析方法,其特征在于,所述导入直接舆情信息和间接舆情信息,基于靶向要点词汇识别点,生成分级...
【专利技术属性】
技术研发人员:袁世明,王琰琼,陈志彬,李美娟,喻文宏,
申请(专利权)人:上海金粟科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。