System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,特别涉及一种ai情绪可视化识别方法及系统。
技术介绍
1、目前,情绪可视化分析用于了解文本中的观点、情感和态度。情绪分析也称为情绪分类或观点挖掘,通过提取特定单词或短语来确定内容是正面、消极还是中性。情绪分析对分析公众对某些产品、事件、人或想法的看法具有重要意义。过去几年来,该领域取得了重大进展,这主要是由于用户生成的情绪分析数据空前增长。现在有无数的应用,为大企业、心理学和社会学提供见解。但是,现有的ai情绪可视化识别方法及系统只是对文本进行了词向量的处理,没有考虑到情绪因子,且在文本分析中未进行无效文本信息的滤除,无法更高效、更有针对性地进行情绪可视化识别过程。例如公开号为“cn115455151a”、专利名称为“一种ai情绪可视化识别方法、系统及云平台”,其方法包括以下步骤:根据待进行情绪分析的文本大数据,确定情绪化文本段落以及所述情绪化文本段落对应的段落词向量;利用待进行情绪分析的文本大数据中的目标信息块以及段落词向量进行用户情绪分析,得到情绪分析报告。应用本专利技术实施例,可以利用目标信息块引入对噪声情绪的考虑,以便提高情绪分析的精度和可信度。但是该专利只是对文本进行了词向量的处理,没有考虑到情绪因子,且在文本分析中未进行无效文本信息的滤除,无法更高效、更有针对性地进行情绪可视化识别过程。
2、因此,本专利技术提出了一种ai情绪可视化识别方法及系统,用于实现基于词向量提取有效信息,且在文本分析中进行无效文本信息的滤除,更高效、更有针对性地进行情绪可视化识别过程。
1、本专利技术提供一种ai情绪可视化识别方法及系统,用以实时对需要进行情绪可视化识别的文字信息进行完整语句的提取,获得对应的初始文本信息,可以获得初始文本信息对应的向量表示,根据初始文本信息的所有向量表示实现了对重复语句的筛除,获得了文本信息中有效文本信息,获得有效文本信息包含的所有语句对应的所有种类的情绪因子的情绪因子相关字的数据,并可以根据获得的情绪因子相关字的数据构建出文字信息对应的情绪分析矩阵,根据情绪分析矩阵实现了对文字信息中包含的主要的情绪的获取,实时根据主要的情绪生成可视化结果。本专利技术提供一种ai情绪可视化识别方法,包括:
2、s1:基于ai云平台对需要进行情绪可视化识别的文字信息进行特定提取,获得初始文本信息;
3、s2:对初始文本信息进行向量转换,获得初始文本信息中每个字对应的向量表示,基于初始文本信息的所有向量表示对初始文本信息进行有效信息的提取,获得有效文本信息;
4、s3:基于有效文本信息进行情绪因子分析,获得有效文本信息的情绪因子数据;
5、s4:根据有效文本信息的所有情绪因子数据构建情绪分析矩阵,基于构建的情绪分析矩阵对有效文本信息进行主要情绪分析,获得文字信息的主要情绪;
6、s5:基于文字信息的主要情绪生成可视化结果。
7、优选的,ai情绪可视化识别方法,s1:基于ai云平台对需要进行情绪可视化识别的文字信息进行特定提取,获得初始文本信息,包括:
8、s101:基于ai云平台实时获取需要进行情绪可视化识别的文字信息;
9、s102:对获取到的文字信息与预设的语句库进行比对,获得文字信息中包含的完整语句,将所有完整语句作为初始文本信息。
10、优选的,ai情绪可视化识别方法,s2:对初始文本信息进行向量转换,获得初始文本信息中每个字对应的向量表示,基于初始文本信息的所有向量表示对初始文本信息进行有效信息的提取,获得有效文本信息,包括:
11、s201:对初始文本信息包含的所有文字进行向量转换,获得初始文本信息包含的所有文字的向量表示;
12、s202:基于初始文本信息包含的所有文字的向量表示对初始文本信息进行分句,获得初始文本信息包含的所有语句和每个语句中所有字的向量表示;
13、s203:基于初始文本信息包含的每个语句中所有字的向量表示,对初始文本信息进行有效信息的提取,获得有效文本信息。
14、优选的,ai情绪可视化识别方法,s201:对初始文本信息包含的所有文字进行向量转换,获得初始文本信息包含的所有文字的向量表示,包括:
15、s2011:统计初始文本信息中每个字的出现次数和初始文本信息中的总字数;
16、s2012:将每个字出现的次数作为初始文本信息对应字的向量表示的第一元素;
17、s2013:将初始文本信息中的总字数与每个字出现的次数进行相除,获得每个字对应的比值,并将获得的比值与1的和作为底数为10的真数部分,获得每个字的对数值,并将获得的对数值作为初始文本信息对应字的向量表示的第二元素;
18、s2014:将每个字的第一元素与第二元素作为对应字的二维向量的元素,获得每个字的二维向量,作为初始文本信息中每个字的向量表示。
19、优选的,ai情绪可视化识别方法,s202:基于初始文本信息包含的所有文字的向量表示对初始文本信息进行分句,获得初始文本信息包含的所有语句和每个语句中所有字的向量表示,包括:
20、s2021:求取初始文本信息的每个字的向量表示与相邻下一个字的向量表示的相似度作为每个字的接续相似度,将初始文本信息中的所有字的接续相似度作为数列元素构建出相似度数列,其中,相似度数列中的所有数列元素的顺序与初始文本信息中的所有字的顺序对应;
21、s2022:确定出相似度数列中的所有极大值与极小值,将所有极小值作为候选分句点,并将位于候选分句点之前的与候选分句点间隔最近的极大值和位于候选分句点之后的与候选分句点间隔最近的极大值进行相加,获得相加结果,并将相加结果与候选分句点对应的极小值的二倍数值进行相除,获得分句判断值;
22、s2023:将分句判断值大于1.8的候选分句点当作最终分句点;
23、s2024:将所有最终分句点对应的接续相似度在初始文本信息中对应的两个字之间的界限,当作分句界限,基于所有分句界限对初始文本信息进行分句,获得初始文本信息包含的所有语句,并获得每个语句中所有字的向量表示。
24、优选的,ai情绪可视化识别方法,s203:基于初始文本信息包含的每个语句中所有字的向量表示,对初始文本信息进行有效信息的提取,获得有效文本信息,包括:
25、基于初始文本信息包含的每个语句中所有字的向量表示,将所有语句中互相存在超出预设字数的部分重复字的至少两个语句汇总,当作初始文本信息的重复语句组;
26、将初始文本信息的所有重复语句组中字数最多的语句作为有效文本信息,将所有语句中除重复语句组以外剩余的语句也作为有效文本信息。
27、优选的,ai情绪可视化识别方法,s3:基于有效文本信息进行情绪因子分析,获得有效文本信息的情绪因子数据,包括:
28、s301:获取有效文本信息中的所有语句,基于预设的情绪因子库对有效文本信息中的所有语句中包含本文档来自技高网...
【技术保护点】
1.一种AI情绪可视化识别方法,其特征在于,包括:
2.根据权利要求1所述的一种AI情绪可视化识别方法,其特征在于,S1:基于AI云平台对需要进行情绪可视化识别的文字信息进行特定提取,获得初始文本信息,包括:
3.根据权利要求1所述的一种AI情绪可视化识别方法,其特征在于,S2:对初始文本信息进行向量转换,获得初始文本信息中每个字对应的向量表示,基于初始文本信息的所有向量表示对初始文本信息进行有效信息的提取,获得有效文本信息,包括:
4.根据权利要求3所述的一种AI情绪可视化识别方法,其特征在于,S201:对初始文本信息包含的所有文字进行向量转换,获得初始文本信息包含的所有文字的向量表示,包括:
5.根据权利要求3所述的一种AI情绪可视化识别方法,其特征在于,S202:基于初始文本信息包含的所有文字的向量表示对初始文本信息进行分句,获得初始文本信息包含的所有语句和每个语句中所有字的向量表示,包括:
6.根据权利要求3所述的一种AI情绪可视化识别方法,其特征在于,S203:基于初始文本信息包含的每个语句中所有字的向量表示,
7.根据权利要求1所述的一种AI情绪可视化识别方法,其特征在于,S3:基于有效文本信息进行情绪因子分析,获得有效文本信息的情绪因子数据,包括:
8.根据权利要求7所述的一种AI情绪可视化识别方法,其特征在于,S4:根据有效文本信息的所有情绪因子数据构建情绪分析矩阵,基于构建的情绪分析矩阵对有效文本信息进行主要情绪分析,获得文字信息的主要情绪,包括:
9.根据权利要求1所述的一种AI情绪可视化识别方法,其特征在于,基于构建的情绪分析矩阵对有效文本信息进行主要情绪分析,获得文字信息的主要情绪,包括:
10.一种AI情绪可视化识别系统,其特征在于,用于执行权利要求1至9中任一所述的AI情绪可视化识别方法,包括:
...【技术特征摘要】
1.一种ai情绪可视化识别方法,其特征在于,包括:
2.根据权利要求1所述的一种ai情绪可视化识别方法,其特征在于,s1:基于ai云平台对需要进行情绪可视化识别的文字信息进行特定提取,获得初始文本信息,包括:
3.根据权利要求1所述的一种ai情绪可视化识别方法,其特征在于,s2:对初始文本信息进行向量转换,获得初始文本信息中每个字对应的向量表示,基于初始文本信息的所有向量表示对初始文本信息进行有效信息的提取,获得有效文本信息,包括:
4.根据权利要求3所述的一种ai情绪可视化识别方法,其特征在于,s201:对初始文本信息包含的所有文字进行向量转换,获得初始文本信息包含的所有文字的向量表示,包括:
5.根据权利要求3所述的一种ai情绪可视化识别方法,其特征在于,s202:基于初始文本信息包含的所有文字的向量表示对初始文本信息进行分句,获得初始文本信息包含的所有语句和每个语句中所有字的向量表示,包括:<...
【专利技术属性】
技术研发人员:孙道良,
申请(专利权)人:北京心企领航科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。