System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种文本分析方法、装置、电子设备及存储介质。
技术介绍
1、目前,可以通过商品评价进行人工判断,确定用户对于商品的体验情况。
2、但是,上述方法中,存在人工操作效率低,不能及时、可靠地获取到用户的体验情况。
技术实现思路
1、本申请提供一种文本分析方法、装置、电子设备及存储介质,解决了相关技术中人工操作效率低,不能及时、可靠地获取到用户的体验情况的技术问题。
2、第一方面,本申请提供一种文本分析方法,包括:基于目标文本,确定第一特征向量,该第一特征向量中包括多个特征元素,其中,一个特征元素用于表征该目标文本中的一个或者多个字符;基于该第一特征向量和目标神经网络模型,确定第二特征向量;将该第二特征向量,按照加权多头注意力机制进行处理,得到至少一个初始特征向量;基于长短时记忆网络对该至少一个初始特征向量进行处理,得到至少一个目标特征向量;基于该至少一个目标特征向量,确定目标特征,该目标特征用于表征该目标文本对应的语义特征。
3、可选地,上述基于目标文本,确定第一特征向量,包括:删除该目标文本中的目标字符,得到第一目标文本,该目标字符包括空格、停用词、特殊字符、逗号以及句号,该停用词包括语气助词、副词、介词以及连接词;将该第一目标文本转化为目标词向量;将该目标词向量确定为该第一特征向量。
4、本申请中,由于空格、特殊字符、逗号、句号、语气助词、副词、介词以及连接词等不存在实际的语义信息,在文本分析的过程中属于冗余文
5、可选地,上述基于该第一特征向量和目标神经网络模型,确定第二特征向量,包括:将该第一特征向量输入该目标神经网络模型,得到第二初始特征向量,该第二初始特征向量中包括h个元素,该h为正整数;基于该h个元素,确定l个元素组,其中,一个元素组中包括l个元素子组,一个元素子组中包括m个元素,该m为h与目标数值的比值,该目标数值为l的平方,该l为正整数;基于该l个元素组,确定l个目标元素组,其中,一个目标元素组中包括l个元素子组,其中,一个元素子组对应一个元素组;基于该l个目标元素组,确定该第二特征向量。
6、本申请中,电子设备将该第一特征向量输入该目标神经网络模型,会将该第一特征向量进行卷积,以提取该第一特征向量中的特征信息,然后对该第一特征向量中的特征信息进行池化,以缩小该第一特征向量中的特征信息的维度,去除该第一特征向量中的特征信息中的冗余部分,得到该第一特征向量中的池化特征信息,该l个目标元素组中每个目标元素组的中的元素均来自于不同的元素组,因此,该l个目标元素组中每个目标元素组具有特征信息的多样性,同时,电子设备基于该l目标元素组,确定该第二特征向量时,由于该h个元素被分成了l个目标元素组,因此,通过分组生成该第二特征向量的多个部分,并将该多个部分进行组合,得到该第二特征向量,如此,能够保证特种功能信息多样性的同时,快速、准确地确定出该第二特征向量
7、可选地,上述将该第二特征向量,按照加权多头注意力机制进行处理,得到至少一个初始特征向量,包括:基于该第二特征向量,确定至少一个注意力特征向量组,其中,一个注意力特征向量组包括一个询问向量、一个键向量和一个值向量;基于该至少一个注意力特征向量组中每个注意力特征向量中的询问向量和键向量,确定至少一个第一注意力特征向量;基于该至少一个第一注意力特征向量和预设权重参数矩阵,确定至少一个第二注意力特征向量;基于该至少一个第二注意力特征向量,确定该至少一个注意力权重向量,其中,一个注意力权重向量中的一个元素用于表征与该注意力权重向量对应的第二注意力特征向量中目标元素的概率,该目标元素为该第二注意力特征向量中与该注意力权重向量中的该元素对应的元素;基于该至少一个注意力权重向量和该至少一个注意力特征向量组中每个注意力特征向量组的值向量,确定该至少一个初始特征向量,其中,一个初始特征向量对应一个注意力特征向量组和目标注意力权重向量,该目标注意力权重向量为该至少一个注意力权重向量中与该注意力特征向量组对应的注意力权重向量。
8、本申请中,电子设备基于第二特征向量,确定至少一个注意力特征向量组,电子设备基于至少一个注意力特征向量组中每个注意力特征向量中的询问向量和键向量,确定至少一个第一注意力特征向量,电子设备基于至少一个第一注意力特征向量和预设权重参数矩阵,确定至少一个第二注意力特征向量,电子设备基于至少一个第二注意力特征向量,确定该至少一个注意力权重向量,由于一个注意力权重向量中的一个元素用于表征与该注意力权重向量对应的第二注意力特征向量中目标元素的概率,该目标元素为该第二注意力特征向量中与该注意力权重向量中的该元素对应的元素,因此,电子设备可以基于至少一个注意力权重向量和至少一个注意力特征向量组中每个注意力特征向量组的值向量,确定至少一个初始特征向量,其中,一个初始特征向量对应一个注意力特征向量组和目标注意力权重向量,该目标注意力权重向量为该至少一个注意力权重向量中与该注意力特征向量组对应的注意力权重向量,故而,通过为每个注意力特征向量组的值向量增加权重并确定出每个注意力特征向量组所对应的初始特征向量,该初始特征向量能够表达出更多的特征,进而可以得到更准确、可靠的表征目标文本的特征的至少一个初始特征向量。
9、可选地,上述基于长短时记忆网络对该至少一个初始特征向量进行处理,得到至少一个目标特征向量,包括:基于第一初始特征向量、预设初始状态向量、预设初始目标特征向量,确定第二状态向量和第一目标特征向量,该第一初始特征向量为该至少一个初始特征向量中的一个,该第一目标特征向量为该至少一个目标特征向量中的一个,该预设初始状态向量用于指示该第一目标特征向量中保留多少第一目标特征信息,该第一目标特征信息为该第一初始特征向量和该预设初始目标特征向量中包括的特征信息;基于第二初始特征向量、该第一目标特征向量以及该第二状态向量,确定第三状态向量和第二目标特征向量,该第二初始特征向量为该至少一个初始特征向量中除该第一初始特征向量外的初始特征向量,该第三状态向量用于指示第三目标特征向量中保留多少第二目标特征信息,该第二目标特征信息为该第二初始特征向量和该第三初始特征向量中包括的特征信息,该第三初始特征向量为该至少一个初始特征向量中除该第一初始特征向量和该第二初始特征向量外的初始特征向量,该第三目标特征向量为该至少一个目标特征向量中与该第三初始特征向量对本文档来自技高网...
【技术保护点】
1.一种文本分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的文本分析方法,其特征在于,所述基于目标文本,确定第一特征向量,包括:
3.根据权利要求2所述的文本分析方法,其特征在于,所述基于所述第一特征向量和目标神经网络模型,确定第二特征向量,包括:
4.根据权利要求3所述的文本分析方法,其特征在于,所述将所述第二特征向量,按照加权多头注意力机制进行处理,得到至少一个初始特征向量,包括:
5.根据权利要求4所述的文本分析方法,其特征在于,所述基于长短时记忆网络对所述至少一个初始特征向量进行处理,得到至少一个目标特征向量,包括:
6.根据权利要求1-5中任一项所述的文本分析方法,其特征在于,所述目标文本为用户评价文本,所述目标特征用于表征所述用户评价文本对应的情感特征,所述情感特征为满意、一般、很差或者极差。
7.一种文本分析装置,其特征在于,包括:确定模块和处理模块;
8.根据权利要求7所述的文本分析装置,其特征在于,
9.根据权利要求8所述的文本分析装置,其特征在于,
...【技术特征摘要】
1.一种文本分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的文本分析方法,其特征在于,所述基于目标文本,确定第一特征向量,包括:
3.根据权利要求2所述的文本分析方法,其特征在于,所述基于所述第一特征向量和目标神经网络模型,确定第二特征向量,包括:
4.根据权利要求3所述的文本分析方法,其特征在于,所述将所述第二特征向量,按照加权多头注意力机制进行处理,得到至少一个初始特征向量,包括:
5.根据权利要求4所述的文本分析方法,其特征在于,所述基于长短时记忆网络对所述至少一个初始特征向量进行处理,得到至少一个目标特征向量,包括:
6.根据权利要求1-5中任一项所述的文本分析方法,其特征在于,所述目标文本为用户评价文本,所述目标特征用于表征所述用户评价文本对应的情感特征,所述情感特征为满意、一般、很差或者极差。
【专利技术属性】
技术研发人员:张闯,吴宏宇,侯善忠,汉泽霖,高晶,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。