文本处理方法、装置、终端设备、电子设备及存储介质制造方法及图纸

技术编号:39255581 阅读:11 留言:0更新日期:2023-10-30 12:07
本公开关于一种文本处理方法、装置、电子设备及存储介质,属于自然语言处理技术领域。其中,该方法包括:获取待处理文本,提取待处理文本的文本特征,提取待处理文本的表情符号特征,根据文本特征和表情符号特征生成待处理文本的情感分析结果。因此,本公开通过提取待处理文本的文本特征和表情符号特征生成待处理文本的情感分析结果,由于在处理过程中考虑到了待处理文本中表情符号的情感语义,因此提高了情感分析的准确度。了情感分析的准确度。了情感分析的准确度。

【技术实现步骤摘要】
文本处理方法、装置、终端设备、电子设备及存储介质


[0001]本公开涉及自然语言处理
,尤其涉及一种文本处理方法、装置、终端设备、电子设备及存储介质。

技术介绍

[0002]目前,随着社交媒体和电商的快速发展,emoji(表情符号)的使用越来越普遍,在情感分析任务上,emoji对句子的情感有非常大的影响,但目前主流的情感分析方法并没有考虑到emoji的情感语义,使得情感分析的准确度较低。

技术实现思路

[0003]本公开提供一种文本处理方法、装置、终端设备、电子设备及存储介质,以至少解决相关技术中情感分析的准确度较低的问题。
[0004]本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种文本处理方法,包括:获取待处理文本;提取所述待处理文本的文本特征;提取所述待处理文本的表情符号特征;根据所述文本特征和所述表情符号特征生成所述待处理文本的情感分析结果。
[0006]在本公开的一个实施例中,所述提取所述待处理文本的表情符号特征,包括:识别所述待处理文本中的表情符号;根据所述表情符号生成表情符号文本;获取所述表情符号在所述待处理文本中的位置信息;根据所述表情符号文本和所述位置信息生成所述表情符号特征。
[0007]在本公开的一个实施例中,所述根据所述表情符号文本和所述位置信息生成所述表情符号特征,包括:根据所述表情符号文本生成表情符号表情特征;根据所述位置信息生成表情符号位置特征;根据所述表情符号表情特征和所述表情符号位置特征生成所述表情符号特征
[0008]在本公开的一个实施例中,所述根据所述文本特征和所述表情符号特征生成所述待处理文本的情感分析结果,包括:根据所述文本特征和所述表情符号特征生成拼接特征;根据所述拼接特征生成所述情感分析结果。
[0009]在本公开的一个实施例中,所述提取所述待处理文本的文本特征,包括:根据预训练语言模型提取所述待处理文本的所述文本特征。
[0010]根据本公开实施例的第二方面,提供一种文本处理装置,包括:获取模块,被配置为执行获取待处理文本;第一提取模块,被配置为执行提取所述待处理文本的文本特征;第二提取模块,被配置为执行提取所述待处理文本的表情符号特征;生成模块,被配置为执行根据所述文本特征和所述表情符号特征生成所述待处理文本的情感分析结果。
[0011]在本公开的一个实施例中,所述第二提取模块,进一步被配置为执行:识别所述待处理文本中的表情符号;根据所述表情符号生成表情符号文本;获取所述表情符号在所述待处理文本中的位置信息;根据所述表情符号文本和所述位置信息生成所述表情符号特
征。
[0012]在本公开的一个实施例中,所述第二提取模块,进一步被配置为执行:根据所述表情符号文本生成表情符号表情特征;根据所述位置信息生成表情符号位置特征;根据所述表情符号表情特征和所述表情符号位置特征生成所述表情符号特征。
[0013]在本公开的一个实施例中,所述生成模块,进一步被配置为执行:根据所述文本特征和所述表情符号特征生成拼接特征;根据所述拼接特征生成所述情感分析结果。
[0014]在本公开的一个实施例中,所述第一提取模块,进一步被配置为执行:根据预训练语言模型提取所述待处理文本的所述文本特征。
[0015]根据本公开实施例的第三方面,提供一种终端设备,包括:如本公开实施例第二方面所述的文本处理装置。
[0016]根据本公开实施例的第四方面,提供一种电子设备,包括:处理器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如本公开实施例第一方面所述的方法。
[0017]根据本公开实施例的第五方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本公开实施例第一方面所述的方法。
[0018]本公开的实施例提供的技术方案至少带来以下有益效果:通过提取待处理文本的文本特征和表情符号特征生成待处理文本的情感分析结果,由于在处理过程中考虑到了待处理文本中表情符号的情感语义,因此提高了情感分析的准确度。
[0019]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
[0021]图1是根据一示例性实施例示出的一种文本处理方法的流程图。
[0022]图2是根据一示例性实施例示出的情感分析模型的框架图。
[0023]图3是根据一示例性实施例示出的另一种文本处理方法的流程图。
[0024]图4是根据一示例性实施例示出的一种文本处理装置的框图。
[0025]图5是根据一示例性实施例示出的一种终端设备的框图。
[0026]图6是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
[0027]为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
[0028]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相
一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和装置的例子。
[0029]需要说明的是,本公开中所有获取信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
[0030]图1是根据一示例性实施例示出的一种文本处理方法的流程图,如图1所示,本公开实施例的文本处理方法,可以包括以下步骤S101

S103。
[0031]S101,获取待处理文本。
[0032]需要说明的是,本公开实施例的文本处理方法的执行主体可以为终端设备,或者也可以为服务器。终端设备包括但不限于手机、平板电脑、笔记本、台式电脑、车载终端、智能家电等。本公开实施例的文本处理方法可以由本公开实施例的文本处理装置执行,本公开实施例的文本处理装置可以配置在任意终端设备中,以执行本公开实施例的文本处理方法。本公开实施例的文本处理装置也可以配置在服务器中,对此不作限制。
[0033]相关技术中,情感分析任务中未考虑emoji的情感语义,使得情感分析的结果准确度不高。例如,对于一句话“40w快充”,这里的会在情感分析中被当做未知字符串,如果我们不知道所代表的意思,那么“40w快充”的情感分析就会是一个中性的评论,如果我们知道代表了“牛”或者“厉害”的意思,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取待处理文本;提取所述待处理文本的文本特征;提取所述待处理文本的表情符号特征;根据所述文本特征和所述表情符号特征生成所述待处理文本的情感分析结果。2.根据权利要求1所述的文本处理方法,其特征在于,所述提取所述待处理文本的表情符号特征,包括:识别所述待处理文本中的表情符号;根据所述表情符号生成表情符号文本;获取所述表情符号在所述待处理文本中的位置信息;根据所述表情符号文本和所述位置信息生成所述表情符号特征。3.根据权利要求2所述的文本处理方法,其特征在于,所述根据所述表情符号文本和所述位置信息生成所述表情符号特征,包括:根据所述表情符号文本生成表情符号表情特征;根据所述位置信息生成表情符号位置特征;根据所述表情符号表情特征和所述表情符号位置特征生成所述表情符号特征。4.根据权利要求1所述的文本处理方法,其特征在于,所述根据所述文本特征和所述表情符号特征生成所述待处理文本的情感分析结果,包括:根据所述文本特征和所述表情符号特征生成拼接特征;根据所述拼接特征生成所述情感分析结果。5.根据权利要求1所述的文本处理方法,其特征在于,所述提取所述待处理文本的文本特征,包括:根据预训练语言模型提取所述待处理文本的所述文本特征。6.一种文本处理装置,其特征在于,包括:获取模块,被配置为执行获取待处理文本;第一提取模块,被配置为执行提取所述待处理文本的文本特征;第二提取模块,被配置为执行提取所述待处理文本的表情符号特征;生成模块,被配置为执行根据所述文本特征和所述表情符号特征生成所述待处理文本...

【专利技术属性】
技术研发人员:陈明
申请(专利权)人:北京小米移动软件有限公司北京小米松果电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1