文本处理方法、设备和存储介质技术

技术编号:39434131 阅读:12 留言:0更新日期:2023-11-19 16:17
本发明专利技术实施例提供一种文本处理方法、设备和存储介质,该方法包括:处理设备获取目标场景下的待处理文本,并利用同样适用于该目标场景文本分析模型对待处理文本进行分析,即得到待处理文本包含的三元组。三元组包括待处理文本中的主体词、该主体的修饰词以及此修饰词的情感类型。其中,适用于目标场景的文本分析模型可以利用原始场景对应的第一训练文本、第一训练文本的标签、以及目标场景对应的第二训练文本、第二训练文本对应的伪标签训练得到。上述方法中,可以利用原始场景对应的、经过人工标注的第一训练文本以及目标场景对应的、无需人工标注的第二训练样本扩展文本分析模型的使用场景,即扩展文本分析的使用场景。即扩展文本分析的使用场景。即扩展文本分析的使用场景。

【技术实现步骤摘要】
文本处理方法、设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种文本处理方法、设备和存储介质。

技术介绍

[0002]自然语言处理(Natural Language Processing,简称NLP)是计算机科学领域与人工智能领域中的一个重要方向,其已经有了广泛应用,比如可以使用基于NLP的文本分析模型对文本进行分析。当不同用户对同一目标对象产生评价文本时,使用文本分析模型对此评价文本进行分析能够得到不同用户对此目标对象的好恶倾向。并且在不同场景中目标对象可以不同,目标对象比如可以是出行场景中的某一酒店、某一景点、也可以是外卖场景中的某一餐馆、餐馆中的某一美食等等,也可以是新闻场景中的某一热点事件等等。
[0003]然而在实际中,文本分析模型的适用场景往往有限,因此,如何扩展模型的适用场景就成为一个亟待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种文本处理方法、设备和存储介质,用以扩展模型的适用场景。
[0005]第一方面,本专利技术实施例提供一种文本处理方法,包括:
[0006]获取目标场景对应的待处理文本;
[0007]将所述待处理文本输入适用于所述目标场景的文本分析模型,以由所述文本分析模型输出所述待处理文本包含的三元组,所述三元组包括所述待处理文本中的主体词、所述主体词的修饰词以及所述修饰词的情感极性;
[0008]其中,适用于所述目标场景的文本分析模型利用原始场景对应的第一训练文本、所述第一训练文本的标签、所述目标场景对应的第二训练文本以及所述第二训练文本的伪标签对适用于所述原始场景的文本分析模型进行训练后得到,所述标签和所述伪标签为三元组形式。
[0009]第二方面,本专利技术实施例提供一种文本处理方法,包括:
[0010]获取用户输入的目标场景对应的待处理文本;
[0011]将所述待处理文本输入适用于所述目标场景的文本分析模型,以由所述文本分析模型输出所述待处理文本包含的三元组,所述三元组包括所述待处理文本中的主体词、所述主体词的修饰词以及所述修饰词的情感极性,所述主体词用于描述所述目标场景中的目标对象;
[0012]根据所述待处理文本的三元组,确定所述用户对所述目标对象的评价结果;
[0013]其中,适用于所述目标场景的文本分析模型利用原始场景对应的第一训练文本、所述第一训练文本的标签、所述目标场景对应的第二训练文本以及所述第二训练文本的伪标签对适用于所述原始场景的文本分析模型进行训练后得到,所述标签和所述伪标签为三元组形式。
[0014]第三方面,本专利技术实施例提供一种文本处理方法,包括:
[0015]获取原始场景对应的第一训练文本以及所述第一训练文本的标签;
[0016]获取目标场景对应的第二训练文本以及所述第二训练文本的伪标签;
[0017]将所述第一训练文本以及所述第二训练文本作为训练数据,将所述第一训练文本的标签以及所述第二训练文本的伪标签作为监督信息,训练适用于所述原始场景的文本分析模型,以得到适用于所述目标场景的文本分析模型。
[0018]第四方面,本专利技术实施例提供一种文本处理方法,应用于服务平台,包括:
[0019]响应于用户的输入操作,获取目标场景对应的待处理文本;
[0020]将所述待处理文本输入所述服务平台,以由所述服务平台中适用于所述目标场景的文本分析模型输出所述待处理文本包含的三元组,所述三元组包括所述待处理文本中的主体词、所述主体词的修饰词以及所述修饰词的情感极性;
[0021]显示所述待处理文本的三元组;
[0022]其中,适用于所述目标场景的文本分析模型利用原始场景对应的第一训练文本、所述第一训练文本的标签、所述目标场景对应的第二训练文本以及所述第二训练文本的伪标签对适用于所述原始场景的文本分析模型进行训练后得到,所述标签和所述伪标签为三元组形式。
[0023]第五方面,本专利技术实施例提供一种电子设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面至第四方面中任一方面的文本处理方法。该电子设备还可以包括通信接口,用于与其他设备或通信系统通信。
[0024]第六方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如上述第一方面至第四方面中任一方面的文本处理方法。
[0025]本专利技术实施例提供的文本处理方法中,获取目标场景下的待处理文本,并利用同样适用于该目标场景文本分析模型对待处理文本进行分析,即得到待处理文本包含的三元组。三元组包括待处理文本中的主体词、该主体词的修饰词以及此修饰词的情感类型。其中,适用于目标场景的文本分析模型可以利用原始场景对应的第一训练文本、第一训练文本的标签、以及目标场景对应的第二训练文本、第二训练文本的伪标签训练得到。其中,第一训练文本的标签可以人为标注以得到,第二训练文本的伪标签无需人为标注得到,标签和伪标签都可以表现为三元组形式。
[0026]上述方法中,对于适用于原始场景的文本分析模型,可以利用原始场景对应的、经过人工标注的第一训练文本以及目标场景对应的、无需人工标注的第二训练文本进行训练以得到适用于目标场景的文本分析模型,也即是将适用于原始场景的文本分析模扩展到目标场景。
[0027]可见,利用上述方法,使用通过人工标注的、原始场景对应的训练文本以及无需人工标注的、目标场景对应的训练文本即可实现文本分析模型适用场景的扩展,扩大文本分析的使用场景。
附图说明
[0028]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本专利技术实施例提供的一种文本处理方法的流程图;
[0030]图2为本专利技术实施例提供的三元组的示意图;
[0031]图3a为本专利技术实施例提供的一种伪标签确定方式的流程图;
[0032]图3b为本专利技术实施例提供的一种伪标签确定方式的流程图;
[0033]图4为本专利技术实施例提供的另一种文本处理方法的流程图;
[0034]图5为本专利技术实施例提供的又一种文本处理方法的流程图;
[0035]图6为本专利技术实施例提供的又一种文本处理方法的流程图;
[0036]图7为本专利技术实施例提供的文本分析模型训练过程的示意图;
[0037]图8为本专利技术实施例提供的一种文本处理装置的结构示意图;
[0038]图9为本专利技术实施例提供的一种电子设备的结构示意图;
[0039]图10为本专利技术实施例提供的另一种文本处理装置的结构示意图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取目标场景对应的待处理文本;将所述待处理文本输入适用于所述目标场景的文本分析模型,以由所述文本分析模型输出所述待处理文本包含的三元组,所述三元组包括所述待处理文本中的主体词、所述主体词的修饰词以及所述修饰词的情感极性;其中,适用于所述目标场景的文本分析模型利用原始场景对应的第一训练文本、所述第一训练文本的标签、所述目标场景对应的第二训练文本以及所述第二训练文本的伪标签对适用于所述原始场景的文本分析模型进行训练后得到,所述标签和所述伪标签为三元组形式。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一训练文本作为训练数据,将所述第一训练文本的标签作为监督信息进行训练,以得到适用于所述原始场景的文本分析模型。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述第二训练文本的伪标签,所述伪标签由适用于所述原始场景的文本分析模型输出;将所述第一训练文本以及所述第二训练文本作为训练数据,将所述第一训练文本的标签以及所述第二训练文本的伪标签作为监督信息,训练所述原始场景的文本分析模型,以得到适用于所述目标场景的文本分析模型。4.根据权利要求1所述的方法,其特征在于,文本分析模型包括生成模型;所述方法还包括:将所述第二训练文本输入适用于所述原始场景的文本分析模型,以由适用于所述原始场景的文本分析模型输出伪标签集合,所述伪标签集合中的各伪标签包括适用于所述原始场景的文本分析模型在不同时间步上分别生成的多个词语的组合结果,在任一时间步上生成的多个词语对应于不同置信度;在所述伪标签集合中,确定所述第二训练文本的伪标签。5.根据权利要求1所述的方法,其特征在于,文本分析模型包括生成模型;所述方法还包括:将所述第二训练文本输入适用于所述原始场景的文本分析模型,以由适用于所述原始场景的文本分析模型输出伪标签集合,所述伪标签集合中的各伪标签包括适用于所述原始场景的文本分析模型在不同时间步上分别生成的目标词语的组合结果,在任一时间步上生成的目标词语根据在所述任一时间步上生成不同词语各自对应的置信度确定得到;在所述伪标签集合中,确定所述第二训练文本的伪标签。6.根据权利要求4或5所述的方法,其特征在于,所述在所述伪标签集合中,确定所述第二训练文本的伪标签,包括:按照所述伪标签集合中各伪标签的出现频率,对所述伪标签集合中的伪标签进行筛选;将筛选出的伪标签作为所述第二训练文本的伪标签。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用预设转换函数,将所述待处理文本包含的三元组进行格式转换,转换后的三元组
包括所述主体词、所述修饰词各自在所述待处理文本中的位置,以及所述修饰词的情感极性。8.一种文本处理方法,其特征在于,包括:获取用户输入的目标场景对应的待处理文本;将所述待处理文本输入适用于所述目标场景的文本分析模型,以由所述文本分...

【专利技术属性】
技术研发人员:谢耀赓陈桂臻邴立东玛哈妮赛赞亚波利亚陈晖韩炜
申请(专利权)人:新加坡科技设计大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1