一种文本检测方法和装置制造方法及图纸

技术编号:32362819 阅读:26 留言:0更新日期:2022-02-20 03:32
本发明专利技术公开一种文本检测方法和装置,用以解决文本检测不准确和普适性差的问题。本方案包括:获取至少一个待检测文本,待检测文本包括通讯记录,通讯记录包括基于顺序的多条语句;将待检测文本输入情感识别模型,得到待检测文本的情感极性集合,情感极性集合用于按序表征多条语句各自对应的情感极性;根据情感极性集合确定待检测文本的情感评分值;根据情感评分值确定待检测文本的文本类型。上述情感极性集合能表征文本的情感变化顺序。基于情感变化顺序确定待检测文本的情感评分值,能使情感评分值准确表达待检测文本的情感,进而有效提高文本分类的准确性。而且,本方案可以应用通用型的情感识别模型,无需针对应用场景做模型训练,普适性强。普适性强。普适性强。

【技术实现步骤摘要】
一种文本检测方法和装置


[0001]本专利技术涉及文本检测领域,尤其涉及一种文本检测方法和装置。

技术介绍

[0002]在文本检测领域,可以通过识别文本内容进行文本分类。由于不同的应用场景要进行的检测往往不同,所以通常要预先训练适用于场景的模型。在训练过程中,需要依赖大量标注样本执行训练,而这些样本需要耗费大量的人力与时间进行打标。训练得到的模型能够适配于所需的应用场景,但不便于扩展迁移到其他应用场景,普适性差。
[0003]虽然现有技术中有通用型的情感识别模型,能简单识别单句文本的情感,但这种模型难以对整段、整篇文本的情感进行识别。离散地识别出文本中各句表达的情感,也无法准确确定文本整体表达的情感,识别准确性差。
[0004]如何提高文本检测的准确性和普适性,是本申请所要解决的技术问题。

技术实现思路

[0005]本申请实施例的目的是提供一种文本检测方法和装置,用以解决文本检测不准确和普适性差的问题。
[0006]第一方面,提供了一种文本检测方法,包括:
[0007]获取至少一个待检测文本,所述待检测文本包括通讯记录,所述通讯记录包括基于顺序的多条语句;
[0008]将所述待检测文本输入情感识别模型,得到所述待检测文本的情感极性集合,所述情感极性集合用于按序表征所述多条语句各自对应的情感极性;
[0009]根据所述情感极性集合确定所述待检测文本的情感评分值;
[0010]根据所述情感评分值确定所述待检测文本的文本类型,其中,所述文本类型包括第一类文本以及第二类文本。
[0011]第二方面,提供了一种文本检测装置,包括:
[0012]获取模块,获取至少一个待检测文本,所述待检测文本包括通讯记录,所述通讯记录包括基于顺序的多条语句;
[0013]识别模块,将所述待检测文本输入情感识别模型,得到所述待检测文本的情感极性集合,所述情感极性集合用于按序表征所述多条语句各自对应的情感极性;
[0014]第一确定模块,根据所述情感极性集合确定所述待检测文本的情感评分值;
[0015]第二确定模块,根据所述情感评分值确定所述待检测文本的文本类型,其中,所述文本类型包括第一类文本以及第二类文本。
[0016]第三方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面的方法的步骤。
[0017]第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算
机程序,该计算机程序被处理器执行时实现如第一方面的方法的步骤。
[0018]在本申请实施例中,通过获取至少一个待检测文本,所述待检测文本包括通讯记录,所述通讯记录包括基于顺序的多条语句;将所述待检测文本输入情感识别模型,得到所述待检测文本的情感极性集合,所述情感极性集合用于按序表征所述多条语句各自对应的情感极性;根据所述情感极性集合确定所述待检测文本的情感评分值;根据所述情感评分值确定所述待检测文本的文本类型,其中,所述文本类型包括第一类文本以及第二类文本。本专利技术实施例的方案,基于情感识别模型输出的情感极性集合对文本进行评分并分类。其中,情感极性集合中的多个情感极性按序排列,能表征文本的情感变化顺序。随后,基于该情感极性集合中表征的情感变化顺序确定待检测文本的情感评分值,能使情感评分值准确表达待检测文本的情感,进而有效提高文本分类的准确性。而且,本方案可以应用通用型的情感识别模型,无需针对应用场景做模型训练,普适性强。
附图说明
[0019]此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0020]图1a是本专利技术的一个实施例一种文本检测方法的流程示意图之一。
[0021]图1b是本专利技术的一个实施例预设情感识别模型的训练与应用流程示意图。
[0022]图2是本专利技术的一个实施例一种文本检测方法的流程示意图之二。
[0023]图3是本专利技术的一个实施例一种文本检测方法的流程示意图之三。
[0024]图4a是本专利技术的一个实施例一种文本检测方法的流程示意图之四。
[0025]图4b是本专利技术的一个实施例应用预设评分规则进行评分并存入字典的流程示意图。
[0026]图5a是本专利技术的一个实施例一种文本检测方法的流程示意图之五。
[0027]图5b是本专利技术的一个实施例将录音转换为文本的流程示意图。
[0028]图6是本专利技术的一个实施例一种文本检测装置的结构示意图。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请中附图编号仅用于区分方案中的各个步骤,不用于限定各个步骤的执行顺序,具体执行顺序以说明书中描述为准。
[0030]文本检测技术可以广泛应用于各种应用场景,通过对文本进行检测可以确定文本的类型,进而确定对文本或文本对应的用户执行的后续操作。具体而言,可以检测文本的情感极性,并基于文本表征的情感极性对文本进行分类。
[0031]举例而言,在服务领域,为提升用户体验,服务人员往往需要根据用户的情绪变化调整沟通内容。为了提高用户情感状态识别的效率,可以应用预先训练的情感识别模型分析确定用户的情感状态,或者,也可以检测服务人员在对话过程中的情感状态,进而根据服务过程中的情感状态对这段对话进行评价分类。但是,这种情感识别模型往往需要结合实
际应用场景基于大量打标签的样本进行训练,且训练得到的模型往往只适用于上述样本对应的场景,不能良好应用于其他的场景中。虽然通用型的语义识别模型能够根据通信内容简单分析语义表层的用户情绪,但实际应用中这种通用模型的识别结果准确性差。
[0032]为了解决现有技术中存在的问题,本申请实施例提供一种文本检测方法。在本实施例中,将本方案应用于服务坐席人员与客户的对话场景中进行说明。应理解的是,本方案也可以用于对其他场景的通讯记录进行检测分类,比如,可以对聊天软件中的群聊记录、电商平台的卖家与买家的沟通记录、会议记录等文本进行检测。通讯记录可以包括一个用户发出的内容文本,也可以包括多个用户相互沟通的内容文本。如图1a所示,本方案包括:
[0033]S11:获取至少一个待检测文本,所述待检测文本包括通讯记录,所述通讯记录包括基于顺序的多条语句。
[0034]其中,待检测文本可以是通讯用户通过通讯软件、短信、邮件等方式发送或接收到的内容,也可以是基于通讯用户电话录音、语音聊天记录或其他语音形式的内容识别得到的文本内容。该通讯记录中的多条语句按顺序排列,其中,如果通讯记录中的各条语句对应有时间戳本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本检测方法,其特征在于,包括:获取至少一个待检测文本,所述待检测文本包括通讯记录,所述通讯记录包括基于顺序的多条语句;将所述待检测文本输入情感识别模型,得到所述待检测文本的情感极性集合,所述情感极性集合用于按序表征所述多条语句各自对应的情感极性;根据所述情感极性集合确定所述待检测文本的情感评分值;根据所述情感评分值确定所述待检测文本的文本类型,其中,所述文本类型包括第一类文本以及第二类文本。2.如权利要求1所述的方法,其特征在于,所述情感极性包括负向情感极性。3.如权利要求2所述的方法,其特征在于,所述根据所述情感极性集合确定所述待检测文本的情感评分值,包括:根据所述情感极性集合中的所述负向情感极性确定所述待检测文本对应的多个类别的特征参数,且每个类别的特征参数的数量为至少一个;根据预设评分规则对所述特征参数进行评分,得到每一所述特征参数对应的第一评分值;根据所述第一评分值确定所述待检测文本的情感评分值。4.如权利要求3所述的方法,其特征在于,所述特征参数包括第一类特征参数,第二类特征参数,第三类特征参数,其中,所述第一类特征参数用于表征统计所述情感极性集合中所述负向情感极性的总个数,所述第二类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性次数的极值,所述第三类特征参数用于表征统计所述情感极性集合中连续出现所述负向情感极性超过第一预设阈值的次数。5.如权利要求3所述的方法,其特征在于,每一所述特征参数对应一个预设评分子规则,所述根据预设评分规则对所述特征参数进行评分,得到每一所述特征参数对应的第一评分值,包括;根据与每一所述特征参数对...

【专利技术属性】
技术研发人员:李长林蒋宁王洪斌吴海英权佳成曹磊
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1