文本分析方法、装置、设备及计算机存储介质制造方法及图纸

技术编号:32672978 阅读:21 留言:0更新日期:2022-03-17 11:28
本公开提供了文本分析方法、装置、设备及计算机存储介质,计算机技术领域,尤其涉及大数据、NLP、智能搜索、知识图谱、深度学习等人工智能领域。具体实现方案为:对待分析文本的词语进行属性解析,获得属性解析结果;对所述词语之间的语法依存关系进行解析,获得依存关系解析结果;根据所述属性解析结果和所述依存关系解析结果,确定所述待分析文本中的主体和所述主体的描述语。本公开实施例能够提高文本分析的准确性。析的准确性。析的准确性。

【技术实现步骤摘要】
文本分析方法、装置、设备及计算机存储介质


[0001]本公开涉及计算机
,尤其涉及大数据、NLP(Natural Language Processing,自然语言处理)、智能搜索、知识图谱、深度学习等人工智能领域。

技术介绍

[0002]随着计算机技术的发展,计算机技术对数据、信息的处理效果也显著提升,不仅处理速度加快,且灵活程度提高,在人工智能等领域,计算机生成的图像、语言等处理结果,也能够逐渐减少机械化的模板感,在保证正确率的情况下,达到越来越贴合实际生活场景的效果。
[0003]比如,机器可以对一部分文本进行分析,实现信息的提取等目的。机器对文本的分析可应用于搜索、对话等多种场景,由于这些场景中的文本,与用户的使用习惯、普通群体的表达习惯息息相关,因此,需要对文本分析技术进行改进,以更好地适应用户群体在使用产品过程中的一般习惯。

技术实现思路

[0004]本公开提供了一种文本分析方法、装置、设备及计算机存储介质。
[0005]根据本公开的一方面,提供了一种文本分析方法,包括:对待分析文本的词语进行属性解析,获得属性解析结果;
[0006]对词语之间的语法依存关系进行解析,获得依存关系解析结果;
[0007]根据属性解析结果和依存关系解析结果,确定待分析文本中的主体和主体的描述语。
[0008]根据本公开的另一方面,提供了一种文本分析装置,包括:
[0009]属性解析结果获得模块,用于对待分析文本的词语进行属性解析,获得属性解析结果;
[0010]依存关系解析结果获得模块,用于对词语之间的语法依存关系进行解析,获得依存关系解析结果;
[0011]分析结果模块,用于根据属性解析结果和依存关系解析结果,确定待分析文本中的主体和主体的描述语。
[0012]根据本公开的另一方面,提供了一种电子设备,包括:
[0013]至少一个处理器;以及
[0014]与该至少一个处理器通信连接的存储器;其中,
[0015]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
[0016]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
[0017]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,该
计算机程序/指令被处理器执行时实现本公开任一实施例中的方法。
[0018]根据本公开的技术,能够根据词语的属性和待分析文本的句法依存信息,确定待分析文本中的主体和对主体的描述语,从而有助于对待分析文本进行理解,以从待分析文本中提取出关键的重点信息。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0021]图1是根据本公开一实施例的文本分析方法流程示意图;
[0022]图2是根据本公开另一实施例的文本分析方法流程示意图;
[0023]图3是根据本公开又一实施例的文本分析方法流程示意图;
[0024]图4是根据本公开又一实施例的文本分析方法流程示意图;
[0025]图5是根据本公开一示例的文本分析方法示意图;
[0026]图6是根据本公开一实施例的文本分析装置流程示意图;
[0027]图7是根据本公开另一实施例的文本分析装置流程示意图;
[0028]图8是根据本公开又一实施例的文本分析装置流程示意图;
[0029]图9是根据本公开又一实施例的文本分析装置流程示意图;
[0030]图10是用来实现本公开实施例的文本分析方法的电子设备的框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]根据本公开的实施例,提供了一种文本分析方法,图1是根据本公开实施例的基于文本分析方法的流程示意图,该方法可以应用于文本分析装置,例如,该装置可以部署于终端或服务器或其它处理设备执行的情况下,可以执行待分析文本的获取、待分析文本的分析等步骤。其中,终端可以为用户设备(UE,User Equipment)、移动设备、蜂窝电话、无绳电话、个人数字处理(PDA,Personal Digital Assistant)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图1所示,文本分析方法包括:
[0033]步骤S11:对待分析文本的词语进行属性解析,获得属性解析结果;
[0034]步骤S12:对词语之间的语法依存关系进行解析,获得依存关系解析结果;
[0035]步骤S13:根据属性解析结果和依存关系解析结果,确定待分析文本中的主体和主体的描述语。
[0036]本实施例中,待分析文本可以是一段文字或一句文字,还可以是词语的组合。
[0037]本公开实施例可应用于多种需要对文本进行分析的场景,比如机器阅读、搜索等。
[0038]在应用于搜索场景的情况下,待分析文本可以是用于搜索查询的文本,可以至少
包括一个或一个以上的词语。对待分析文本的词语进行属性解析,可以包括对待分析的文本进行词语的提取,对提取的词语进行属性解析。本公开实施例中的词语,可以至少包括一个文字最小单位。比如,在待分析文本为中文的情况下,待分析文本中的词语至少包括一个汉字、数字或特殊符号。
[0039]对待分析文本的词语进行属性解析,可以包括对待分析文本的词语进行词语的某种性质的分析,比如,确定词语的词性或词类。
[0040]在待分析文本为中文的情况下,确定词语的词性,可以包括确定词语为实词或虚词。确定词语的词性。确定词语的词性,还可以包括确定词语具体为名词、动词、形容词、代词、数词、量词、区别词、副词、介词、连词、拟声词、助词、叹词等中的至少一种。
[0041]在搜索场景下,待分析文本中还可能包括其它属性,比如,数学符号、阿拉伯数字、希腊字母(α、β等)、其它具有含义的特殊字符、字母或字母组合(比如物品英文首字母缩写、人名首字母缩写)、常见英文单词、常见其它语种单词等。
[0042]在另一种可能的实现方式中,待分析文本的词语的属性,与待分析文本的语种有关,包括与待分析文本的语种对应的属性。这种情况下,可先确定待分析文本的语种,比如,待分析文本的语种默本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本分析方法,包括:对待分析文本的词语进行属性解析,获得属性解析结果;对所述词语之间的语法依存关系进行解析,获得依存关系解析结果;根据所述属性解析结果和所述依存关系解析结果,确定所述待分析文本中的主体和所述主体的描述语。2.根据权利要求1所述的方法,其中,所述对待分析文本的词语进行属性解析,获得属性解析结果,包括:确定每个所述词语的属性;针对每个所述词语,确定所述词语在所述属性下的子分类;将所有所述词语的属性和子分类,作为所述属性解析结果。3.根据权利要求1或2所述的方法,其中,所述对所述词语之间的语法依存关系进行解析,获得依存关系解析结果,包括:根据所述待分析文本,获得所述词语之间的语法依存关系;根据所述语法依存关系,获得主体候选项和所述主体的描述语候选项;选择至少一个所述主体候选项和至少一个所述主体的描述语候选项,组成主体与主体的描述语组合项;将所述主体与所述主体的描述语组合项作为所述依存关系解析结果。4.根据权利要求3所述的方法,其中,所述选择至少一个主体候选项和至少一个主体的描述语候选项,组成主体与主体的描述语组合项,包括:获得由所有所述主体候选项,结合所述主体的描述语候选项所组成的组合;将所述组合项作为所述主体与主体的描述语组合项。5.根据权利要求3或4所述的方法,其中,在所述待分析文本中包括设定关键词的情况下,所述根据所述语法依存关系,获得主体候选项和主体的描述语候选项,包括:在所述待分析文本中,确定与设定关键词存在预设先后顺序的候选词语;根据所述候选词语,确定所述主体候选项或主体的描述语候选项中的至少一个。6.根据权利要求3

5中任意一项所述的方法,其中,在所述待分析文本中存在由至少两个设定词性的词语按照预设顺序组合成的词组的情况下,所述根据所述语法依存关系,获得主体候选项和主体的描述语候选项,包括:将所述词组拆分,获得拆分词语;根据拆分词语,确定所述主体候选项和主体的描述语候选项中的至少一个。7.根据权利要求6所述的方法,其中,所述至少两个设定词性的词语包括设定词性的起始词、和设定词性的终止词,所述起始词和所述终止词在所述待分析文本中的字数距离或词数距离处于设定范围。8.根据权利要求3

7中任意一项所述的方法,其中,在所述待分析文本中存在实体词的情况下,所述根据所述语法依存关系,获得主体候选项和主体的描述语候选项,包括:将所述实体词作为所述主体候选项;根据所述主体候选项和设定模式,确定所述主体的描述语候选项,所述设定模式包括主体、主体的描述语和其它设定词语,以及所述主体、主体的描述语和其它设定词语之间的相对顺序。
9.根据权利要求8所述的方法,其中,所述将所述实体词作为所述主体候选项,包括:在所述待分析文本中包括两个以上顺序衔接的同类实体的情况下,将所述两个以上顺序衔接的同类实体合并为所述实体词。10.一种文本分析装置,包括:属性解析结果获得模块,用于对待分析文本的词语进行属性解析,获得属性解析结果;依存关系解析结果获得模块,用于对所述词语之间的语法依存关系进行解析,获得依存关系解析结果;分析结果模块,用于根据所述属性解析结果和所述依存关系解析结果,确定所述待分析文本中的...

【专利技术属性】
技术研发人员:夏琦黄昉史亚冰蒋烨柴春光朱勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1