【技术实现步骤摘要】
文本分析方法、装置、设备及计算机存储介质
[0001]本公开涉及计算机
,尤其涉及大数据、NLP(Natural Language Processing,自然语言处理)、智能搜索、知识图谱、深度学习等人工智能领域。
技术介绍
[0002]随着计算机技术的发展,计算机技术对数据、信息的处理效果也显著提升,不仅处理速度加快,且灵活程度提高,在人工智能等领域,计算机生成的图像、语言等处理结果,也能够逐渐减少机械化的模板感,在保证正确率的情况下,达到越来越贴合实际生活场景的效果。
[0003]比如,机器可以对一部分文本进行分析,实现信息的提取等目的。机器对文本的分析可应用于搜索、对话等多种场景,由于这些场景中的文本,与用户的使用习惯、普通群体的表达习惯息息相关,因此,需要对文本分析技术进行改进,以更好地适应用户群体在使用产品过程中的一般习惯。
技术实现思路
[0004]本公开提供了一种文本分析方法、装置、设备及计算机存储介质。
[0005]根据本公开的一方面,提供了一种文本分析方法,包括:对待分析文本的词语进行属性解析,获得属性解析结果;
[0006]对词语之间的语法依存关系进行解析,获得依存关系解析结果;
[0007]根据属性解析结果和依存关系解析结果,确定待分析文本中的主体和主体的描述语。
[0008]根据本公开的另一方面,提供了一种文本分析装置,包括:
[0009]属性解析结果获得模块,用于对待分析文本的词语进行属性解析,获得属性解析结果;
...
【技术保护点】
【技术特征摘要】
1.一种文本分析方法,包括:对待分析文本的词语进行属性解析,获得属性解析结果;对所述词语之间的语法依存关系进行解析,获得依存关系解析结果;根据所述属性解析结果和所述依存关系解析结果,确定所述待分析文本中的主体和所述主体的描述语。2.根据权利要求1所述的方法,其中,所述对待分析文本的词语进行属性解析,获得属性解析结果,包括:确定每个所述词语的属性;针对每个所述词语,确定所述词语在所述属性下的子分类;将所有所述词语的属性和子分类,作为所述属性解析结果。3.根据权利要求1或2所述的方法,其中,所述对所述词语之间的语法依存关系进行解析,获得依存关系解析结果,包括:根据所述待分析文本,获得所述词语之间的语法依存关系;根据所述语法依存关系,获得主体候选项和所述主体的描述语候选项;选择至少一个所述主体候选项和至少一个所述主体的描述语候选项,组成主体与主体的描述语组合项;将所述主体与所述主体的描述语组合项作为所述依存关系解析结果。4.根据权利要求3所述的方法,其中,所述选择至少一个主体候选项和至少一个主体的描述语候选项,组成主体与主体的描述语组合项,包括:获得由所有所述主体候选项,结合所述主体的描述语候选项所组成的组合;将所述组合项作为所述主体与主体的描述语组合项。5.根据权利要求3或4所述的方法,其中,在所述待分析文本中包括设定关键词的情况下,所述根据所述语法依存关系,获得主体候选项和主体的描述语候选项,包括:在所述待分析文本中,确定与设定关键词存在预设先后顺序的候选词语;根据所述候选词语,确定所述主体候选项或主体的描述语候选项中的至少一个。6.根据权利要求3
‑
5中任意一项所述的方法,其中,在所述待分析文本中存在由至少两个设定词性的词语按照预设顺序组合成的词组的情况下,所述根据所述语法依存关系,获得主体候选项和主体的描述语候选项,包括:将所述词组拆分,获得拆分词语;根据拆分词语,确定所述主体候选项和主体的描述语候选项中的至少一个。7.根据权利要求6所述的方法,其中,所述至少两个设定词性的词语包括设定词性的起始词、和设定词性的终止词,所述起始词和所述终止词在所述待分析文本中的字数距离或词数距离处于设定范围。8.根据权利要求3
‑
7中任意一项所述的方法,其中,在所述待分析文本中存在实体词的情况下,所述根据所述语法依存关系,获得主体候选项和主体的描述语候选项,包括:将所述实体词作为所述主体候选项;根据所述主体候选项和设定模式,确定所述主体的描述语候选项,所述设定模式包括主体、主体的描述语和其它设定词语,以及所述主体、主体的描述语和其它设定词语之间的相对顺序。
9.根据权利要求8所述的方法,其中,所述将所述实体词作为所述主体候选项,包括:在所述待分析文本中包括两个以上顺序衔接的同类实体的情况下,将所述两个以上顺序衔接的同类实体合并为所述实体词。10.一种文本分析装置,包括:属性解析结果获得模块,用于对待分析文本的词语进行属性解析,获得属性解析结果;依存关系解析结果获得模块,用于对所述词语之间的语法依存关系进行解析,获得依存关系解析结果;分析结果模块,用于根据所述属性解析结果和所述依存关系解析结果,确定所述待分析文本中的...
【专利技术属性】
技术研发人员:夏琦,黄昉,史亚冰,蒋烨,柴春光,朱勇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。