一种实现信息处理的方法、装置、计算机存储介质及终端制造方法及图纸

技术编号:24207930 阅读:17 留言:0更新日期:2020-05-20 15:29
一种实现信息处理的方法、装置、计算机存储介质及终端,包括:对预测语句和标准语句分别进行分词和依存句法分析;从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;对第一集合和第二集合中包含的语义组成信息进行匹配处理;根据匹配处理的结果确定文本预测模型的准确度信息;其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。本发明专利技术实施例提升了对文本预测模型进行评估的准确度。

A method, device, computer storage medium and terminal for information processing

【技术实现步骤摘要】
一种实现信息处理的方法、装置、计算机存储介质及终端
本文涉及但不限于文本分析技术,尤指一种实现信息处理的方法、装置、计算机存储介质及终端。
技术介绍
现有评估文本预测模型的指标大多是字词匹配,即评估的是预测语句和标准语句共有词语的数量;当使用表达方式和词汇不同时,相关技术无法对文本预测模型进行准确评估;例如:Ashinymetalpotfilledwithsomedicedveggies(一个闪亮的金属锅放满了切碎的蔬菜)和Thepanonthestovehaschoppedvegetablesinit(炉子上一个平底锅里有切过的蔬菜),语义虽然相似,但因没有共有词语被评估为相似度低。此外,一些预测语句和标准语句虽然包含的共有词语的数量较多,但语句描述的主体和场景可能不同,通过共有词语的数量进行评估并不准确;例如:Ayounggirlisstandingontopofatenniscourt.(一个年轻女孩站在网球场上)和Agiraffeisstandingontopofagreenfield(一个长颈鹿站在草地上),虽然都包括了“isstandingontopofa”这几个单词,但评估预测语句和标准语句相似,显然是不准确的。综上,如何提升对文本预测模型进行评估的准确度,成为一个有待解决的技术问题。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本专利技术实施例提供一种实现信息处理的方法、装置、计算机存储介质及终端,能够提升对文本预测模型进行评估的准确度。本专利技术实施例提供了一种实现信息处理的方法,包括:对预测语句和标准语句分别进行分词和依存句法分析;从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;对第一集合和第二集合中包含的语义组成信息进行匹配处理;根据匹配处理的结果确定文本预测模型的准确度信息;其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。在一种示例性实施例中,所述第一集合和所述第二集合为:各所述语义组成信息通过对应的元组记录的集合。在一种示例性实施例中:所述实体与关系包括以下一项或任意组合:主谓宾关系、介宾关系;所述实体与属性包括以下一项或任意组合:形容词性修饰关系、名词性修饰关系、名词性复合修饰关系。在一种示例性实施例中,所述对第一集合和第二集合中包含的语义组成信息进行匹配处理,包括:确定所述第一集合和所述第二集合中各元组包含的元素个数;对所述第一集合和所述第二集合中元素个数相同的元组进行匹配处理。在一种示例性实施例中,所述对第一集合和第二集合中元素个数相同的元组进行匹配处理,包括:每一次选取所述第一集合的一个元组,将当前选取的所述第一集合的元组与所述第二集合中的每一个匹配元组分别进行以下匹配处理:对当前选取的所述第一集合的元组与所述匹配元组,判断元组中包含的各元素所对应的词语是否为相同词或同义词;当前选取的所述第一集合的元组与所述匹配元组,元组中包含的各元素所对应的词语均为相同词或同义词时,确定当前选取的所述第一集合的元组与所述匹配元组相匹配;其中,所述匹配元组包括:所述第二集合中与当前选取的所述第一集合的元组元素个数相同的元组。在一种示例性实施例中,所述判断元组中包含的各元素所对应的词语是否为相同词或同义词,包括:所述元组中包含词库中未存储的词语时,通过预设的分词工具将该词库中未存储的词语拆分;拆分获得的词语为词库中已存的词语时,将拆分后的词语表示为特征向量后,根据获得的所述特征向量的均值进行该词库中未存储的词语的相似度判断;拆分获得的词语为词库中未存储的词语时,通过预设的相似度判定方法进行该词库中未存储的词语的相似度判断;根据所述相似度判断的结果,确定元组中包含的各元素所对应的词语是否为相同词或同义词。在一种示例性实施例中,所述根据匹配处理的结果确定文本预测模型的准确度信息,包括:统计所述第一集合和所述第二集合中匹配的元组的个数;根据所述第一集合和所述第二集合中匹配的元组的个数、所述第一集合中元组的个数及所述第二集合中元组的个数,确定以下一项或任意组合的准确度信息:所述查准率、查全率和调和平均值。另一方面,本专利技术实施例还提供一种实现信息处理的装置,包括:分析单元、提取单元、匹配单元及确定单元;其中,分析单元用于:对预测语句和标准语句分别进行分词和依存句法分析;提取单元用于:从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;匹配单元用于:对第一集合和第二集合中包含的语义组成信息进行匹配处理;确定单元用于:根据匹配处理的结果确定文本预测模型的准确度信息;其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。再一方面,本专利技术实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现上述实现信息处理的方法。还一方面,本专利技术实施例还提供一种终端,包括:存储器和处理器,所述存储中保存有计算机程序;其中,处理器被配置为执行存储器中的计算机程序;所述计算机程序被所述处理器执行时实现如上述实现信息处理的方法。与相关技术相比,本申请技术方案包括:对预测语句和标准语句分别进行分词和依存句法分析;从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;对第一集合和第二集合中包含的语义组成信息进行匹配处理;根据匹配处理的结果确定文本预测模型的准确度信息;其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。本专利技术实施例通过语义组成信息的匹配确定文本预测模型的准确度,提升了对文本预测模型进行评估的准确度。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例实现信息处理的方法的流程图;图2为本专利技术实施例实现信息处理的装置的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以本文档来自技高网...

【技术保护点】
1.一种实现信息处理的方法,包括:/n对预测语句和标准语句分别进行分词和依存句法分析;/n从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;/n对第一集合和第二集合中包含的语义组成信息进行匹配处理;/n根据匹配处理的结果确定文本预测模型的准确度信息;/n其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。/n

【技术特征摘要】
1.一种实现信息处理的方法,包括:
对预测语句和标准语句分别进行分词和依存句法分析;
从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;
对第一集合和第二集合中包含的语义组成信息进行匹配处理;
根据匹配处理的结果确定文本预测模型的准确度信息;
其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。


2.根据权利要求1所述的方法,其特征在于,所述第一集合和所述第二集合为:
各所述语义组成信息通过对应的元组记录的集合。


3.根据权利要求1所述的方法,其特征在于,
所述实体与关系包括以下一项或任意组合:主谓宾关系、介宾关系;
所述实体与属性包括以下一项或任意组合:形容词性修饰关系、名词性修饰关系、名词性复合修饰关系。


4.根据权利要求2或3所述的方法,其特征在于,所述对第一集合和第二集合中包含的语义组成信息进行匹配处理,包括:
确定所述第一集合和所述第二集合中各元组包含的元素个数;
对所述第一集合和所述第二集合中元素个数相同的元组进行匹配处理。


5.根据权利要求4所述的方法,其特征在于,所述对第一集合和第二集合中元素个数相同的元组进行匹配处理,包括:
每一次选取所述第一集合的一个元组,将当前选取的所述第一集合的元组与所述第二集合中的每一个匹配元组分别进行以下匹配处理:
对当前选取的所述第一集合的元组与所述匹配元组,判断元组中包含的各元素所对应的词语是否为相同词或同义词;
当前选取的所述第一集合的元组与所述匹配元组,元组中包含的各元素所对应的词语均为相同词或同义词时,确定当前选取的所述第一集合的元组与所述匹配元组相匹配;
其中,所述匹配元组包括:所述第二集合中与当前选取的所述第一集合的元组元素个数相同的元组。


6.根据权利要求5所述的方法,其特征在于,所述判断元组中包含的各元素所对应...

【专利技术属性】
技术研发人员:李嘉琛付骁弈陈栋姜旭
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1