一种实现信息处理的方法、装置、计算机存储介质及终端制造方法及图纸

技术编号：24207930 阅读：17 留言：0更新日期：2020-05-20 15:29

一种实现信息处理的方法、装置、计算机存储介质及终端，包括：对预测语句和标准语句分别进行分词和依存句法分析；从依存句法分析的结果中，分别提取预测语句的第一集合和标准语句的第二集合；对第一集合和第二集合中包含的语义组成信息进行匹配处理；根据匹配处理的结果确定文本预测模型的准确度信息；其中，所述预测语句由所述文本预测模型生成；所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息：实体、实体与关系、及实体与属性。本发明专利技术实施例提升了对文本预测模型进行评估的准确度。

A method, device, computer storage medium and terminal for information processing

全部详细技术资料下载

【技术实现步骤摘要】
一种实现信息处理的方法、装置、计算机存储介质及终端
本文涉及但不限于文本分析技术，尤指一种实现信息处理的方法、装置、计算机存储介质及终端。
技术介绍
现有评估文本预测模型的指标大多是字词匹配，即评估的是预测语句和标准语句共有词语的数量；当使用表达方式和词汇不同时，相关技术无法对文本预测模型进行准确评估；例如：Ashinymetalpotfilledwithsomedicedveggies(一个闪亮的金属锅放满了切碎的蔬菜)和Thepanonthestovehaschoppedvegetablesinit(炉子上一个平底锅里有切过的蔬菜)，语义虽然相似，但因没有共有词语被评估为相似度低。此外，一些预测语句和标准语句虽然包含的共有词语的数量较多，但语句描述的主体和场景可能不同，通过共有词语的数量进行评估并不准确；例如：Ayounggirlisstandingontopofatenniscourt.(一个年轻女孩站在网球场上)和Agiraffeisstandingontopofagreenfield(一个长颈鹿站在草地上)，虽然都包括了“isstandingontopofa”这几个单词，但评估预测语句和标准语句相似，显然是不准确的。综上，如何提升对文本预测模型进行评估的准确度，成为一个有待解决的技术问题。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本专利技术实施例提供一种实现信息处理的方法、装置、计算机存储介质及终端，能够提升对文本预测模型进...

【技术保护点】
1.一种实现信息处理的方法，包括：/n对预测语句和标准语句分别进行分词和依存句法分析；/n从依存句法分析的结果中，分别提取预测语句的第一集合和标准语句的第二集合；/n对第一集合和第二集合中包含的语义组成信息进行匹配处理；/n根据匹配处理的结果确定文本预测模型的准确度信息；/n其中，所述预测语句由所述文本预测模型生成；所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息：实体、实体与关系、及实体与属性。/n

【技术特征摘要】
1.一种实现信息处理的方法，包括：
对预测语句和标准语句分别进行分词和依存句法分析；
从依存句法分析的结果中，分别提取预测语句的第一集合和标准语句的第二集合；
对第一集合和第二集合中包含的语义组成信息进行匹配处理；
根据匹配处理的结果确定文本预测模型的准确度信息；
其中，所述预测语句由所述文本预测模型生成；所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息：实体、实体与关系、及实体与属性。

2.根据权利要求1所述的方法，其特征在于，所述第一集合和所述第二集合为：
各所述语义组成信息通过对应的元组记录的集合。

3.根据权利要求1所述的方法，其特征在于，
所述实体与关系包括以下一项或任意组合：主谓宾关系、介宾关系；
所述实体与属性包括以下一项或任意组合：形容词性修饰关系、名词性修饰关系、名词性复合修饰关系。

4.根据权利要求2或3所述的方法，其特征在于，所述对第一集合和第二集合中包含的语义组成信息进行匹配处理，包括：
确定所述第一集合和所述第二集合中各元组包含的元素个数；
对所述第一集合和所述第二集合中元素个数相同的元组进行匹配处理。

5.根据权利要求4所述的方法，其特征在于，所述对第一集合和第二集合中元素个数相同的元组进行匹配处理，包括：
每一次选取所述第一集合的一个元组，将当前选取的所述第一集合的元组与所述第二集合中的每一个匹配元组分别进行以下匹配处理：
对当前选取的所述第一集合的元组与所述匹配元组，判断元组中包含的各元素所对应的词语是否为相同词或同义词；
当前选取的所述第一集合的元组与所述匹配元组，元组中包含的各元素所对应的词语均为相同词或同义词时，确定当前选取的所述第一集合的元组与所述匹配元组相匹配；
其中，所述匹配元组包括：所述第二集合中与当前选取的所述第一集合的元组元素个数相同的元组。

6.根据权利要求5所述的方法，其特征在于，所述判断元组中包含的各元素所对应...

【专利技术属性】
技术研发人员：李嘉琛，付骁弈，陈栋，姜旭，
申请(专利权)人：北京明略软件系统有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人