【技术实现步骤摘要】
一种知识图谱构建方法
[0001]本专利技术涉及自然语言处理领域,特别涉及一种知识图谱的构建方法。
技术介绍
[0002]随着信息时代的飞速发展,在互联网上拥有的信息资源越来越丰富,信息数据规模越来越巨大,表现形式也越来越多样。但是,对于海量的信息数据资源来说,其中的绝大部分都只能被人类所理解,机器对于这些信息的理解仍十分困难,特别是数量庞大的文本数据,自然语言理解也一直是非常热门的研究领域。
[0003]为了能够帮助机器更好地理解文本数据,知识图谱技术应运而生。知识图谱本质上是一种语义网络,由代表实体(Entity)的结点和代表实体之间关系的边构成。知识图谱从“关系”出发,具有更全面的实体覆盖率和更复杂的语义关系网,在智能搜索、智能问答等领域具有很好的应用前景。但是,在现有的知识图谱构建过程中,实体之间的关系大多需要人工构建或者依赖固定的逻辑,工作量巨大且难以普遍适用,而且对于实体来说,表示的角度比较单一化,使得最后建立的关系不够准确,进而影响了实际的构建效果。
技术实现思路
[0004]为了解决上述问题,本专利技术提出一种知识图谱的构建方法,以解决实体关系建立复杂且不够准确的问题。具体内容包括:
[0005]一种知识图谱构建方法,包括以下步骤:
[0006]对待处理的句子进行分词,得到多个单独词;
[0007]识别所述多个单独词中的实体,将所述实体两个一组组成实体对;
[0008]对于每个所述实体对,获取所述句子的句向量,所述句向量包括多个所述单独词的词-位 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,包括以下步骤:对待处理的句子进行分词,得到多个单独词;识别所述多个单独词中的实体,将所述实体两个一组组成实体对;对于每个所述实体对,获取所述句子的句向量,所述句向量包括多个所述单独词的词-位置向量,所述单独词的词-位置向量包括所述单独词的词向量,以及所述单独词与所述实体对的相对位置向量;根据所述句向量提取所述句子多个方面的表示特征;根据所述多个方面的表示特征得到一个融合特征,所述融合特征包括不少于一个特征向量;根据所述融合特征预测所述实体对的实体关系;根据所述实体对和对应的实体关系构建知识图谱。2.如权利要求1所述的知识图谱构建方法,其特征在于,所述实体对包括第一实体和第二实体,获取所述单独词与所述实体对的相对位置向量的步骤包括:分别计算所述单独词相对于所述第一实体以及所述单独词相对于第二实体的相对距离;根据预设的位置向量矩阵将所述相对距离转换为向量表示。3.如权利要求2所述的知识图谱构建方法,其特征在于,所述分别计算所述单独词相对于所述第一实体以及所述单独词相对于第二实体的相对距离之后,所述根据预设的位置向量矩阵将所述相对距离转换为向量表示之前,还包括步骤:判断所述相对距离是否在预设的最小距离与最大距离的范围之内,若所述相对距离小于所述最小距离,则以所述最小距离替换所述相对距离;若所述相对距离大于所述最大距离,则以所述最大距离替换所述相对距离。4.如权利要求1所述的知识图谱构建方法,其特征在于,所述根据所述句向量提取所述句子多个方面的表示特征包括:根据所述句向量,按照下述公式计算预设次数的所述表示特征,其中,h
i
为第i个方面的所述表示特征,i的取值范围为[1,l],l为所述预设次数,v为所述句向量,d
v
为构成所述句向量的所述单独词的数目,和分别表示第i次计算时的不同的参数矩阵且分别通过神经网络训练获得。5.如权利要求1所述的知识图谱构建方法,其特征在于,所述根据所述多个方面的表示特征得到一个融合特征包括:将每个方面的所述表示特征分别放入卷积神经网络的一个单独通道;对于每一所述单独通道,通过下述公式计算所述融合特征中的特征向量,c
j
=f(w
f
·
h
(i:i+n-1)
+b
f
)其中,j的取值范围为[1,m],c
j
表示所述融合特征中的第j项特征向量,m为卷积核的个数,f为非线性函数,w
f
为参数矩阵,b
f
为偏置参数,h
(i:i+n-1)
由h
i
、h
i+1
、
…
、h
i+n-1
依次连接组
成,n为卷积窗口的长度,h
i
表示第i个方面的所述表示特征;根据计算得到的所述m个特征向量生成所述融合特征。6.如权利要求1所述的知识图谱构建方法,其特征在于,在所述根据所述多个方面的表示特征得到一个融合特征之后,所述根据所述融合特征...
【专利技术属性】
技术研发人员:陈成才,
申请(专利权)人:上海智臻智能网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。