本申请实施例提供一种对文本序列中实体词的语义关系进行分类的方法、装置和电子设备,该装置包括:第一获得单元,其用于将文本序列中的每个词用词向量表示,以构建第一矩阵;第二获得单元,其利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵;第三获得单元,其利用注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;分类单元,其至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。根据本实施例,能够提高分类效率。
【技术实现步骤摘要】
对实体词的语义关系进行分类的方法、装置和电子设备
本申请涉及信息
,尤其涉及一种对文本序列中实体词的语义关系进行分类的方法、装置和电子设备。
技术介绍
实体词的语义关系分类是指,确定文本序列中的实体词之间的语义关系属于预定的语义关系中的哪一类,该预定的语义关系例如可以是上位概念与下位概念的关系、动宾关系等,例如,在句子“<e1>机器<e1>产生了大量<e2>噪音<e2>”中,确定实体词e1与实体词e2的关系为:因-果(e1,e2)。在自然语言处理领域,实体词的语义关系分类较受关注,因为语义关系分类在信息抽取、信息检索、机器翻译、问答、知识库建设和语义消歧等任务中都有重要的应用价值。在现有的实体词的语义关系分类方法中,可以利用基于长短期记忆(Long-ShortTermMemory,LSTM)单元的递归神经网络(RecurrentNeuralNetwork,RNN)模型来进行分类,该模型能有效利用序列数据中长距离依赖信息的能力,因此对于文本序列数据的处理非常有效。应该注意,上面对技术背景的介绍只是为了方便对本申请的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本申请的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
技术实现思路
本申请的专利技术人发现,在语义关系分类任务重,句子中的其它词对实体词的重要程度是不同的,对于分类结果的影响也是不同的。当文本序列中的词的数量较少时,现有的实体词的语义关系分类方法能够高效地进行分类,而当文本序列中的词的数量较多时,由于存在大量对分类结果影响不大的词,所以分类的效率会降低。本申请的实施例提供一种对实体词的语义关系进行分类的方法、装置和电子设备,通过引入注意力模型(AttentionModel)来确定文本序列中词的受关注程度,进而基于受关注程度对实体词之间的语义关系进行分类,由此,能够提高分类的效率。根据本申请实施例的第一方面,提供一种对文本序列中实体词的语义关系进行分类的装置,该装置包括:第一获得单元,其用于将文本序列中的每个词用词向量表示,以构建第一矩阵;第二获得单元,其利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵,其中,所述第二矩阵的行或列与所述文本序列中的词对应;第三获得单元,其利用注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;分类单元,其至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。根据本申请实施例的第二方面,提供一种对文本序列中实体词的语义关系进行分类的方法,该方法包括:将文本序列中的每个词用词向量表示,以构建第一矩阵;利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵(即,BLSTM的输出),其中,所述第二矩阵的行或列与所述文本序列中的词对应;利用注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;以及至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。根据本申请实施例的第三方面,提供一种电子设备,包括本申请实施例第一方面所述的对文本序列中实体词的语义关系进行分类的装置。本申请的有益效果在于:提高对实体词的语义关系进行分类的效率。参照后文的说明和附图,详细公开了本专利技术的特定实施方式,指明了本专利技术的原理可以被采用的方式。应该理解,本专利技术的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本专利技术的实施方式包括许多改变、修改和等同。针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。附图说明所包括的附图用来提供对本专利技术实施例的进一步的理解,其构成了说明书的一部分,用于例示本专利技术的实施方式,并与文字描述一起来阐释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:图1是本申请实施例1的分类方法的一个示意图;图2是本申请实施例1的获得第三矩阵的方法的一个示意图;图3是本申请实施例1的选择出预定数量的词的方法的一个示意图;图4是本申请实施例1的获得该第三矩阵的方法的另一个示意图;图5是本申请实施例1的根据第三矩阵和第二矩阵这两者确定语义关系的方法的一个示意图;图6是本申请实施例1的根据第三矩阵和第二矩阵这两者确定语义关系的方法的另一个示意图;图7是本申请实施例1的根据第三矩阵和第二矩阵这两者确定语义关系的方法的另一个示意图;图8是本申请实施例2的分类装置的一个示意图;图9是本申请实施例2的第三获得单元的一个示意图;图10是本申请实施例2的选择单元的一个示意图;图11是本申请实施例2的第三获得单元的另一个示意图;图12是本申请实施例2的分类单元的一个示意图;图13是本申请实施例2的分类单元的另一个示意图;图14是本申请实施例2的分类单元的另一个示意图;图15是本申请实施例3的电子设备的一个构成示意图。具体实施方式参照附图,通过下面的说明书,本专利技术的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本专利技术的特定实施方式,其表明了其中可以采用本专利技术的原则的部分实施方式,应了解的是,本专利技术不限于所描述的实施方式,相反,本专利技术包括落入所附权利要求的范围内的全部修改、变型以及等同物。实施例1本申请实施例1提供一种分类方法,用于对文本序列中实体词的语义关系进行分类。图1是实施例1的分类方法的一个示意图,如图1所示,该方法包括:S101、将文本序列中的每个词用词向量表示,以构建第一矩阵;S102、利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵,其中,所述第二矩阵的行或列与所述文本序列中的词对应;S103、利用注意力模型(AttentionModel),对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;S104、至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。在本实施例中,引入了注意力模型(AttentionModel)来确定文本序列中词的受关注程度,进而基于受关注程度对实体词之间的语义关系进行分类,由此,能够提高分类的效率。在本实施例的步骤S101中,可以根据词的特征,将词表示为词向量(WordingEmbedding),词向量可以是多维浮点数向量。其中,词的特征可以包括词本身的特征,词在文本序列中的位置特征等,例如,词本身的特征可以被表示为50维或100维的向量,词的位置特征可以被表示为5维的向量等。当然,本实施例不限于此,除了词本身的特征和词的位置本文档来自技高网...
【技术保护点】
一种对文本序列中实体词的语义关系进行分类的装置,该装置包括:第一获得单元,其用于将文本序列中的每个词用词向量表示,以构建第一矩阵;第二获得单元,其利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵,其中,所述第二矩阵的行或列与所述文本序列中的词对应;第三获得单元,其利用注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;以及分类单元,其至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。
【技术特征摘要】
1.一种对文本序列中实体词的语义关系进行分类的装置,该装置包括:第一获得单元,其用于将文本序列中的每个词用词向量表示,以构建第一矩阵;第二获得单元,其利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵,其中,所述第二矩阵的行或列与所述文本序列中的词对应;第三获得单元,其利用注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;以及分类单元,其至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。2.如权利要求1所述的装置,其中,所述第三获得单元包括:选择单元,其利用注意力模型,确定所述文本序列中每个词的受关注程度,并基于所述受关注程度,从所述文本序列中选择出预定数量的词;以及合并单元,其用于将所述第二矩阵中与选择出的所述预定数量的词对应的向量合并,以形成所述第三矩阵。3.如权利要求2所述的装置,其中,所述选择单元包括:第一合并子单元,其用于将所述第二矩阵中的实体词对应的向量与所述第二矩阵合并,形成第四矩阵;第一处理子单元,其对所述第四矩阵进行非线性处理,以确定所述文本序列每个词的受关注程度,并基于所述受关注程度,从所述文本序列中选择出第一预定数量的词;以及第二处理子单元,其将所述第二矩阵中与选择出的所述第一预定数量的词对应的向量与所述第二矩阵合并,形成更新后的第四矩阵,并基于更新后的第四矩阵从所述文本序列中再次选择出第一预定数量的词,其中,所述第一处理子单元选择出的第一预定数量的词和所述第二处理子单元选择出的第一预定数量的词的总和等于所述预定数量。4.如权利要求1所述的装置,其中,所述第三获得单元包括:确定单元,其利用注意力模型,确定所述文本序列中每个词的受关注程度;以及处理单元,根据所述受关注程度所对应的权重值,对所述第二矩阵进行处理,以形成所述第三矩阵。5.如权利要求1所述的...
【专利技术属性】
技术研发人员:张姝,杨铭,孙俊,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。