本发明专利技术公开了一种提升图像识别准确率的方法,采用词嵌入技术,分析图片的关联文字,提升图像识别的准确率;步骤有:图片、文字描述对的提取;对于图像,采用深度学习技术,训练神经网络识别;对于图像识别,取前m项识别结果,参与后续处理;通过名词识别技术识别出文字里的名词序列;词向量的训练与计算;采用词向量近似度对图像识别结果进行过滤来提升识别准确性。本发明专利技术采用词嵌入技术,来分析图片的关联文字,以此提升了图像识别的准确率。
【技术实现步骤摘要】
本专利技术属于图像处理
,尤其涉及一种提升图像识别准确率的方法。
技术介绍
2006年来,采用深度神经网络(DNN)的“深度学习”(DeepLearning)技术开始受到学术界广泛关注,今天已经成为互联网大数据和人工智能的一个热潮。深度学习通过建立类似于人脑的分层模型结构,对输入数据逐级提取从底层到高层的特征,从而能很好地建立从底层信号到高层语义的映射关系,是机器智能领域最近这十年来最大进展,在图像识别领域的最大突破。采用深度学习对图像进行归类时,通常来说,对一个图片,会给出一系列识别结果及其概率。然而,图像并不是孤零零的存在的。对于新闻图片,除了图片,有新闻标题和新闻内容。新闻标题和新闻内容是和新闻图片里的内容密切相关的。对于电商图片,通常有所售商品的标题描述,这些文字描述和商品图片是密切相关的。现有技术方法是采用深度学习等技术,识别图像得出识别结果。对于新闻图像或电商图像,往往配有文字描述,现有识别技术,并没有利用上这些文字描述信息。本专利技术利用文字描述信息,来移除深度学习技术识别的候选结果里和文字描述关联度低的候选结果,达到提高识别准确性的目的
技术实现思路
本专利技术的目的在于提供一种提升图像识别准确率的方法,旨在解决现有识别技术,没有利用新闻图像或电商图像配有的文字描述信息,不能移除现有技术识别的候选结果里和文字描述关联度低的候选结果,不能提高准确性的识别问题。本专利技术是这样实现的,一种提升图像识别准确率的方法,所述提升图像识别准确率的方法采用词嵌入技术,计算图像识别的候选结果与说明文字的关联度(用最小距离来表征),去除关联度低的候选结果,提升图像识别的准确率;具体步骤如下:图片、文字描述对的提取;对于图像,采用深度学习技术,训练神经网络识别,识别结果为类别概率序列(C1,P1),(C2,P2),……(Cn,Pn),所述类别概率序列按照概率排序,具体为P1≥P2≥……≥Pn;采用的神经网络有但不限于AlexNet,GoogLeNet,VGG,Inception,ResNet;对于图像识别,取前m项识别结果(C1,P1),(C2,P2),……(Cm,Pm)(m≤n),参与后续处理;对于描述文字,通过名词识别技术识别出文字里的名词序列,对名词序列进行去掉重复的名词后得到的名词序列记为N1,N2,…Nk;词向量的训练与计算;采用词向量近似度对图像识别结果进行过滤来提升识别准确性。进一步,所述图片、文字描述对的提取包括:a)对于新闻图片,提取新闻标题,将提取的新闻标题作为对新闻图片的文字描述;b)对于电商图片,提取电商产品的描述,将提取的电商产品的描述作为对电商图片的文字描述。新闻文章和电商产品数据通过网页抓取得到的,抓取来的是html内容,通过对html内容进行结构化分析,可以提取出新闻标题及电商产品的描述。进一步,所述词向量的训练与计算包括:1)采用新闻语料,训练新闻词向量模型;采用电商语料,训练电商词向量模型;选择对应的词向量模型计算名词序列的词向量;2)计算名词序列N1,N2,…Nk的词向量,记为Vn1,Vn2,…Vnk;3)计算类别序列C1,C2,…Cm的词向量,记为Vc1,Vc2,…Vcm。进一步,所述采用词向量近似度对图像识别结果进行过滤来提升识别准确性包括:(1)记两个词向量V1,V2之间的近似度为dv1,v2;近似度越近,表示两个词意义越相近;对于每一个类别序列的词向量VCi,计算离VCi最近的名词序列的词向量Vnj,最近距离为dvci,nj;(2)设定距离阈值t,当dvci,nj大于t时,表示dvci,nj大于t的类别与图像描述文本关联度低,丢弃该类别;(3)余下的序列以最近距离为依据进行排序,最近距离小的类别排在前面,作为最终的图像识别结果。进一步,步骤(1)中,计算离VCi最近的名词序列的词向量Vnj,最近距离为dvci,nj,具体包括:选择余弦距离方法或欧氏距离方法计算词向量间距离;名词序列N1,N2,…Nk的词向量,记为Vn1,Vn2,…Vnk;假定候选结果Cm的词向量为Vcm;分别计算Vcm和Vn1,Vn2,…Vnk的距离,记为dvcm,n1,dvcm,n2,…,dvcm,nk;则,最近距离dvcm,vn=min(dvcm,n1,dvcm,n2,…,dvcm,nk)。进一步,步骤(3)中,所述余下的序列为:假定候选结果为C1,C2,…Cm,它们的词向量为Vc1,Vc2,…Vcm;名词序列N1,N2,…Nk的词向量,记为Vn1,Vn2,…Vnk;计算每个候选结果与名次序列的关联度;丢弃关联度低的结果,剩下的为余下序列。比如,假设有C1,C2,C3三个候选结果,通过计算,C2和名次序列的关联度低,则余下序列为C1,C3。进一步,欧氏距离方法为:给定两个向量V1(x11,x12,…,x1n)和V2(x21,x22,…,x2n),欧氏距离指欧几里德距离;余弦距离方法为:余弦距离为两个向量夹角的余弦;本专利技术提供的一种提升图像识别准确率的方法,采用词嵌入技术,来分析图片的关联文字,以此提升了图像识别的准确率。本专利技术利用文字描述信息,来移除深度学习技术识别的候选结果里和文字描述关联度低的候选结果,达到提高识别准确性的目的。本专利技术采用电商语料,训练60纬的词向量模型。采用欧氏距离,距离阈值为10,排除关联度低的类别,并根据最小距离进行重排后,最终的识别出准确的结果。附图说明图1是本专利技术实施例提供的提升图像识别准确率的方法流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。下面结合附图对本专利技术的应用原理作详细描述。如图1所示,本专利技术实施例提供的提升图像识别准确率的方法,所述提升图像识别准确率的方法采用词嵌入技术,分析图片的关联文字,提升图像识别的准确率;具体步骤如下:S101:图片、文字描述对的提取;S102:对于图像,采用深度学习技术,训练神经网络识别,识别结果为类别概率序列(C1,P1),(C2,P2),……(Cn,Pn),所述类别概率序列按照概率排序,具体为P1≥P2≥……≥Pn;采用的神经网络有但不限于AlexNet,GoogLeNet,VGG,Inception,ResNet;S103:对于图像识别,取前m项识别结果(C1,P1),(C2,P2),……(Cm,Pm)(m≤n),参与后续处理;S104:对于描述文字,通过名词识别技术识别出文字里的名词序列,对名词序列进行去掉重复的名词后得到的名词序列记为N1,N2,…Nk;S105:词向量的训练与计算;S106:采用词向量近似度对图像识别结果进行过滤来提升识别准确性。进一步,所述图片、文字描述对的提取包括:a)对于新闻图片,提取新闻标题,将提取的新闻标题作为对新闻图片的文字描述;b)对于电商图片,提取电商产品的描述,将提取的电商产品的描述作为对电商图片的文字描述。进一步,所述词向量的训练与计算包括:1)采用新闻语料,训练新闻词向量模型;采用电商语料,训练电商词向量模型;选择对应的词向量模型计算名词序列的词向量;2)计算名词序列N1,N2,…Nk的词向量,记为Vn1,Vn2,…Vnk;3)计算类别本文档来自技高网...
【技术保护点】
一种提升图像识别准确率的方法,其特征在于,所述提升图像识别准确率的方法采用词嵌入技术,计算图像识别的候选结果与说明文字的关联度,去除关联度低的候选结果,提升图像识别的准确率;具体步骤如下:图片、文字描述对的提取;对于图像,采用深度学习技术,训练神经网络识别,识别结果为类别概率序列(C1,P1),(C2,P2),……(Cn,Pn),所述类别概率序列按照概率排序,具体为P1≥P2≥……≥Pn;采用的神经网络有但不限于AlexNet,GoogLeNet,VGG,Inception,ResNet;对于图像识别,取前m项识别结果(C1,P1),(C2,P2),……(Cm,Pm)(m≤n),参与后续处理;对于描述文字,通过名词识别技术识别出文字里的名词序列,对名词序列进行去掉重复的名词后得到的名词序列记为N1,N2,…Nk;词向量的训练与计算;采用词向量近似度对图像识别结果进行过滤来提升识别准确性。
【技术特征摘要】
1.一种提升图像识别准确率的方法,其特征在于,所述提升图像识别准确率的方法采用词嵌入技术,计算图像识别的候选结果与说明文字的关联度,去除关联度低的候选结果,提升图像识别的准确率;具体步骤如下:图片、文字描述对的提取;对于图像,采用深度学习技术,训练神经网络识别,识别结果为类别概率序列(C1,P1),(C2,P2),……(Cn,Pn),所述类别概率序列按照概率排序,具体为P1≥P2≥……≥Pn;采用的神经网络有但不限于AlexNet,GoogLeNet,VGG,Inception,ResNet;对于图像识别,取前m项识别结果(C1,P1),(C2,P2),……(Cm,Pm)(m≤n),参与后续处理;对于描述文字,通过名词识别技术识别出文字里的名词序列,对名词序列进行去掉重复的名词后得到的名词序列记为N1,N2,…Nk;词向量的训练与计算;采用词向量近似度对图像识别结果进行过滤来提升识别准确性。2.如权利要求1所述的提升图像识别准确率的方法,其特征在于,所述图片、文字描述对的提取包括:a)对于新闻图片,提取新闻标题,将提取的新闻标题作为对新闻图片的文字描述;b)对于电商图片,提取电商产品的描述,将提取的电商产品的描述作为对电商图片的文字描述。3.如权利要求1所述的提升图像识别准确率的方法,其特征在于,所述词向量的训练与计算包括:1)采用新闻语料,训练新闻词向量模型;采用电商语料,训练电商词向量模型;选择对应的词向量模型计算名词序列的词向量;2)计算名词序列N1,N2,…Nk的词向量,记为Vn1,Vn2,…Vnk;3)计算类别序列C1,C2,…Cm的词向量,记为Vc1,Vc2,…Vcm。4.如权利要求1所述的提升图像识别准确率的方法,其特征在于,所述采用词向量近似度对图像识别结果进行过滤来提升识别准确性包括:(1)记两个词向量V1,V2之间的近似度为dv1,v2;近似度...
【专利技术属性】
技术研发人员:程国艮,李欣杰,
申请(专利权)人:中译语通科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。