一种基于文本的服装流行趋势预测方法技术

技术编号:32649948 阅读:20 留言:0更新日期:2022-03-12 18:40
本发明专利技术公开一种基于文本的服装流行趋势预测方法,其方法主要包括如下步骤:(1)获取服装文本数据;(2)对服装文本数据进行预处理,包括文本分词、停用词去除、文本表示;(3)改进服装文本循环神经网络,预测服装流行趋势。相比现有技术,采用本循环神经网络模型构建服装流行趋势预测模型,通过对服装文本信息,包括服装款式、服装风格、服装材质、场合、特点及评论,有效预测服装流行趋势。有效预测服装流行趋势。有效预测服装流行趋势。

【技术实现步骤摘要】
一种基于文本的服装流行趋势预测方法


[0001]本专利技术属于智能服装
,更具体地,涉及一种基于文本的服装流行趋势预测方法。

技术介绍

[0002]目前,在线上服装领域,通常会由设计师通过自己的学识经验来设计新的服饰,每次设计一款服饰要消耗大量的时间和精力,设计师也不可能面面俱到的设计出所需的每一种风格的服饰,未来各个地区所流行的服饰并不能被轻易的预测,通常还需要多个熟悉该地区的设计师参与。因此,在服装领域,对服装未来发展趋势的智能预测拥有潜在且巨大的应用场景。
[0003]公开号为CN110705755A的中国专利公开了“一种基于深度学习的服装流行趋势预测方法与装置”,从电商服装网站采集历年的流行服装图片和信息,进行特征提取和整合,再根据模型结果输出服装流行度为topk的服装排名的方案,但是这种方案对于服装流行趋势预测不准确,还需进一步优化。

技术实现思路

[0004]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于文本的服装流行趋势预测方法,其目的在于通过收集当下各大网上服装购物网站的服装文本信息,通过深度学习方法预测服装流行趋势,可靠且具有实时性。
[0005]为实现上述目的,按照本专利技术的一个方面,提供了一种基于文本的服装流行趋势预测方法,包括如下步骤:步骤(1),获取服装文本语句;步骤(2),对服装文本语句进行预处理,包括文本分词、停用词去除、文本表示;步骤(3),改进服装文本循环神经网络,将步骤(2)中得到的服装文本表示输入到改进服装文本循环神经网络中,预测服装流行趋势;所述的改进的服装文本循环神经网络包括:中断循环神经网络模块、注意力机制模块和全连接输出模块,其中中断循环神经网络模块用于获取服装文本表示的上下文表示向量,注意力机制模块用于获得带注意力权重的特征向量,全连接输出模块用于获得最后的预测结果进一步的,步骤(1)中通过网络爬虫、手工采集方式搜集各大购物网站的服装文本信息,包括服装款式、服装风格、服装材质、场合、特点及评论;其中,购物网站包括亚马逊

网上购物商城、天猫商城、淘宝网以及京东商城。
[0006]进一步的,步骤(2)中文本分词包括:对服装文本语句进行切分,识别句子中的标点符号或字词,然后在标点符号或字词的位置上插入分隔符来将一条句子隔开。
[0007]进一步的,步骤(2)中停用词去除包括:构建服装文本停用词表,在读取服装文本数据的过程中,去除噪音,即剔除停用词;
其中停用词包括数字、标点符号、特殊符号,特殊符号包括@,%,#以及单个汉字“的
ꢀ”
、“和”、“是”。
[0008]进一步的,步骤(2)中文本表示,即将服装文本语句数字化,转换成计算机能够正确识别的数据格式,采用基于矩阵的文本表示模型,其目标函数表示如下:其中,X
ij
代表的是单词i和单词j在同一个窗口出现的次数,N代表整个语料库中的词,b
i
和b
j
代表的是权重矩阵行和列的偏置项,v
i
是单词i的词向量,v
j
是单词j的词向量,f是一个加权函数,具体计算公式如下:其中,x表示当前单词出现的次数;x
max
表示单词能出现的最大次数。
[0009]进一步的,步骤(3)中,中断循环神经网络模块的具体处理过程如下;将服装数据文本表示作为中断循环神经网络模块的输入,并将句子窗口大小设为k,以步长为1向右移动,划分成等长的n段,在中断循环神经网络中每一时间步的输出只与之前k

1个和当前单词有关,输出看作为有k个单词的短语表示,t时刻的输出表示为:其中,RNN表示循环神经网络,h
t
表示t时刻的输出,x
t
表示t时刻的输入,k是一个超参数,表示窗口大小或卷积核的大小。
[0010]进一步的,步骤(3)中,注意力机制模块的具体处理过程如下;在经过中断循环神经网络模块得到每一步的上下文表示,将得到的上下文表示向量首先通过多层感知机提取高级特征,然后将得到的不同高级特征通过注意力机制层来对那些对分类效果有重要作用的全局高级特征赋予更大的权重以此提升进一步分类准确率;注意力机制的计算过程包括两部分:一是注意力权重分布分计算,二是最终的特征向量计算,注意力机制计算如下公式所示:其中,h
t
表示t时刻中断循环神经网络模块的输出,u
t
表示特征向量,α
t
表示注意力权重,W
s
和b
s
表示可学习的网络参数,u
w
是随机初始化的向量,跟着中断循环神经网络模块一起训练,T表示转置,h
t
'表示最后的带注意力权重的特征向量。
[0011]进一步的,步骤(3)中,全连接输出模块包括,将得到的最后的带注意力权重的特征向量h
t
'经过全连接层后接softmax得到最后的预测结果,即服装流行趋势预测结果。
[0012]总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有
益效果:(1)本专利技术提供的一种基于文本的服装流行趋势预测方法,利用服装文本信息预测服装流行趋势,包括服装款式、材质和风格等,通过深度学习方法预测服装流行趋势,可靠且具有实时性;(2)本专利技术提供的一种基于文本的服装流行趋势预测方法,相比于现有技术,本专利技术可极大减少计算成本和降低系统复杂性,提高了流行预测的效果和质量。
附图说明
[0013]图1是本专利技术实施例提供的一种基于文本的服装流行趋势预测方法流程示意图;图2是本专利技术实施例提供的改进的服装文本循环神经网络结构图;图3为本专利技术实施例提供的中断循环神经网络模块结构图;图4是本专利技术实施例提供的注意力机制模块流程图。
具体实施方式
[0014]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0015]图1所示,是实施例提供的一种基于文本的服装流行趋势预测方法流程示意图,包括如下步骤:步骤(1),获取服装文本语句;步骤(1)包括通过网络爬虫、手工采集方式搜集各大购物网站的服装文本语句,包括服装款式、服装风格、服装材质、场合、特点及评论。其中,购物网站包括亚马逊

网上购物商城(amazon.com)、天猫商城(tmall.com)、淘宝网(taobao.com)以及京东商城(jd.com)。
[0016]步骤(2),对服装文本语句进行预处理得到服装文本表示,包括文本分词、停用词去除、文本表示;步骤(2)中文本分词包括:对服装文本语句进行切分,识别句子中的标点符号或字词,然后在这些标点符号或是字词的位置上插入分隔符来将一条句子隔开。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本的服装流行趋势预测方法,其特征在于,包括如下步骤:步骤(1),获取服装文本语句;步骤(2),对服装文本语句进行预处理,包括文本分词、停用词去除、文本表示;步骤(3),改进服装文本循环神经网络,将步骤(2)中得到的服装文本表示输入到改进服装文本循环神经网络中,预测服装流行趋势;所述的改进服装文本循环神经网络包括:中断循环神经网络模块、注意力机制模块和全连接输出模块,其中中断循环神经网络模块用于获取服装文本表示的上下文表示向量,注意力机制模块用于获得带注意力权重的特征向量,全连接输出模块用于获得最后的预测结果。2.如权利要求1所述的一种基于文本的服装流行趋势预测方法,其特征在于:步骤(1)中通过网络爬虫、手工采集方式搜集各大购物网站的服装文本信息,包括服装款式、服装风格、服装材质、场合、特点及评论;其中,购物网站包括亚马逊

网上购物商城、天猫商城、淘宝网以及京东商城。3.如权利要求1所述的一种基于文本的服装流行趋势预测方法,其特征在于:步骤(2)中文本分词包括:对服装文本语句进行切分,识别句子中的标点符号或字词,然后在标点符号或字词的位置上插入分隔符来将一条句子隔开。4.如权利要求1所述的一种基于文本的服装流行趋势预测方法,其特征在于:步骤(2)中停用词去除包括:构建服装文本停用词表,在读取服装文本数据的过程中,去除噪音,即剔除停用词;其中停用词包括数字、标点符号、特殊符号,特殊符号包括@,%,#以及单个汉字“的”、“和”、“是”。5.如权利要求1所述的一种基于文本的服装流行趋势预测方法,其特征在于:步骤(2)中文本表示,即将服装文本语句数字化,转换成计算机能够正确识别的数据格式,采用基于矩阵的文本表示模型,其目标函数表示如下:其中,X
ij
代表的是单词i和单词j在同一个窗口出现的次数,N代表整个语料库中的词,b
i
和b
j
代表的是权重矩阵行和列的偏置项,v
i
是单词i的词向量,v
j
是单词j...

【专利技术属性】
技术研发人员:余锋徐硕姜明华周昌龙宋坤芳
申请(专利权)人:武汉纺织大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1