【技术实现步骤摘要】
基于Transformer网络模型的数字标牌广告主题推荐方法
[0001]本专利技术属于计算机自然语言处理
,涉及文本分类技术和广告推荐技术,特别是涉及一种基于
Transformer
网络模型的数字标牌广告主题推荐方法
。
技术介绍
[0002]现有的文本分类方法大多使用传统的机器学习算法来对文本数据进行分类,一般需要对输入模型的文本数据进行人工标注,再使用机器学习算法进行分类,常见的传统文本分类方法包括朴素贝叶斯
、K
近邻
(K
‑
Nearest Neighbor
,
KNN)、
支持向量机
(Support Vector Machine
,
SVM)
等
。
特征提取的水平对文本分类效果的影响甚至高于图像分类,而文本分类中的特征工程往往非常耗时且计算成本高
。
随着深度学习的发展,文本分类的方法逐渐过渡到深度学习模型,深度学习方法通常会使用词嵌入技术将文本转化为向量表示,并使用卷积神经网络
(Convolutional Neural Networks
,
CNN)、
循环神经网络
(Recurrent Neural Network
,
RNN)、
注意力机制
(Attention Mechanism)
等模型来学习文本的特征表示和分类决策
。
文本卷积神经网 ...
【技术保护点】
【技术特征摘要】
1.
一种基于
Transformer
网络模型的数字标牌广告主题推荐方法,其特征是,耦合数字标牌的空间特征及广告主题特征,基于
Bert
网络模型与层次
Softmax
构建数字标牌广告主题分类模型,并构建数字标牌广告主题推荐模型,从而实现数字标牌广告主题分类与推荐;包括如下步骤:第一
、
构建层次
Softmax
;第二
、
基于
Bert
网络模型和层次
Softmax
构建数字标牌广告主题分类模型;包括:在
Bert
网络模型的顶部连接一个层次
Softmax
作为分类器,构建数字标牌广告主题分类模型,对数字标牌广告主题进行分类,得到的数字标牌广告主题类别;包括:
21)
首先将数字标牌广告上面的文本内容相应的句子进行标记化,即转换为一系列的标记
tokens
;
22)
对标记
tokens
的系列进行重新编码;将重新编码的序列输入到
Bert
模型中,每个位置输出一个大小为隐藏层大小的向量;
23)
将第一个位置的输出向量作为层次
Softmax
分类器的输入,输出数字标牌文本分类结果即广告主题类别;第三
、
获取包含空间特征和广告主题特征的数字标牌数据;包括:设置格网尺度范围,进行空间格网划分;记录每个格网单元的兴趣点数量和数字标牌广告主题类别;进行空间连接;将数字标牌广告主题特征数据与兴趣点相关联;第四
、
利用
Transformer
网络模型构建数字标牌广告主题推荐模型,实现数字标牌广告主题推荐;包括:
41)
将数字标牌的空间特征与广告主题特征建模为序列;数字标牌的空间特征与广告主题特征表示空间特征与广告主题特征之间的依赖关系;序列包括空间特征
、
广告主题特征以及位置信息;
42)
采用基于
Transformer
的多标签分类方法构建数字标牌广告主题推荐模型,包括
L
个有向
Transformer
层;每一层通过与
Transformer
层并行地交换前一层所有位置的信息,迭代更新每个位置的表示;
43)
对数字标牌广告主题推荐模型进行训练,得到训练好的数字标牌广告主题推荐模型;模型的输入是数字标牌空间特征和广告主题特征构成的序列;序列中的每个特征的嵌入包含两部分,一部分是特征的嵌入,特征包括空间特征和广告主题特征;另一部分是位置信息的嵌入,是可学习的;将待布设数字标牌数据输入训练好的数字标牌广告主题推荐模型,即可输出待布设数字标牌的广告主题类型
。2.
如权利要求1所述基于
Transformer
网络模型的数字标牌广告主题推荐方法,其特征是,在
Bert
网络模型的顶部连接一个层次
Softmax
作为分类器,构建数字标牌广告主题分类模型,表示为:
P(c|h)
=
Hierarchical Softmax(Wh)
其中,
W
为权重矩阵;
h
为数字标牌空间特征与广告主题特征序列;
c
为标签即广告主题类别
。3.
如权利要求1所述基于
Transformer
网络模型的数字标牌广告主题推荐方法,其特征
是,步骤
22)
对标记
tokens
的系列进行重新编码,具体是采用添加
[CLS]
标记的方式对
tokens
系列进行重新编码;设输入
Bert
模型的最大
tokens
的大小为
512
,当
token...
【专利技术属性】
技术研发人员:张珣,丛扬潇,张鑫,焦子豪,祁炜,梁春芳,刘羽,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。