The invention discloses a social network advertising push method based on Natural Language Processing, including obtaining social network data from users, dividing the social network data into words, generating word vectors, training multiple prediction models to predict different user attributes, generating user portrait, and generating user portrait to generate user portrait. Vector, product vectors are generated according to different dimensions, and goods with high user clicking rate are calculated with high similarity of user portrait vector, and goods with high similarity of commodity vectors with high click rate are calculated, and users with high similarity are recommended to users. This method is simple and efficient, and can automatically generate user portraits based on social network information, which improves the accuracy of advertising and click-through rate.
【技术实现步骤摘要】
基于自然语言处理的社交网络广告推送方法
本专利技术涉及一种社交网络的广告推送方法,具体地涉及一种基于自然语言处理的社交网络广告推送方法。
技术介绍
目前全球互联网用户总量已超30亿,而社交网络更是具有发展时间长,用户数量巨大等特点。其中,像脸谱(facebook)月活跃用户达到13.5亿,接近中国人口总数量。中国互联网巨头腾讯公司旗下的互动网站QQ空间活跃账户达6.45亿,微信朋友圈等用户数量也是巨大的。如此数量巨大的用户平台无论对平台本身而言还是对用户来说都是销售商品很好的平台,因为在QQ空间、朋友圈、微博等社交网络,人们喜欢发表文字、图片、定位,分享自己的兴趣爱好,所见所闻,转载有意思的文章等。以往的平台广告推送过于粗犷,只是简单地基于性别、年龄、查询信息来推荐。本算法则是基于自然语言处理对社交网络网络用户进行分析,预测出个人基本信息,如年龄、收入、职业、是否有房车、爱好等之后再进行精准广告推送,每个人的广告推送都具有个性化,使命中率和成交率都有更大提升。这项技术也可以用于那些商家在社交网络中发送广告和推销,预测出个人用户画像后根据不同用户推广不同的商品,相同用户画像的人购买的商品也会相似度比较高,例如20-30岁未婚从事金融工作的女性可能买高档口红的比较多,那么就可以给相近用户画像的人推荐相同和相近的商品。以SVM(latentdirichletallocation)模型为代表的机器模型是训练分类的一个比较成熟的技术,是由Vanpik领导的AT&TBell实验室研究小组在1963年提出的一种新的非常有潜力的分类技术。SVM是一种基于统计学习理 ...
【技术保护点】
1.一种基于自然语言处理的社交网络广告推送方法,其特征在于,包括以下步骤:S01:获取用户的社交网络数据;S02:对社交网络数据进行分词,生成词向量;S03:训练多个预测模型,用于预测不同的用户属性,生成用户画像;S04:将用户画像生成用户画像向量,将商品按照不同的维度生成商品向量;S05:计算用户画像向量相似度高的用户点击率高的商品,计算与点击率高的商品向量相似度高的商品,并推荐给用户画像相似度高的用户。
【技术特征摘要】
1.一种基于自然语言处理的社交网络广告推送方法,其特征在于,包括以下步骤:S01:获取用户的社交网络数据;S02:对社交网络数据进行分词,生成词向量;S03:训练多个预测模型,用于预测不同的用户属性,生成用户画像;S04:将用户画像生成用户画像向量,将商品按照不同的维度生成商品向量;S05:计算用户画像向量相似度高的用户点击率高的商品,计算与点击率高的商品向量相似度高的商品,并推荐给用户画像相似度高的用户。2.根据权利要求1所述的基于自然语言处理的社交网络广告推送方法,其特征在于,所述步骤S01具体包括:通过爬虫每隔固定时间爬取或者直接读取用户的社交网络数据,对社交网络数据进行预处理,保留定位、原创和转发的语句信息。3.根据权利要求1所述的基于自然语言处理的社交网络广告推送方法,其特征在于,所述步骤S02具体包括:S21:对社交网络数据进行进一步处理,使用正则表达式去除纯数字语句、纯拼音语句、纯符号语句、无意义表情符号,得到社交网络文本数据;S22:创建基本信息分词词典,建立分词...
【专利技术属性】
技术研发人员:杨威,刘艳,黄刘生,
申请(专利权)人:中国科学技术大学苏州研究院,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。