基于深度学习的众包任务个性化推荐方法和系统技术方案

技术编号:33126026 阅读:17 留言:0更新日期:2022-04-17 00:35
本发明专利技术提供一种基于深度学习的众包任务个性化推荐方法和系统,涉及任务推荐技术领域。本发明专利技术利用Attention机制的选择性关注隐层状态和LSTM网络对时间序列预测的准确性等优势,能够实现有效获取数据中的关键信息,从而得到众包工人对任务选择的兴趣变化和核心关注点,实现对用户整个行为序列变化的动态因素捕捉,再通过引入Word2Vec词向量模型,计算众包工人与任务之间的相似关联度,精准地向众包工人推荐众包任务。同时,本发明专利技术将众包数据切分为结构化数据和非结构化数据,从中得到历史行为信息的显式特征和隐式特征,以挖掘更有价值的潜在特征信息,进一步提高推荐精准度。进一步提高推荐精准度。进一步提高推荐精准度。

【技术实现步骤摘要】
基于深度学习的众包任务个性化推荐方法和系统


[0001]本专利技术涉及任务推荐
,具体涉及一种基于深度学习的众包任务个性化推荐方法和系统。

技术介绍

[0002]随着互联网技术的快速发展以及网络用户规模的爆发式增长,通过群体智慧来解决问题的众包模式应运而生。在这种群体智能的独特性下,任务不再局限于特定、孤立的工作社区,而是以众包的方式在平台上发布,以竞争和合作的方式完成众包任务,这种跨地域、跨时间的新兴开发方式已经成为普遍的一种解决方案,近几年众包在计算机领域的学术界和工业界也都得到了非常广泛的关注。
[0003]现有的考虑总包工人的众包任务推荐方法类似于针对用户推荐的方法:先观察用户历史的任务信息,以及用户的关联用户的信息,进而将与用户历史任务相似的任务推荐给与用户关联的用户。
[0004]然而,这种方法缺乏对动态网络信息变化的分析处理,导致现有的众包任务推荐方法的推荐结果不精准。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术的不足,本专利技术提供了一种基于深度学习的众包任务个性化推荐方法和系统,解决了现有的众包任务推荐方法的推荐结果不精准的技术问题。
[0007](二)技术方案
[0008]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0009]第一方面,本专利技术提供一种基于深度学习的众包任务个性化推荐方法,包括以下步骤:
[0010]S1、获取众包数据,并将所述众包数据分解为结构化数据和非结构化数据;
[0011]S2、基于预先构建的众包任务个性化推荐模型对所述结构化数据和非结构化数据进行处理,得到概率分布,对所述概率分布进行排序,得到所述推荐概率列表;其中,所述众包任务个性化推荐模型包括融入注意力层的长短期记忆神经网络通道、Word2Vec通道、全连接层和 softmax函数层,所述融入注意力层的长短期记忆神经网络通道对所述结构化数据进行处理,所述Word2Vec通道对所述非结构化数据进行处理。
[0012]优选的,所述结构化数据包括:
[0013]众包工人ID、类型、评级、信誉分数、证件信息、交易总金额、雇主好评率、所在城市、完成总任务量、总中标数、任务类型、任务价格、任务关注人数、任务投标人数、任务中标人数、任务发布时间、任务截止时间、历史任务信息和交易模式。
[0014]优选的,所述非结构化数据包括:
[0015]任务名称、任务需求、擅长技能和个人描述。
[0016]优选的,所述预先构建的众包任务个性化推荐模型的构建过程包括:
[0017]A1、获取众包数据,对总包数据进行预处理,将众包数据分解为结构化数据和非结构化数据,并构建包括训练集和测试集的数据集;
[0018]A2、基于数据集对初始众包任务个性化推荐模型进行训练和测试,得到众包任务个性化推荐模型。
[0019]优选的,所述融入注意力层的长短期记忆神经网络通道对所述结构化数据进行处理,包括:
[0020]其中,融入注意力层的长短期记忆神经网络通道包括Encoding层、 LSTM层和Attention层;
[0021]将结构化数据中与众包工人交互的所有历史众包任务按照众包工人ID和众包任务点击时间排序进行分组,得到这个任务点击的时间戳和第i个任务点击的时间戳之间的时间间隔T
i
,依照间隔时间 [T1,T2,T3,
……
,T
n
]排列,经过Encoding层得到的历史众包任务结构化序列特征[e1,e2,e3,
……
,e
n
]作为LSTM的输入,目标任务的结构化数据和众包工人结构化数据经过Encoding层分别得到目标任务结构化特征向量和众包工人结构化特征向量;
[0022]LSTM层在处理时间序列特征后,每个LSTM单元可以得到当前时间步长t的隐藏状态输出;
[0023]在Attention层利用隐藏状态输出进行权重计算,将权重值与注意层的每个输入相乘得到具有注意力权重的特征向量,所述权重值基于当前时间步长t的隐藏状态输出和目标任务结构化特征向量计算得到。
[0024]优选的,所述方法还包括,
[0025]将众包工人结构化特征向量、目标任务结构化特征向量、具有注意力权重的特征向量以及Word2Vec通道输入的相似度联合,得到整体特征向量。
[0026]优选的,所述方法还包括:
[0027]将整体特征向量中输入到全连接层,全连接层每个神经元的激励函数采用ReLU函数,得到加权特征向量。
[0028]第二方面,本专利技术提供一种基于深度学习的众包任务个性化推荐系统,包括:
[0029]数据获取模块,用于获取众包数据,并将所述众包数据分解为结构化数据和非结构化数据;
[0030]推荐模块,用于基于预先构建的众包任务个性化推荐模型对所述结构化数据和非结构化数据进行处理,得到概率分布,对所述概率分布进行排序,得到所述推荐概率列表;其中,所述众包任务个性化推荐模型包括融入注意力层的长短期记忆神经网络通道、Word2Vec通道、全连接层和softmax函数层,所述融入注意力层的长短期记忆神经网络通道对所述结构化数据进行处理,所述Word2Vec通道对所述非结构化数据进行处理。
[0031]第三方面,本专利技术提供一种计算机可读存储介质,其存储用于基于深度学习的众包任务个性化推荐的计算机程序,其中,所述计算机程序使得计算机执行如上述所述的基于深度学习的众包任务个性化推荐方法。
[0032]第四方面,本专利技术提供一种电子设备,包括:
[0033]一个或多个处理器;
[0034]存储器;以及
[0035]一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上述所述的基于深度学习的众包任务个性化推荐方法。
[0036](三)有益效果
[0037]本专利技术提供了一种基于深度学习的众包任务个性化推荐方法和系统。与现有技术相比,具备以下有益效果:
[0038]本专利技术通过获取众包数据,并将众包数据分解为结构化数据和非结构化数据;基于预先构建的众包任务个性化推荐模型对所述结构化数据和非结构化数据进行处理,得到概率分布,对所述概率分布进行排序,得到所述推荐概率列表;其中,所述众包任务个性化推荐模型包括融入注意力层的长短期记忆神经网络通道、Word2Vec通道、全连接层和softmax函数层,所述融入注意力层的长短期记忆神经网络通道对所述结构化数据进行处理,所述Word2Vec通道对所述非结构化数据进行处理。本专利技术利用Attention机制的选择性关注隐层状态和LSTM 网络对时间序列预测的准确性等优势,能够实现有效获取数据中的关键信息,从而得到众包工人对任务选择的兴趣变化和核心关注点,实现对用户整个行为序列变化的动态因素捕捉,精准地向众包工人推荐众本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的众包任务个性化推荐方法,其特征在于,包括以下步骤:S1、获取众包数据,并将所述众包数据分解为结构化数据和非结构化数据;S2、基于预先构建的众包任务个性化推荐模型对所述结构化数据和非结构化数据进行处理,得到概率分布,对所述概率分布进行排序,得到所述推荐概率列表;其中,所述众包任务个性化推荐模型包括融入注意力层的长短期记忆神经网络通道、Word2Vec通道、全连接层和softmax函数层,所述融入注意力层的长短期记忆神经网络通道对所述结构化数据进行处理,所述Word2Vec通道对所述非结构化数据进行处理。2.如权利要求1所述的基于深度学习的众包任务个性化推荐方法,其特征在于,所述结构化数据包括:众包工人ID、类型、评级、信誉分数、证件信息、交易总金额、雇主好评率、所在城市、完成总任务量、总中标数、任务类型、任务价格、任务关注人数、任务投标人数、任务中标人数、任务发布时间、任务截止时间、历史任务信息和交易模式。3.如权利要求2所述的基于深度学习的众包任务个性化推荐方法,其特征在于,所述非结构化数据包括:任务名称、任务需求、擅长技能和个人描述。4.如权利要求1~3任一所述的基于深度学习的众包任务个性化推荐方法,其特征在于,所述预先构建的众包任务个性化推荐模型的构建过程包括:A1、获取众包数据,对总包数据进行预处理,将众包数据分解为结构化数据和非结构化数据,并构建包括训练集和测试集的数据集;A2、基于数据集对初始众包任务个性化推荐模型进行训练和测试,得到众包任务个性化推荐模型。5.如权利要求1~3任一所述的基于深度学习的众包任务个性化推荐方法,其特征在于,所述融入注意力层的长短期记忆神经网络通道对所述结构化数据进行处理,包括:其中,融入注意力层的长短期记忆神经网络通道包括Encoding层、LSTM层和Attention层;将结构化数据中与众包工人交互的所有历史众包任务按照众包工人ID和众包任务点击时间排序进行分组,得到这个任务点击的时间戳和第i个任务点击的时间戳之间的时间间隔T
i
,依照间隔时间[T1,T2,T3,
……
,T
n
]排列,经过Encoding层得到的历史众包任务结构化序列特征[e1...

【专利技术属性】
技术研发人员:彭张林万德全王安宁张强陆效农丁贾明杨威
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1