本发明专利技术涉及地表覆盖更新众包任务推荐方法,包括如下步骤:A)获取需要收集地表覆盖数据的空间区域,对其进行地表覆盖众包任务划分形成网格空间,得到待推荐的众包任务区;B)设计基于多元用户画像的初始任务推荐方法,对众包任务区构建顾及用户活跃度的时空偏好模型和顾及地表覆盖类型的隐语义偏好模型,得到时空偏好分数和隐语义偏好分数,以融合得到用户的综合兴趣分数,并据此产生任务推荐列表;C)基于顾及多源数据不一致性的任务重排序方法计算各个众包任务区的不一致性系数,以对任务推荐列表中的任务进行降序排序获得最终推荐列表。本发明专利技术的地表覆盖更新众包任务推荐方法能够将地表覆盖类型难以区分的区域优先推荐给用户进行标报。给用户进行标报。给用户进行标报。
【技术实现步骤摘要】
地表覆盖更新众包任务推荐方法
[0001]本专利技术涉及信息推荐方法,具体地,涉及一种地表覆盖更新众包任务推荐方法。
技术介绍
[0002]地表覆盖及其变化是可持续发展监测、环境变化研究、土地资源管理等研究领域中不可或缺的重要基础信息,全球规模的地表覆盖更新正面临着样本获取难度大、机器智能更新有遗漏、效率低、成本高等瓶颈问题,而众包模式则可以利用全球志愿者协作的理念在人类知识引导下交互收集辅助更新的信息,但随着海量众包任务和用户间交互行为的大量涌现,用户的贡献积极性却难以保证,研究发现只有5%的用户以高效的方式积极为开放地图平台贡献数据,严重制约了众包模式实施的效率。
[0003]高效的任务推荐方法是提高众包模式实施的效率的途径之一,众包模式主要利用基于用户画像的方法实现个性化的任务推送,以帮助用户快速地找到感兴趣的任务,继而吸引其贡献更多高质量的数据。
[0004]在现有技术中,不同地表覆盖类型的标绘难易程度不同,导致不同地表覆盖类型对用户的吸引程度不同,因此,仅考虑时空偏好未考虑地表覆盖类型偏好的用户画像推荐方法并不能直接适用于地表覆盖众包任务的推荐,此外,受限于分类方法有偏、验证样本不足、地表覆盖类型复杂等因素,当前的地表覆盖数据生成方法的精度仍相对较低,而现有的任务推送方式难以保证能够将地表覆盖类型难以准确区分的区域(难分区域)充分收集到众包数据,并将难分区域优先推荐给用户进行标报。
[0005]有鉴于此,需要设计一种地表覆盖更新众包任务推荐方法。
技术实现思路
[0006]本专利技术所要解决的技术问题是提供一种地表覆盖更新众包任务推荐方法。
[0007]为了解决上述技术问题,本专利技术提供一种地表覆盖更新众包任务推荐方法,包括如下步骤:A)获取需要收集地表覆盖数据的空间区域,对所述空间区域进行地表覆盖众包任务划分,形成网格空间,以将所述网格空间作为待推荐的众包任务区;B)设计基于用户多元兴趣画像的偏好模型,对所述众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以得到用户对所述众包任务区的时空偏好分数以及隐语义偏好分数,并基于所述时空偏好分数以及隐语义偏好分数融合得到用户的综合兴趣分数,并基于所述用户的综合兴趣分数产生任务推荐列表;C)基于顾及多源数据不一致性的任务重排序方法计算各个所述众包任务区的不一致性系数,以基于所述不一致性系数对所述任务推荐列表中的任务进行排序获得最终推荐列表。
[0008]具体地,所述地表覆盖众包任务划分的步骤包括:利用网格划分,将所述空间区域等分成包括多个网格单元的所述网格空间,每个所述网格单元代表一个待推荐的地表覆盖
众包任务区。
[0009]进一步地,所述用户多元画像的模型的构建步骤包括计算时空兴趣偏好、贡献活跃度和覆盖类型偏好。
[0010]进一步地,所述时空兴趣偏好的计算过程包括:B11)基于用户的历史贡献信息,对于用户u采用三角核函数构建待推荐任务区i和已标报任务区j之间的地理相似度:其中,d(i, j)为所述待推荐任务区i的质心和所述已标报任务区j的质心之间的球面距离;d为所述三角核函数的宽度参数,I为指示函数,表示当所述待推荐任务区i和所述已标报任务区j之间的距离超过d时,地理相似度为0;当所述待推荐任务区i和所述已标报任务区j之间的距离小于d时,距离越近,地理相似度越大;B12)利用非线性逐步遗忘函数度量用户对所述待推荐任务区i的兴趣随时间动态下降的程度:其中,θ为遗忘率;为所述已标报任务区j的最后时间戳,为用户最早标报的时间戳,为用户最后标报的时间戳;B13)基于内容协同过滤方法量化用户u对所述待推荐任务区i的时空偏好:其中,为用户u贡献过数据的所述众包任务区的集合,为用户u贡献过数据的所述众包任务区的数量。
[0011]进一步地,所述贡献活跃度的计算步骤包括:B21)统计用户u在各个所述众包任务区的标注频数,采用MIN
‑
MAX方法归一化用户对所述已标报任务区j的贡献活跃度:其中,为统计结果的最大值,为统计结果的最小值;B22)基于所述时空兴趣偏好,结合贡献频率,以得到顾及用户贡献活跃度差异的所述时空偏好分数:
其中α为用户活跃频率影响权重因子。
[0012]进一步地,所述覆盖类型偏好的计算步骤包括:B31)统计用户u对覆盖类型c的贡献次数占贡献总数的比率,如果用户u对某一覆盖类型c贡献为零,则赋值为0,根据填充得到用户类型矩阵并对所述用户类型矩阵进行矩阵分解:其中,为用户总数量,为地物类型的数量,为用户特征矩阵,为类型特征矩阵,f为隐特征维数;B32)根据现有的地表覆盖数据反映的地球表面地物类型的分类情况,将覆盖类型一一映射到相应的所述众包任务区,并提取每一类所述覆盖类型c在对应的所述众包任务区的面积占比,若所述众包任务区未包含相应的覆盖类型c,则所述众包任务区对该覆盖类型c的面积占比为0,以得到任务区类型特征矩阵D,并结合类型特征矩阵以得到目标矩阵T:需要注意的是,中的T是矩阵转置的符号;B33)通过所述用户特征矩阵和所述目标矩阵T,解算出用户u对所述待推荐任务区i的所述隐语义偏好分数:。
[0013]进一步地,所述任务推荐列表的获取步骤包括:B41)计算综合兴趣分数:B42)基于所述综合兴趣分数的值,对所述待推荐任务区i进行降序排序,并选取前k个所述待推荐任务区i作为所述任务推荐列表。
[0014]进一步地,所述不一致性系数的计算步骤包括:C1)获取地表覆盖参考数据;C2)将各所述地表覆盖参考数据基于设定的转换方法转化为设定标准下的标准地表覆盖数据;C3)根据分类准确像元数在总像元数中的比例,获取不一致性系数。
[0015]进一步地,所述不一致性系数的计算步骤包括:
其中为所述分类准确像元数,Num为所述总像元数,n为不同地表覆盖类型种类数目。
[0016]进一步地,所述任务推荐列表中的所述待推荐任务区i基于所述不一致性系数进行降序排序以得到所述最终推荐列表。
[0017]通过上述技术方案,在本专利技术所提供的地表覆盖更新众包任务推荐方法,其先对需要收集地表覆盖数据的空间区域进行地表覆盖众包任务划分,形成网格空间,以将网格空间作为待推荐的众包任务区,随后设计基于多元用户画像的初始任务推荐方法,对众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以分别得到用户对所述众包任务区的时空偏好分数以及隐语义偏好分数,从而能够基于时空偏好分数以及隐语义偏好分数融合得到用户的综合兴趣分数,并基于用户的综合兴趣分数产生任务推荐列表,从而能够保证使得向用户推荐的是用户感兴趣的任务内容,此外,还能够继续基于顾及多源数据不一致性的任务重排序方法计算各个众包任务区的不一致性系数,以基于不一致性系数,在基于用户的综合兴趣分数产生任务推荐列表的基础上对该任务推荐列表中的任务继续进行降序排序,获得最终推荐列表,使得最终推荐列表中排名靠前的推荐任务的不一致性系数更高,也即是地表覆盖类型不易识别的任务区域,继本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.地表覆盖更新众包任务推荐方法,其特征在于,包括如下步骤:A)获取需要收集地表覆盖数据的空间区域,对所述空间区域进行地表覆盖众包任务划分,形成网格空间,以将所述网格空间作为待推荐的众包任务区;B)设计基于用户多元兴趣画像的偏好模型,对所述众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以融合得到用户对待推荐众包任务区的时空偏好分数以及隐语义偏好分数,并基于所述时空偏好分数以及隐语义偏好分数得到用户的综合兴趣分数,并基于所述用户的综合兴趣分数产生任务推荐列表;C)基于顾及多源数据不一致性的任务重排序方法计算各个所述众包任务区的不一致性系数,以基于所述不一致性系数对所述任务推荐列表中的任务进行排序获得最终推荐列表。2.根据权利要求1所述的地表覆盖更新众包任务推荐方法,其特征在于,所述地表覆盖众包任务划分的步骤包括:利用网格划分,将所述空间区域等分成包括多个网格单元的所述网格空间,每个所述网格单元代表一个待推荐的地表覆盖众包任务区。3.根据权利要求2所述的地表覆盖更新众包任务推荐方法,其特征在于,所述基于用户多元兴趣画像的偏好模型的构建步骤包括计算时空兴趣偏好、贡献活跃度和覆盖类型偏好。4.根据权利要求3所述的地表覆盖更新众包任务推荐方法,其特征在于,所述时空兴趣偏好的计算过程包括:B11)基于用户的历史贡献信息,对于用户u采用三角核函数构建待推荐任务区i和已标报任务区j之间的地理相似度:其中,d(i, j)为所述待推荐任务区i的质心和所述已标报任务区j的质心之间的球面距离;d为所述三角核函数的宽度参数,I为指示函数,表示当所述待推荐任务区i和所述已标报任务区j之间的距离超过d时,地理相似度为0;当所述待推荐任务区i和所述已标报任务区j之间的距离小于d时,距离越近,地理相似度越大;B12)利用非线性逐步遗忘函数度量用户对所述待推荐任务区i的兴趣随时间动态下降的程度:其中,θ为遗忘率;为所述已标报任务区j的最后时间戳,为用户最早标报的时间戳,为用户最后标报的时间戳;B13)基于内容协同过滤方法量化用户u对所述待推荐任务区的时空偏好:
其中,为用户u贡献过数据的所述众包任务区的集合,为用户u贡献过数据的所述众包任务区的数量。5.根据权利要求4所述的地表覆盖更新众包任务推荐方法,其特征在于,所述贡献活跃度的计算步骤包括:B21...
【专利技术属性】
技术研发人员:周晓光,陈倩岚,侯东阳,
申请(专利权)人:中南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。