本发明专利技术公开了一种融合空间关系和情感强度的环境污染事件信息推荐方法,包括以下步骤:S1、污染事件微博爬取;S2、个人微博爬取;S3、基于空间关系和情感强度的污染影响范围确定;S4、用户类型划分与数据源选择;S5、基于环境污染领域本体结构的微博相似度计算;S6、推荐列表产生,用户只需要输入微博ID号,就可以根据用户微博,将用户分类,并根据用户类型推荐给用户比较关心的信息,进而达到个性化环境污染事件信息推荐的效果。污染事件信息推荐的效果。污染事件信息推荐的效果。
【技术实现步骤摘要】
融合空间关系和情感强度的环境污染事件信息推荐方法
[0001]本专利技术涉及污染应急信息分析
,尤其涉及一种融合空间关系和情感强度的环境污染事件信息推荐方法。
技术介绍
[0002]环境污染的发生、扩散受到地理位置、自然地理条件的制约,同一类型的污染事件因为发生地的不同,造成影响的范围、程度是不一致的。对于身处不同地理位置的微博用户而言,对事件相关的污染信息需求是不一致的。例如:处于污染影响范围内的微博用户对于污染信息及处置信息的需求迫切性强,而处于污染影响范围外的微博用户对于污染信息的需求迫切性相对较弱,更多是关注导致污染的原因。因而针对环境污染信息的推荐,需要考虑微博用户对信息获取的迫切程度、相关性,从地理位置、用户与污染发生地的空间关系、用户真实情绪感受等相关影响因素出发,设计个性化的污染信息推荐系统。
[0003]相关研究方面,主要可分为基于协同过滤的推荐、基于内容的推荐以及综合多种算法的混合推荐。而近期研究比较重视的是基于上下文语境感知的推荐算法。它可以使推荐系统能利用语境信息为用户提供推荐服务,推荐结果兼具普适性与个性化。上下文的语境信息包括狭义上的位置、时间、天气等周围环境信息,广义上的社交网络、用户情绪、目的等更广泛的信息。基于LBS的推荐和基于情感倾向的推荐是上下文语境感知推荐研究中的一个分支,而且应用逐渐广泛深入。基于LBS(Location Based Service)位置信息服务的推荐是通过无线定位、GPS等多种通信手段获取用户地理位置,根据用户所处的地理位置发现用户的兴趣点、需求为用户提供不同内容的推荐服务。微博、论坛的评论等文本信息是人们表达内心真实感受的一个渠道,通过对文本信息中情感倾向的提取,可描述用户的态度、兴趣,以此增加推荐算法的准确度。
[0004]尽管推荐算法众多,但在应急处理中的应用多是在灾害应急领域案例,在环境污染应急领域的应用并不多。特别是面对一些污染影响范围较大,互联网响应信息较多的事件上,仍缺乏比较成功和典型的案例,因此相关部门在应对较大范围的环境舆情事件上缺乏案例库和成功有效的方法借鉴,使得在应对时更多是依据传统舆情管控方法,对于环境污染事件的专业性和科学理念的传达上还存在许多不足。因此迫切需要一种操作性较强,高效的环境污染事件互联网信息的快速信息推荐方法,在出现网络环境事件舆情时,可根据情感信息确定污染影响范围和程度,并在大量互联网信息中筛选出与事件当地相关的有效信息,进而根据信息内容及情感强度做出合理信息推荐,供当地管理部门进行决策。
[0005]因此,有必要提出一种改进,以克服现有技术的缺陷。
技术实现思路
[0006]本专利技术的目的是解决现有技术中的问题,提供一种融合空间关系和情感强度的环境污染事件信息推荐方法。
[0007]本专利技术的技术方案是:
[0008]一种融合空间关系和情感强度的环境污染事件信息推荐方法,包括以下步骤:
[0009]S1、污染事件微博爬取;
[0010]S2、个人微博爬取;
[0011]S3、基于空间关系和情感强度的污染影响范围确定;
[0012]S4、用户类型划分与数据源选择;
[0013]S5、基于环境污染领域本体结构的微博相似度计算;
[0014]S6、推荐列表产生。
[0015]作为优化,在S1步骤中,通过爬虫软件爬取环境污染事件微博,选取带有签到位置的微博且签到位置距离事发地的直线距离小于R公里的微博作为数据源A(表示污染发生地周边的微博),选取签到位置位于受污染影响行政区域的微博作为数据源B。
[0016]作为优化,在S2步骤中,输入微博用户的ID号,通过爬虫软件爬取用户个人信息与微博数据,将其微博数据分为污染事件发生当天的微博与当天之前的历史微博。
[0017]作为优化,在S3步骤中,在基于空间关系初步产生污染范围的基础上,叠加微博的负面情感值的空间聚类结果,产生更精确的污染影响范围。
[0018]作为优化,在S4步骤中,依据用户是否受到污染影响,将用户划分为利益相关用户与无利益关联用户。并针对不同用户确定推荐的数据来源,将数据源A的微博数据对利益相关用户推荐,将数据源A和B对无利益关联用户推荐。
[0019]作为优化,在S5步骤中,将用户当天的微博与历史微博分别利用TF-IDF模型提取用户微博与污染事件微博的关键词,并将其映射入环境污染领域本体结构树中,进行用户(用户微博关键词表征用户)与污染事件微博之间的相似度计算。按相似度计算的结果从大到小进行排序,并推荐给用户相似度高的微博。
[0020]本专利技术利用融合空间关系和情感强度的环境污染事件信息推荐方法,采集环境污染事件微博数据,根据环境污染事件发生地点,考虑空间关系、情感倾向与污染区域之间的关系,通过情感强度测算不同区域污染严重程度,将空间关系与情感倾向融入推荐算法。用户只需要输入微博ID号,就可以根据用户微博,将用户分类,并根据用户类型推荐给用户比较关心的信息,进而达到个性化环境污染事件信息推荐的效果。
附图说明
[0021]图1是本专利技术实施例提供的融合空间关系和情感强度的环境污染事件信息推荐方法技术流程图;
[0022]图2是本专利技术实施例提供的基于空间关系和情感强度的污染影响范围确定详细技术流程图;
[0023]图3是本专利技术实施例提供的环境污染领域本体结构示意;
[0024]图4是本专利技术技术原理流程示意图。
具体实施方式
[0025]为了使本专利技术实现的技术手段、技术特征、专利技术目的与技术效果易于明白了解,下面结合具体图示,进一步阐述本专利技术。
[0026]实施例一
[0027]本申请实施例提供的融合空间关系和情感强度的环境污染事件信息推荐方法,包括:
[0028]S1、污染事件微博爬取;
[0029]S2、个人微博爬取;
[0030]S3、基于空间关系和情感强度的污染影响范围确定;
[0031]S4、用户类型划分与数据源选择;
[0032]S5、基于环境污染领域本体结构的微博相似度计算;
[0033]S6、推荐列表产生。
[0034]以上为本申请方法实施例一提供的环境污染微博信息推荐方法的具体执行步骤,为了便于理解和解释本申请方法实施例一提供的环境污染微博信息推荐方法,下面将依次介绍S1至S6的具体实施方式。
[0035]在S1中,通过常用的爬虫软件,如基于python的微博爬虫,模拟微博移动端登录信息,输入环境污染事件主要关键词,对环境污染事件微博进行爬取,将获得的环境污染事件微博信息以json方式进行存储,并保存到数据库中。
[0036]从数据库中的各条微博信息中选取带有签到位置的微博且签到位置距离事发地的直线距离小于R公里的微博作为数据源A(表示污染发生地周边的微博,R的取值需要根据污染事件的规模及类型大致确定),选取签到位置位于受污染影响行政区域的微博作为数据源B(影响区域可以是各级行政单元,一般取县本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.融合空间关系和情感强度的环境污染事件信息推荐方法,其特征在于,包括以下步骤:S1、污染事件微博爬取;S2、个人微博爬取;S3、基于空间关系和情感强度的污染影响范围确定;S4、用户类型划分与数据源选择;S5、基于环境污染领域本体结构的微博相似度计算;S6、推荐列表产生。2.根据权利要求1所述的融合空间关系和情感强度的环境污染事件信息推荐方法,其特征在于,在S1步骤中,通过爬虫软件爬取环境污染事件微博,选取带有签到位置的微博且签到位置距离事发地的直线距离小于R公里的微博作为数据源A,选取签到位置位于受污染影响行政区域的微博作为数据源B。3.根据权利要求1所述的融合空间关系和情感强度的环境污染事件信息推荐方法,其特征在于,在S2步骤中,输入微博用户的ID号,通过爬虫软件爬取用户个人信息与微博数据,将其微博数据分为污染事件发生当天的微博与当天之前的历史微博。4.根据权利要求1所述的融合...
【专利技术属性】
技术研发人员:张明锋,林广发,黄翔,
申请(专利权)人:福建师范大学地理研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。