基于多媒体数字影像评论的数据挖掘与处理方法及系统技术方案

技术编号:15746794 阅读:117 留言:0更新日期:2017-07-03 02:52
一种基于多媒体数字影像评论的数据挖掘与处理方法,包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;建立影评数据与用户页面数据之间的映射关系;对用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。本发明专利技术使用户找到对于自己有价值的信息更加方便快捷。

Data mining and processing method and system based on multimedia digital image review

A comment on the multimedia digital image data mining and processing method, which is based on at least one film critic for the data using the web crawler technology to social network open mining, mining in the two mining the data at the same time user page data published on movie reviews data for the first preset amount; establishing the mapping relation between the the data and user data page; interest attribute analysis of user data and in turn the page interest property, interest amount classification attribute points consistent user page data beyond polymerization second preset amount, to form a number of user data sets to detect; viewing operation events and dig out to be viewing events in public user operation social network data, analysis of the attributes of interest and in turn draw interest attributes, find their interests A user's page data set whose attribute points exceed the second preset amount. The invention enables users to find information valuable for themselves, which is more convenient and quick.

【技术实现步骤摘要】
基于多媒体数字影像评论的数据挖掘与处理方法及系统
本专利技术涉及数据挖掘
,特别涉及一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
技术介绍
随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已经满足不了应用的需求,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴含于其中的有价值的知识。这种将数字挖掘技术与多媒体信息处理技术有机结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘。但是从现有的多媒体技术中找出有价值的知识既费时又繁琐。鉴于以上现有技术存在的问题,本专利技术希望找到一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
技术实现思路
专利技术目的:对上述情况,为了克服
技术介绍
中的缺点,本专利技术实施例提供了一种基于多媒体数字影像评论的数据挖掘与处理方法及系统,能够有效解决上述
技术介绍
中涉及的问题。技术方案:一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;建立所述影评数据与所述用户页面数据之间的映射关系;对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。作为本专利技术的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。作为本专利技术的一种优选方式,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。作为本专利技术的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。作为本专利技术的一种优选方式,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。一种基于多媒体数字影像评论的数据挖掘与处理系统,所述系统包括:第一数据挖掘模块,用于利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;映射建立模块,用于建立所述影评数据与所述用户页面数据之间的映射关系;兴趣属性分析模块,用于对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点;分类聚合模块,用于将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;数据集获取模块,用于获取分类聚合后的与各用户页面数据集相互映射的影评数据集;事件侦测模块,用于侦测待观影操作事件;第二数据挖掘模块,用于挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点;数据集查找模块,用于查找与其兴趣属性点相符量超出第二预设量的用户页面数据集;数据集推送模块,用于将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。作为本专利技术的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。作为本专利技术的一种优选方式,所述兴趣属性分析模块进一步用于按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。作为本专利技术的一种优选方式,所述事件侦测模块进一步用于从社交网络上挖掘与影片相关的非影评数据;所述第二数据挖掘模块进一步用于分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。作为本专利技术的一种优选方式,所述事件侦测模块进一步用于从影片购票网站上获取基于影片的检索和/或购票操作事件;所述第二数据挖掘模块进一步用于获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。本专利技术实现以下有益效果:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;建立影评数据与所述用户页面数据之间的映射关系;对用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集。使用户找到对自己有价值的数据更加方便快捷,避免了繁琐的数据搜集。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。图1为本专利技术提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流映射关系图;图2为本专利技术提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;图3为本专利技术提供一种基于多媒体数字影像评论的数据挖掘与处理系统构架示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。实施例一请参考图1,图2,图1为本专利技术提供了一种基于多媒体数字影像评论的数据挖掘与处理方法映射关系图;图2为本专利技术提供了一种基于多媒体数字影像评论的数据挖掘与处理方法流程示意图;具体的,本实施例提供一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括以下步骤:Step101:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘;Step102:建立所述影评数据与所述用户页面数据之间的映射关系;Step103:对所述用户页面数本文档来自技高网...
基于多媒体数字影像评论的数据挖掘与处理方法及系统

【技术保护点】
一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,所述方法包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;建立所述影评数据与所述用户页面数据之间的映射关系;对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。

【技术特征摘要】
1.一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,所述方法包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;建立所述影评数据与所述用户页面数据之间的映射关系;对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。2.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。3.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。4.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。5.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。6.一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征...

【专利技术属性】
技术研发人员:蔡璟
申请(专利权)人:苏州亮磊知识产权运营有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1