A comment on the multimedia digital image data mining and processing method, which is based on at least one film critic for the data using the web crawler technology to social network open mining, mining in the two mining the data at the same time user page data published on movie reviews data for the first preset amount; establishing the mapping relation between the the data and user data page; interest attribute analysis of user data and in turn the page interest property, interest amount classification attribute points consistent user page data beyond polymerization second preset amount, to form a number of user data sets to detect; viewing operation events and dig out to be viewing events in public user operation social network data, analysis of the attributes of interest and in turn draw interest attributes, find their interests A user's page data set whose attribute points exceed the second preset amount. The invention enables users to find information valuable for themselves, which is more convenient and quick.
【技术实现步骤摘要】
基于多媒体数字影像评论的数据挖掘与处理方法及系统
本专利技术涉及数据挖掘
,特别涉及一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
技术介绍
随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已经满足不了应用的需求,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴含于其中的有价值的知识。这种将数字挖掘技术与多媒体信息处理技术有机结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘。但是从现有的多媒体技术中找出有价值的知识既费时又繁琐。鉴于以上现有技术存在的问题,本专利技术希望找到一种基于多媒体数字影像评论的数据挖掘与处理方法及系统。
技术实现思路
专利技术目的:对上述情况,为了克服
技术介绍
中的缺点,本专利技术实施例提供了一种基于多媒体数字影像评论的数据挖掘与处理方法及系统,能够有效解决上述
技术介绍
中涉及的问题。技术方案:一种基于多媒体数字影像评论的数据挖掘与处理方法,所述方法包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;建立所述影评数据与所述用户页面数据之间的映射关系;对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;侦测待观影操作事件并挖掘执行待观影操 ...
【技术保护点】
一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,所述方法包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;建立所述影评数据与所述用户页面数据之间的映射关系;对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。
【技术特征摘要】
1.一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,所述方法包括:利用网络爬虫技术对社交网络上公开的针对至少一影片的影评数据进行挖掘并将挖掘出的影评数据储存在第一数据库内,在挖掘影评数据的同时对发布影评数据的用户页面数据进行第一预设量的二次挖掘并将挖掘出的用户页面数据储存在第二数据库内;建立所述影评数据与所述用户页面数据之间的映射关系;对所述用户页面数据进行兴趣属性分析并依次得出兴趣属性点,将兴趣属性点相符量超出第二预设量的用户页面数据进行分类聚合,形成若干用户页面数据集,并获取分类聚合后的与各用户页面数据集相互映射的影评数据集;侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,对其进行兴趣属性分析并依次得出兴趣属性点,查找与其兴趣属性点相符量超出第二预设量的用户页面数据集,并将与所述用户页面数据集相互映射的影评数据集推送给待观影操作事件用户。2.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。3.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,兴趣属性分析并依次得出兴趣属性点,包括:按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。4.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从社交网络上挖掘与影片相关的非影评数据,分析是否存在未观影和/或想观影关键字,若存在则获取对应的用户页面数据。5.根据权利要求1所述的一种基于多媒体数字影像评论的数据挖掘与处理方法,其特征在于,侦测待观影操作事件并挖掘执行待观影操作事件用户公开在社交网络上的数据,包括:从影片购票网站上获取基于影片的检索和/或购票操作事件,获取操作用户基于网站的账号,查找与该账号存在绑定关系的社交网络账号,获取与社交网络账号对应的用户页面数据。6.一种基于多媒体数字影像评论的数据挖掘与处理系统,其特征...
【专利技术属性】
技术研发人员:蔡璟,
申请(专利权)人:苏州亮磊知识产权运营有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。