The invention discloses an information processing method and device, wherein, the method comprises: obtaining the normalized forecast video click rate, wherein the forecast is not online or on-line video is video acquisition; for the forecast of each comment on the video's comments and comments on all values. Comment on the value weighted sum, get the prediction of the comment value; acquiring the attribute information of the video to be predicted; the click rate, comment value and attribute information input to the plate model of presupposition, obtained from the sheet model output the prediction value of the row of film video the forecast; output value of row piece of video.
【技术实现步骤摘要】
一种信息处理方法及装置
本专利技术涉及电子技术,尤其涉及一种信息处理方法及装置。
技术介绍
自2004年以来,中国电影市场进入了高速成长时期。2004年我国电影票房收入15亿,据业内人士估计2015年我们电影票房将达到400亿,由此看来十年左右票房增长近30倍;中国故事片产量由2004年的200部增至2014年的638部。电影银幕数量激增,据EBOT艺恩日票房智库数据显示,2015年上半年(1月1日-6月31日)新增影院600家,新增银幕2449块,平均每日13.5块,全国累计银幕26244块,预计年底将达到28000块,从而进一步缩小和美国的差距(美国约有4万块银幕),为票房再上一个台阶打下牢固的地基。而2003年,我国的银幕数仅有2296块,增长近十倍。电影“观影人次”由2006年的0.89亿增长到2014年全国观影人次6.134亿。但是影院和荧幕数的增加并没有带来观影者期望的局面,你是否遇到过这样的尴尬:当你走进电影院,看到售票台的荧幕上密密麻麻地排满了电影,而你想看的影片却只有寥寥几场——不是上午10点,就是晚上11点,有些影院甚至一场没有。而这样的状况在4、5月尤其明显。在好莱坞大片《速7》、《复联2》前后夹击、超级IP电影《何以笙箫默》、《左耳》的左右围攻下,夹缝中求生存的《闯入者》几乎没有生存空间,其上映当日排片率不足1.5%,逼得导演王小帅不得不发公开信,称“这是一场实事先张扬的谋杀案”,并呼吁广大观众“请你挺我!”一时间,“到底是谁在操纵影院排片?”这个只有电影业内人才会关心的话题竟成了普通观众讨论的焦点。所谓排片率其实就是一部电影在影院 ...
【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:获取待预测视频的归一化的点击率,其中所述待预测视频为未上线或正在上线的视频;获取针对所述待预测视频的每一评论的评论值,并对所有评论的评论值进行加权求和,得到所述待预测视频的评论值;获取所述待预测视频的属性信息;将所述点击率、评论值和属性信息输入到预设的排片模型,得到从所述排片模型输出的所述待预测视频的排片值;输出所述待预测视频的排片值。
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取待预测视频的归一化的点击率,其中所述待预测视频为未上线或正在上线的视频;获取针对所述待预测视频的每一评论的评论值,并对所有评论的评论值进行加权求和,得到所述待预测视频的评论值;获取所述待预测视频的属性信息;将所述点击率、评论值和属性信息输入到预设的排片模型,得到从所述排片模型输出的所述待预测视频的排片值;输出所述待预测视频的排片值。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述待预测视频的排片值对所述待预测视频进行排片。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:建立排片模型,具体包括:获取训练数据,所述训练数据为已上线的视频的点击率、评论值和属性信息;将所述点击率、评论和属性信息作为输入参数,采用决策树方法建立排片模型。4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取针对所述待预测视频的每一评论的评论值,包括:获取针对所述待预测视频的每一评论;根据词典提取每一所述评论,得到情感词和程度副词;根据所述情感词和所述程度副词确定每一所述评论的评论值。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:将获取的所述待预测视频的评论作为第一评论集合,获取所述第一评论集合中每一所述评论的网际协议IP地址;当所述IP地址对应有两条及两条以上的评论时,计算所述两条及两条以上的评论中两两评论的相似度;判断所述两两评论的相似度是否大于预设的第一阈值,得到第一判断结果;当所述第一判断结果表明所述两两评论的相似度大于所述第一阈值时,从所述第一评论集合中删除所述两两评论,得到所述待预测视频的第二评论集合;对应地,所述根据词典提取所述第二评论集合中的每一评论,得到情感词和程度副词;根据所述情感词和所述程度副词确定每一评论的评论值;对所述第二评论集合中每一评论的评论值进行加权求和,得到所述待预测视频的评论值。6.根据权利要求1至4任一项所述的方法,其特征在于,所述属性信息至少以下信息中的任一项:视频类别、导演、导演级别、演员、编剧、演员级别、剧本质量、出品方、制作公司、视频频道、版权供应商、版权开始时间、版权占用预算年、版权期限、版权内容的评级、是否独播、所属频道、内容类别、制片地区。7.一种信息处理装置,其特征在于,所述装置包括第一获取单元、第二获取单元、求和单元、第三获取单元、处理单元和输出单元,其中:所述第一获...
【专利技术属性】
技术研发人员:孟繁宇,
申请(专利权)人:中国移动通信集团公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。