一种影片票房数据的预测方法及装置制造方法及图纸

技术编号:14458911 阅读:245 留言:0更新日期:2017-01-19 16:06
本发明专利技术提供了一种影片票房数据的预测方法及装置,该方法包括:获取待预测影片的上映类型;当待预测影片为首映影片时,根据待预测影片的首映日期的类型和首映日放映时间段的类型从票房数据预测模型中选取相应的票房数据预测子模型;当待预测影片为非首映影片时,获取待预测影片的当前票房数据;根据预测日的类型从票房数据预测模型中选取相应的票房数据预测子模型。本发明专利技术实施例通过根据待预测影片的类型选取相应的票房数据预测子模型进行票房预测,同时,选用专资办发布的票房数据、实时票房数据、监控网站的售票订单数据这三类数据作为模型输入数据,从而提高了票房预测的准确度,进而能够对影院的排片起到准确地指导作用。

【技术实现步骤摘要】

本专利技术涉及电影票房统计的
,具体而言,涉及一种影片票房数据的预测方法及装置。
技术介绍
目前,随着中国电影市场的快速发展,电影上映量也随之增加,电影的票房数据作为电影行业的重要指标之一,由于电影的次日票房数据对于各个影院的排片安排具有重要的指导意义,因而,准确地预测电影的次日票房数据显得十分重要。当前,相关技术中提供了一种影片票房数据的预测方法,主要是查看一些专业影评人结合专资办发布的前几日的影片的票房数据根据经验预估的该影片的次日票房数据。在实现本专利技术的过程中,专利技术人发现相关技术中至少存在以下问题:采用目前的影片票房数据的预测方法来确定影片次日票房数据存在准确度低、参考性差的问题,无法实现对影院的排片起到准确地指导作用。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种影片票房数据的预测方法及装置,以提高票房预测的准确度,进而实现对影院的排片起到准确地指导作用。第一方面,本专利技术实施例提供了一种影片票房数据的预测方法,该方法包括:获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,上述获取待预测影片的上映类型之前,还包括:获取训练票房数据预测模型所需的训练样本数据,其中,所述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、所述预设时间段内的实时票房数据、以及所述预设时间段内监控网站的售票订单数据;采用线性回归算法根据所述训练样本数据训练得到票房数据预测模型,其中,所述票房数据预测模型包括:多个票房数据预测子模型,所述票房数据预测子模型包含每部影片的预测比例系数向量,所述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据,包括:获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;根据提取到的多个所述特征值生成所述待预测影片的特征向量;根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的首映日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,上述利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据,包括:对输入的所述当前票房数据进行特征提取,得到多个特征值;根据提取到的多个所述特征值生成所述待预测影片的特征向量;根据所述特征向量和线性公式y2=WX+b计算得到所述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,上述方法还包括:采用流式滚动抓取数据的方式从监控的售票系统中抓取当日多个影院的多个场次座位占用数据,并将抓取到的所述场次座位占用数据依次存入相应的数据库中;将所述数据库中的场次座位占用数据输入至预先训练的票房数据清洗模型,对所述场次座位占用数据进行清洗,得到清洗后的场次座位占用数据;将清洗后的场次座位占用数据输入至预先训练的票房数据计算模型,利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,并将所述各个影片截止目前时刻的当日全国票房数据存入至票房数据存储数据库中;根据所述待预测影片的影片名称从所述票房数据存储数据库中调取所述待预测影片的实时票房数据。结合第一方面的第四种可能的实施方式,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,上述利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,包括:根据清洗后的场次座位占用数据计算各个影片的特征参量的实际数值,其中,所述特征参量包括以下中的一种或者多种:当日抓取的影片的场次数、当日抓取的影片的总场次座位占用数、前一日抓取的影片的场次数、或者前一日抓取的影片的总场次座位占用数;当影片为非首映影片时,从票房数据计算模型中调取所述影片对应的特征参量的特征系数,以及当影片为首映影片时,将票房数据计算模型中所有首映影片的各个特征参量的特征系数的平均值作为所述影片对应的各个特征参量的特征系数;根据公式所述各个特征参量的特征系数和各个所述特征参量的实际数值,计算得到所述影片截止目前时刻的当日全国票房数据,其中,Y表示影片的当日全国票房数据,i表示影片各个特征参量的序号,wi表示第i个特征参量对应的特征系数,xi表示第i个特征参量的实际数值。第二方面,本专利技术实施例还提供了一种影片票房数据的预测装置,该装置包括:上映类型获取模块,用于获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;第一票房数据预测模块,用于当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;第二票房数据预测模块,用于当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。结合第二方面,本专利技术实施例提供了第二方面的第一种可能的实施方式,其中,上述装置还包括:训练样本获取模块,用于获取训练票房数据预测模型所需的训练样本数据,其中,所述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、所述预设时间段内的实时票房数据、以及所述预设时间段内监控网站的售票订单数据;预测模型训练模块,用于采用线性回归算法根据所述训练样本数据训练得到票房数据预测模型,其中,所述票房数据预测模型包括:多个票房数据预测子模型,所述票房数据预测子模型包含每部影片的预测比例系数向量,所述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。结本文档来自技高网...

【技术保护点】
一种影片票房数据的预测方法,其特征在于,所述方法包括:获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。

【技术特征摘要】
1.一种影片票房数据的预测方法,其特征在于,所述方法包括:获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。2.根据权利要求1所述的方法,其特征在于,所述获取待预测影片的上映类型之前,还包括:获取训练票房数据预测模型所需的训练样本数据,其中,所述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、所述预设时间段内的实时票房数据、以及所述预设时间段内监控网站的售票订单数据;采用线性回归算法根据所述训练样本数据训练得到票房数据预测模型,其中,所述票房数据预测模型包括:多个票房数据预测子模型,所述票房数据预测子模型包含每部影片的预测比例系数向量,所述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。3.根据权利要求1所述的方法,其特征在于,所述利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据,包括:获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;根据提取到的多个所述特征值生成所述待预测影片的特征向量;根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的首映日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。4.根据权利要求1所述的方法,其特征在于,所述利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据,包括:对输入的所述当前票房数据进行特征提取,得到多个特征值;根据提取到的多个所述特征值生成所述待预测影片的特征向量;根据所述特征向量和线性公式y2=WX+b计算得到所述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:采用流式滚动抓取数据的方式从监控的售票系统中抓取当日多个影院的多个场次座位占用数据,并将抓取到的所述场次座位占用数据依次存入相应的数据库中;将所述数据库中的场次座位占用数据输入至预先训练的票房数据清洗模型,对所述场次座位占用数据进行清洗,得到清洗后的场次座位占用数据;将清洗后的场次座位占用数据输入至预先训练的票房数据计算模型,利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,并将所述各个影片截止目前时刻的当日全国票房数据存入至票房数据存储数据库中;根据所述待预测影片的影片名称从所述票房数据存储数据库中调取所述待预测影片的实时票房数据。6.根据权利要求5所述的方法,其特征在于,所述利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,包括:根据清洗后的场...

【专利技术属性】
技术研发人员:王强韩啸天梁书宇赵颖泽
申请(专利权)人:北京猫眼文化传媒有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1