基于税务数据的产排污量预测模型构建方法和系统技术方案

技术编号:34336401 阅读:64 留言:0更新日期:2022-07-31 03:04
本发明专利技术公开一种基于税务数据的产排污量预测模型构建方法和系统,首先获取税务数据和污普数据;并确定基础指标和虚拟指标;然后构建企业生产产值的线性回归模型;最后产排污系数和企业生产产值构建企业产排污预测模型。本发明专利技术提供的方法采用税务数据和企业的规模特征代表的虚拟指标构建企业生产产值模型,再用该模型来预测企业的生产产值,最后根据企业的污普系数和企业生产产值来拟合预测企业的产排污量,更加符合企业产排污量预测要求,通过实际数据的验证,该模型预测值准确率高,充分证明了本方法提供的产排污预测模型的可靠性。证明了本方法提供的产排污预测模型的可靠性。证明了本方法提供的产排污预测模型的可靠性。

Construction method and system of production and emission prediction model based on tax data

【技术实现步骤摘要】
基于税务数据的产排污量预测模型构建方法和系统


[0001]本专利技术涉及数据处理
,特别是一种基于税务数据的产排污量预测模型构建方法和系统。

技术介绍

[0002]目前,工业污染源产排污量监控是工业污染治理的重点内容,是衡量企业对其环境保护的综合能力,以及督促企业持续改进环境保护的有力武器,工业污染源产排污量的获取是工业污染防治管理体系的基础性工作,对掌握我国工业污染源的数量、行业和地区分布情况,制定相关的环境管理政策有着重要意义,目前企业治污能力整体提升,但同一治理技术在同行业不同区域、不同企业间运行状态可能有所不同,同类型排污企业排放量的个体差异明显。
[0003]但是,现有的产排污量监控一般是对已经产生了产排污量进行,对应企业可能产生的产排污量无法有效的预测,现有的产排污量一般是采用历史数据回归的方法,通过用历年能源统计年鉴中分行业的能源消耗系数预估得到,但是这种方法无法有效实现某地区域的工业污染源产排污量的达标,数据的时效性和准确性较低,不利于工业污染源产排污量的实时监控和处理。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种基于税务数据的产排污量预测模型构建方法和系统,该方法利用税务数据和污普数据构建不同企业产排污量预测模型,从而实现了企业产排污量的预测,达到及时监控和调整企业对环境的影响。
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]本专利技术提供的基于税务数据的产排污预测模型构建方法,包括以下步骤:
[0007]S1:获取税务数据和污普数据;
[0008]S2:根据税务数据确定拟合污普数据的基础指标;所述基础指标包括增值税申报收入数据、电费数据、水费数据和气费数据;
[0009]S3:根据基础指标确定样本训练数据和企业类型的虚拟指标;
[0010]S4:根据基础数据和虚拟指标构建企业生产产值的线性回归模型;
[0011]S5:将经过训练的线性回归模型作为企业生产产值的预测模型;
[0012]S6:根据污普数据确定企业的产排污系数,并根据产排污系数和企业生产产值构建企业产排污预测模型。
[0013]进一步,所述企业生产产值的线性回归模型至少包括以下任一项或任意项组合的公式:
[0014]类型一:同时具有四个基础指标数据的企业;
[0015]Y=αX1+βX2+γX3+δX4+Z;
[0016]类型二:同时具有增值税申报收入、电费和水费三个基础指标数据的企业;
[0017]Y=αX1+βX2+γX3+Z;
[0018]类型三:同时具有增值税申报收入、电费和气费三个基础指标数据的企业;
[0019]Y=αX1+βX2+δX4+Z;
[0020]类型四:同时具有增值税申报收入和电费两个基础指标数据的企业;
[0021]Y=αX1+βX2+Z;
[0022]其中,Y表示企业的生产产值;X1表示增值税申报收入;X2表示电费;X3表示水费;X4表示气费;α、β、γ、δ为模型经过训练后确认的参数,Z为虚拟指标。
[0023]进一步,所述企业产排污预测模型按照以下公式进行:
[0024]PY=Y*θ
1i

[0025]PD=Y*θ
2i

[0026]其中,PY表示产污量,θ
1i
表示第i个企业的产污系数;PD表示排污量,θ
2i
表示第i个企业的排污系数。
[0027]进一步,所述虚拟指标按照以下任意一种方式确定:
[0028]根据污普数据中企业规模指标将企业划分为不同类型的企业,并根据不同类型的企业构建企业类型的虚拟指标Z,所述虚拟指标包括大型、中性、小型、微型企业。
[0029]进一步,所述线性回归模型训练按照以下步骤进行:将从样本数据集中随机抽取的数据作为训练集,运用最小二乘法进行模型训练;将从样本数据集中的随机抽取的数据作为验证集,用来评估预测模型。
[0030]进一步,还包括以下步骤:
[0031]使用企业的在线监测数据和环境税申报数据验证推测数据的准确性,以及使用推测数据进行测算验证。
[0032]进一步,具体包括以下步骤:
[0033]首先,利用上述企业产排污预测模型构建方法来构建企业产排污量预测模型;
[0034]然后,向企业产排污量预测模型输入当前税务数据,利用当前税务数据预测当前的企业生产产值数据;
[0035]最后,使用污普数据的产值数据和产排污量数据以及预测的当前生产产值数据,推测出当前的产排污量数据。
[0036]本专利技术提供的基于税务数据的产排污量预测系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序包括数据采集接口、线性回归模型构建模块、产排污量预测模块和输出模块;
[0037]所述数据采集接口,用于获取税务数据和污普数据;
[0038]所述线性回归模型构建模块,用于根据税务数据构建企业生产产值的线性回归模型;
[0039]所述产排污量预测模块,用于根据污普数据的产排污系数和企业生产产值构建企业产排污预测模型;
[0040]所述输出模块,用于输出企业产排污预测模型计算结果。
[0041]进一步,所述企业生产产值的线性回归模型至少包括以下任一项或任意项组合的公式:
[0042]类型一:同时具有四个基础指标数据的企业;
[0043]Y=αX1+βX2+γX3+δX4+Z;
[0044]类型二:同时具有增值税申报收入、电费和水费三个基础指标数据的企业;
[0045]Y=αX1+βX2+γX3+Z;
[0046]类型三:同时具有增值税申报收入、电费和气费三个基础指标数据的企业;
[0047]Y=αX1+βX2+δX4+Z;
[0048]类型四:同时具有增值税申报收入和电费两个基础指标数据的企业;
[0049]Y=αX1+βX2+Z;
[0050]其中,Y表示企业的生产产值;X1表示增值税申报收入;X2表示电费;X3表示水费;X4表示气费;α、β、γ、δ为模型经过训练后确认的参数,Z为虚拟指标。
[0051]进一步,所述企业产排污预测模型按照以下公式进行:
[0052]PY=Y*θ
1i

[0053]PD=Y*θ
2i

[0054]其中,PY表示产污量,θ
1i
表示第i个企业的产污系数;PD表示排污量,θ
2i
表示第i个企业的排污系数。
[0055]本专利技术的有益效果在于:
[0056]本专利技术提供的基于税务数据的产排污量预测模型构建方法和系统,该方法采用税务数据和企业的规模特征代表的虚拟指标构建企业生产产值模型,再用该模型来预测企业的生产产值,最后根据企业的污普系数和企业生产产值来拟合预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于税务数据的产排污预测模型构建方法,其特征在于:包括以下步骤:S1:获取税务数据和污普数据;S2:根据税务数据确定拟合污普数据的基础指标;所述基础指标包括增值税申报收入数据、电费数据、水费数据和气费数据中任一项或任意项组合;S3:根据基础指标确定样本训练数据和企业类型的虚拟指标;S4:根据基础数据和虚拟指标构建企业生产产值的线性回归模型;S5:将经过训练的线性回归模型作为企业生产产值的预测模型;S6:根据污普数据确定企业的产排污系数,并根据产排污系数和企业生产产值构建企业产排污预测模型。2.如权利要求1所述的基于税务数据的产排污预测模型构建方法,其特征在于:所述企业生产产值的线性回归模型至少包括以下任一项或任意项组合的公式:类型一:同时具有四个基础指标数据的企业;Y=αX1+βX2+γX3+δX4+Z;类型二:同时具有增值税申报收入、电费和水费三个基础指标数据的企业;Y=αX1+βX2+γX3+Z;类型三:同时具有增值税申报收入、电费和气费三个基础指标数据的企业;Y=αX1+βX2+δX4+Z;类型四:同时具有增值税申报收入和电费两个基础指标数据的企业;Y=αX1+βX2+Z;其中,Y表示企业的生产产值;X1表示增值税申报收入;X2表示电费;X3表示水费;X4表示气费;α、β、γ、δ为模型经过训练后确认的参数,Z为虚拟指标。3.如权利要求1所述的基于税务数据的产排污预测模型构建方法,其特征在于:所述企业产排污预测模型按照以下公式进行:PY=Y*θ
1i
;PD=Y*θ
2i
;其中,PY表示产污量,θ
1i
表示第i个企业的产污系数;PD表示排污量,θ
2i
表示第i个企业的排污系数。4.如权利要求1所述的基于税务数据的产排污预测模型构建方法,其特征在于:所述虚拟指标按照以下任意一种方式确定:根据污普数据中企业规模指标将企业划分为不同类型的企业,并根据不同类型的企业构建企业类型的虚拟指标Z,所述虚拟指标包括大型、中性、小型、微型企业。5.如权利要求1所述的基于税务数据的产排污预测模型构建方法,其特征在于:所述线性回归模型训练按照以下步骤进行:将从样本数据集中随机抽取的数据作为训练集,运用最小二乘法进行模型训练;将从样本数据集中的随机抽取的数据作为验证集,用来评估预测模型。6.如权利要求...

【专利技术属性】
技术研发人员:张青松张永刚张若冰何远邹天一
申请(专利权)人:成都大数据产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1