The invention relates to the field of data processing, and discloses a method and device for operating prediction based on tax data. The method includes: extracting tax records within specified time period from the historical tax data of the target enterprise, generating a historical tax record sequence, and training the calendar with long short term memory LSTM model. The historical tax records sequence predicts the future business data of the target enterprise. The invention effectively uses the LSTM model to predict the business trend in the future period of the enterprise. Based on the model parameters, it only needs simple steps to predict the future business of different enterprises, thus providing investment decision or investment basis for various organizations.
【技术实现步骤摘要】
一种基于税务数据进行经营预测的方法及装置
本专利技术涉及数据处理领域,具体地,涉及一种基于税务数据进行经营预测的方法及装置。
技术介绍
随着税务数据的不断增长和互联网大数据技术的兴起,税务大数据也应运而生。税务机构基于传统的系统平台难以对税务大数据进行有效处理和信息挖掘,不能充分利用大量的税务数据进行信息获取、数据挖掘和数据分析等有价值的操作。而实际中,税务数据包含了所有企业的营业情况,能够真实的反应企业的收入和增长趋势。因此,税务机构对税务数据的大数据处理技术日渐重视,快速有效地利用税务数据挖掘出有价值的信息越来越重要。目前,随着大数据技术的发展和数据计算能力的增强,基于海量数据利用机器学习的智能化处理已成为主流的数据处理方案。但是,现有的机器学习的应用主要集中在有监督学习和无监督学习两种(具体为分类和聚类),对时间序列则无法准确预测,从而不适用于基于时间序列的税务数据处理。
技术实现思路
本专利技术的目的是提供一种基于税务数据进行经营预测的方法及装置,用于实现税务大数据的有效处理和信息挖掘。本专利技术提供了一种基于税务数据进行经营预测的方法,该方法包括:从目标企业的历史税务数据中提取出指定时间段内的税务记录,生成历史税务记录序列;以及采用长短期记忆LSTM模型训练所述历史税务记录序列,预测出目标企业的未来营业数据。可选地,所述生成历史税务记录序列包括:以预设周期为时间单位对提取出的指定时间段内的税务记录按时间顺序进行排序;根据排序结果,生成历史税务记录序列;以及对所述历史税务记录序列中的每个元素进行归一化处理。可选地,所述历史税务记录序列中的每个元素包括进 ...
【技术保护点】
一种基于税务数据进行经营预测的方法,其特征在于,该方法包括:从目标企业的历史税务数据中提取出指定时间段内的税务记录,生成历史税务记录序列;以及采用长短期记忆LSTM模型训练所述历史税务记录序列,预测出目标企业的未来营业数据。
【技术特征摘要】
1.一种基于税务数据进行经营预测的方法,其特征在于,该方法包括:从目标企业的历史税务数据中提取出指定时间段内的税务记录,生成历史税务记录序列;以及采用长短期记忆LSTM模型训练所述历史税务记录序列,预测出目标企业的未来营业数据。2.根据权利要求1所述的方法,其特征在于,所述生成历史税务记录序列包括:以预设周期为时间单位对提取出的指定时间段内的税务记录按时间顺序进行排序;根据排序结果,生成历史税务记录序列;以及对所述历史税务记录序列中的每个元素进行归一化处理。3.根据权利要求2所述的方法,其特征在于,所述历史税务记录序列中的每个元素包括进项总额、销项总额、总税额和平均企业人数。4.根据权利要求1至3中任意一项所述的方法,其特征在于,该方法还包括:训练并测试LSTM模型。5.根据权利要求1所述的方法,其特征在于,所述训练并测试LSTM模型包括:从目标企业的历史税务数据中获取预定数量的历史税务记录序列样本;将所述预定数量的历史税务记录序列样本分别输入LSTM模型,得到预定数量的预测结果;以及采用预先选定的损失函数处理所述预测结果与企业的实际营业数据;其中,若所述损失函数在训练过程中收敛,则LSTM的模型训练结束。6.一种基于税务数据进行经营预测的装置,其特征在于,该装置包括:数据预处理模块,用于从目标企业的历史税务数据中提取出指定时间段内...
【专利技术属性】
技术研发人员:齐超,林文辉,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。