本发明专利技术公开了一种基于数据统计的农产品价格预测方法,包括价格信息采集和相应农产品集产地基础数据采集,对采集数据进行信息预处理并构建综合据库,然后对某种单一或组合农产品市场技术分析形成至少包括次日的价格走势曲线,在根据某农产品季节因素计算相应农产品投资的波动率,对价格走势曲线进行修正,通过对产品风险因子的因子回报进行计算,将波动率与所述价格走势曲线结合形成价格波动率曲线。本发明专利技术将惯性购买欲与某种农产品市场技术指标有机地结合,用以优化预测某种农产品市场走势,提高了某种农产品市场预测的准确性,通过对农产品的超无风险利率收益进行计算,将农产品的价格走势与波动率结合,提高预测精准度。提高预测精准度。提高预测精准度。
【技术实现步骤摘要】
一种基于数据统计的农产品价格预测方法
[0001]本专利技术属于农产品市场价格预测领域,具体涉及一种基于数据统计的农产品价格预测方法。
技术介绍
[0002]农业是我国国民经济的命脉,农产品市场在现代社会中占有重要的地位。某种农产品市场行情受国内或国际环境、国家季节、经济形势和人们需求量的影响,以及受投资者心理等诸多因素的影响,农产品市场预测是经济、系统科学领域的重要研究问题。随着人们对农产品需求数量不断增大、质量不断提高,对农产品的合理有效生产和销售提出了更高的要求。传统的农产品产销模式是以人工方式去估计市场的需求和价格,并根据市场情况调整产品的生产和销售,这种方式工作量较大,信息反馈慢,且对市场的把握不够及时准确。现有的农产品产销及流通过程中还存在信息反馈慢、市场经营策略制定不够及时、准确等现象,导致了农产品的产销决策效率低,时间浪费严重的问题。
[0003]目前,国内外对农产品的价格预测主要集中于定性和定量两种预测方法。定性预测方法主要借助于专家的经验知识对农产品的未来走势给出个人主观预测,该类方法的主观随意性大,预测的精确性往往受限于专家经验的丰富程度。定量预测方法主要通过对农产品的市场价格建立数学模型,利用建立的模型对未来的价格进行预测。该类方法都是以农产品价格数据为中心建模,精确度往往受限于所搜集的农产品价格数据的准确性,而在现实情形中,搜集准确的农产品价格数据需要耗费大量的人力、物力以及较长的时间周期,这往往制约了该类方法的普遍适用性。随着互联网的迅猛发展和广泛普及,使得人们能够及时获得众多电商最新价格信息。由于电商最新价格信息反映了季节对农产品市场发展变化的特点,这些特点信息不断在影响投资者对于市场趋势的判断,进而影响市场走势。另外,随着购买欲分析技术的发展,购买欲分析技术已被应用于价格预测领域。在现有的基于购买欲分析的某种农产品预测方法中,处理对象主要包括互联网电商评价和购买者答疑,处理方法是发现这些信息的购买欲倾向与某种农产品市场行情的关联,进而预测未来某种农产品市场的走势。一种现有关于农产品价格预测有采用基于隐马尔科夫模型的某种农产品市场预测方法,其主要使用了某种农产品市场运行过程中的基本信息,但忽略了最新媒体的观点和投资者的心理对某种农产品市场波动的影响,仅仅利用这些基本信息难以反映某种农产品市场的性质。
技术实现思路
[0004]针对现有预测方法仅能处理单一或组合农产品价格走势问题,不能解决还存于每次计算投资过程中起止时间内的波动率问题,本专利技术提供了一种针对单一或组合农产品的价格走势与波动率结合的预测方法,且将惯性购买欲与某种农产品市场技术指标有机地结合,优化预测某种农产品市场走势。
[0005]本专利技术实现其目的技术方案是采用一种基于数据统计的农产品价格预测方法,该
方法主要包括如下步骤。
[0006]步骤1.价格信息采集。1.1线上价格信息采集:针对多个知名电商网信息,利用网络爬虫Heritrix采集相应网站前数页内关于某种农产品网页价格,其包括以日为单位的历史成交价格和当日成交价格,将其保存到本地计算机。1.2线下价格信息采集:包括所有关于某种农产品中抽取具有市场代表性的多家主要贸易商的某种农产品作为计算对象,并以当日销售量为权重计算得出的当前加权价格指数。
[0007]步骤2.相应农产品集产地基础数据采集。包括相应农产品产地各地农贸网基础数据采集,包括实时价格数据、分析师名称、价格数据发布时间和相应农贸网名称,获取相应分析师的预测准确度数据库。
[0008] 步骤3.信息预处理。3.1对所述线上信息采集步骤中获取的农产品网页价格进行正文抽取、分词和词性标注,以及停用词和标点符号过滤,针对采集到的农产品网页价格抽取最新网页的标题、发布时间和正文对应某农产品信息,去除网页中的噪音信息,形成针对某农产品的文本,并进行分词和词性标注,形成线上价格统计的数据库。3.2对所述线下信息采集通过人工构建农产品领域词库和某种农产品市场惯性购买欲词库,由于不同区域农贸领域包含众多的专业词汇,因此通过构建农产品领域词库和某种农产品市场惯性购买欲词库来提高分词的准确率,并对某农产品的文本进行分词和词性标注形成线下价格统计的数据库。3.3 对所述农贸网名称获取相应农贸网的分析师数据、分析师资质和分析师研究不同农产品方向,确定相应农贸网的网站等级,同时对盈利预测准确度、目标价准确度和投资评级准确度和网站等级进行加权计算,进一步优化分析师等级,再根据所述数据发布时间确定预测时间等级,将相应分析师等级和其预测时间等级对相应农产品实时价格数据进行加权计算,获取所述农贸网加权的价格信息预测值。
[0009]步骤4.构建综合据库。根据所述线上统计数据库和线下统计数据库及预测准确度数据库构建某种农产品领域相关的当前语料数据库,其中包括对农产品价格网页的主题词抽取和某种农产品领域相关语料的识别。
[0010]步骤5.对某种单一或组合农产品市场技术分析。依据某农产品当前成交价格和历史成交价格为基础确定次日价格走势,结合分析师权重和某种农产品市场惯性购买欲,分析某种农产品市场线上和线下技术指标走势,并绘制至少包括次日的价格走势曲线。
[0011]步骤6. 根据某农产品季节因素计算相应农产品投资的波动率,对价格走势曲线进行修正,通过输入设备输入的某单一农产品或多个农产品组合、组合农产品中的不同农产品对应的权重、产品收获地、收获时间、购入价和零售价。基于上述步骤5的技术分析,再从综合数据库读取根据当前基础数据计算得到的风险控制参数的值,所述风险控制参数包括单一或组合农产品风险因子、农产品风险因子的因子回报、因子回报的协方差矩阵以及残差波动率,所述残差波动率是不能由上述技术分析所解释部分回报的波动率;所述产品风险因子的因子回报采用横截面回归方法计算,y=Xf+ε;其中,y表示单一或组合农产品的超无风险利率收益,X表示单一或组合农产品的风险因子,f表示单一或组合农产品风险因子的因子回报,ε表示不能由单一或组合农产品风险因子所解释部分的残差回报;通过如下公式计算因子回报的协方差矩阵;
其中,fi表示i日单一或组合农产品风险因子的因子回报,i∈[0 ,T],λ表示因子回报权重的衰减速度,长半衰期L满足:L=
‑
log2(λ)的整数部分,为T+1日的某单一农或组合产品风险因子的因子回报的协方差矩阵,n为整数,且n≥1;根据所述单一或组合农产品对应的权重、收获时间、购入价、零售价以及所述某单一农产品或组合农产品风险因子、因子回报的协方差矩阵、残差波动率的值,计算得到单一或组合农产品投资组合在所述起止时间内的波动率,将计算得到的某单一或组合农产品风险因子、某单一或组合农产品风险因子的因子回报、因子回报的协方差矩阵以及残差波动率存入风险控制模型数据库,将波动率与所述价格走势曲线结合形成价格波动率曲线。
[0012]本专利技术的有益效果:本专利技术方法不仅采集线上价格信息、线下价格信息和农产品集产地基础数据采集,技术分析某种单一或组合农产品市场价格走势,而且将惯性购买欲与某种本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于数据统计的农产品价格预测方法,其特征在于,包括如下步骤,步骤1.价格信息采集:1.1线上价格信息采集:针对多个知名电商网信息,利用网络爬虫采集相应网站前数页内关于某种农产品网页价格,将其保存到本地计算机;1.2线下价格信息采集:包括所有关于某种农产品中抽取具有市场代表性的多家主要贸易商的该农产品作为计算对象,并以当日销售量为权重计算得出的当前加权价格指数;步骤2.相应农产品集产地基础数据采集:包括相应农产品产地各地农贸网基础数据采集,包括实时价格数据、分析师名称、价格数据发布时间和相应农贸网名称,获取相应分析师的预测准确度数据库;步骤3.信息预处理:3.1对所述线上信息采集步骤中获取的农产品网页价格进行正文抽取、分词和词性标注,以及停用词和标点符号过滤,针对采集到的农产品网页价格抽取最新网页的标题、发布时间和正文对应某农产品信息,去除网页中的噪音信息,形成针对某农产品的文本,并进行分词和词性标注,同时构建某种农产品市场惯性购买欲词库来提高分词的准确率,形成包含惯性购买欲的线上价格统计的数据库;3.2对所述线下信息采集通过人工构建农产品领域词库和某种农产品市场惯性购买欲词库,并对某农产品的文本进行分词和词性标注形成线下价格统计的数据库;3.3 对所述农贸网名称获取相应农贸网的分析师数据、分析师资质和分析师研究不同农产品方向,确定相应农贸网的网站等级,同时对盈利预测准确度、目标价准确度和投资评级准确度和网站等级进行加权计算,进一步优化分析师等级,再根据数据发布时间确定预测时间等级,将相应分析师等级和其预测时间等级对相应农产品实时价格数据进行加权计算,获取所述农贸网加权的价格信息预测值;步骤4.构建综合据库:根据所述线上统计数据库和线下统计数据库及预测准确度数据库构建某种农产品领域相关的当前语料数据库;步骤5.对某种农产品市场技术分析:依据某农产品当前成交价格和历史成交价格为基础确定次日价格走势,结合分析师权重和该农产品市场惯性购买欲,分析该农产品市场线上和线下技术指标走势,并绘制至少包括次日的价格走势曲线;步骤6. 根据某农产品季节因素计算相应农产品投资的波动率,对价格走势曲线进行修正:从综合数据库读取根据当前基础数据计算得到的风险控制参数的值,所述风险控制参数包括某农产品风险因子、农产品风险因子的因子回报、因子回报的协方差矩阵以及残差波动率,所述残差波动率是不能由上述技术分析所解释部分回报的波动率;所述产品风险因子的因子回报采用横截面回归方法计算,y=Xf+ε;其中,y表示该农产品的超无风险利率收益,X表示该农产品的风险因子,f表示该农产品风险因子的因子回报,ε表示不能由该农产品风险因子所解释部分的残差回报,计算得到单一或组合农产品投资组合在起止时间内的波动率。2.根据权利要求1所述的农产品价格预测方法,其特征在于,步骤1.1中,在网络爬虫中,分别输入包括但不限于四个种...
【专利技术属性】
技术研发人员:李春娥,
申请(专利权)人:浙江越秀外国语学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。