量化因子预测系统及方法和数据处理方法及系统技术方案

技术编号:39178960 阅读:11 留言:0更新日期:2023-10-27 08:26
本发明专利技术公开量化因子预测系统及方法和数据处理方法及系统,其中,量化因子预测系统包括主程序模块和异构量化因子评估模块;主程序模块包括输入单元、候选量化因子表达式生成单元以及遗传算法单元;异构量化因子评估模块包括候选量化因子表达式计算单元、适应度函数评估单元以及输出单元;输入单元连接候选量化因子表达式生成单元,量化因子表达式生成单元通信连接候选量化因子表达式计算单元,候选量化因子表达式计算单元连接适应度函数评估单元,适应度函数评估单元输出端通信连接遗传算法单元和输出单元;遗传算法单元通信连接候选量化因子表达式计算单元。各种语言版本的异构量化因子评估模块均可共用同一套主程序模块,实现研究生产一体化。现研究生产一体化。现研究生产一体化。

【技术实现步骤摘要】
量化因子预测系统及方法和数据处理方法及系统


[0001]本专利技术涉及量化因子预测系统及方法和数据处理方法及系统,属于金融量化因子预测


技术介绍

[0002]目前量化因子预测方法分为两个流派:基于遗传算法的因子表达式生成算法和基于深度学习的特征提取算法。
[0003]其中,基于遗传算法的因子表达式生成算法是将证券市场行情数据作为输入,利用遗传算法作为整体算法生成候选量化因子表达式,将候选量化因子与目标收益率的信息系数等作为适应度函数,并借助遗传算法中遗传变异操作对候选因子进行复制、交叉和变异等操作,从而使新个体更加适应环境,即能够获得更好的适应度函数得分。并经过多次迭代之后,遗传算法让候选量化因子表达式收敛到空间中的优质解。随着人工智能技术的发展,深度学习在多个领域取得成功应用,并已将深度学习模型引入到量化因子预测工作中。这类工作大多借助于深度学习强大的特征提取能力对证券行情数据进行特征提取。
[0004]目前,基于深度学习的特征提取算法大多数是将输入数据组织成二维矩阵,第一维为原始特征维度,第二维为时序维度。深度学习应用的模型利用自定义算子同时从特征、时间两个维度进行信息抽取,抽取结果作为一个大粒度因子。
[0005]整体来看,基于深度学习的特征提取算法缺乏可解释性,基于遗传算法的因子表达式生成算法能够将因子以表达式的方式展示出来,因此是目前的主流方法。
[0006]但是目前的基于遗传算法的因子表达式生成算法存在以下缺陷:
[0007]1、基于遗传算法的主程序模块与异构量化因子评估模块紧耦合。
[0008]在现有的量化因子预测系统中遗传算法和量化因子评估处于同一套代码中,深度耦合。为了支持不同语言的量化因子预测,研究人员需要实现一套同时包含遗传算法和因子计算引擎的自动预测框架。在这种紧耦合框架下,预测程序无法支持量化因子评估引擎,存在遗传算法的冗余开发问题。
[0009]2、缺乏研究和实盘一体化的能力。
[0010]在现有量化因子预测系统中,离线研究预测因子过程与实盘预测因子过程是相互分割的,他们无法使用同一套量化因子评估引擎。这导致离线预测产生的因子需要经过二次改写才能适配实盘的因子评估引擎,该步骤增加了不必要的工作量。
[0011]3、适应度函数单一。
[0012]现有的量化因子预测算法大多以相关系数IC或者RankIC作为适应度函数,这种方法过于简单且没有考虑金融场景对适应度函数的特殊要求。具体而言,高频T0因子预测需要考虑因子的择时能力,即因子是否可以区分能带来高收益的时点。

技术实现思路

[0013]本专利技术的目的在于克服现有技术中的不足,提供量化因子预测系统及方法和数据
处理方法及系统,实现了基于遗传算法的主程序模块和异构量化因子评估模块解耦合,使得各种语言版本的异构量化因子评估模块均可共用同一套主程序模块,无需二次改写。
[0014]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0015]一方面,本专利技术提供量化因子预测系统,包括主程序模块和异构量化因子评估模块;
[0016]所述主程序模块包括输入单元、候选量化因子表达式生成单元以及遗传算法单元;
[0017]所述异构量化因子评估模块包括候选量化因子表达式计算单元、适应度函数评估单元以及输出单元;
[0018]所述输入单元连接候选量化因子表达式生成单元,量化因子表达式生成单元通信连接候选量化因子表达式计算单元,候选量化因子表达式计算单元连接适应度函数评估单元,适应度函数评估单元输出端通信连接遗传算法单元和输出单元;
[0019]所述遗传算法单元通信连接候选量化因子表达式计算单元。
[0020]另一方面,本专利技术提供量化因子预测方法,其特征在于,包括以下步骤:
[0021]获取证券行情数据;
[0022]预处理获取的证券行情数据,获得各证券行情数据的候选量化因子表达式;
[0023]利用获取的证券行情数据和候选量化因子表达式确定各候选量化因子表达式的适应度分值;
[0024]令适应度分值符合条件的候选量化因子表达式的值为量化因子。
[0025]进一步的,所述证券行情数据包括快照数据、逐笔成交数据和逐笔委托数据。
[0026]进一步的,所述预处理获取的证券行情数据,获得各证券行情数据的候选量化因子表达式包括:
[0027]根据预设的运算算子,利用获取证券行情数据构建候选因子表达式;
[0028]所述运算算子包括基础算子、时序算子和/或截面算子。
[0029]进一步的,所述利用获取的证券行情数据和候选量化因子表达式确定各候选量化因子表达式的适应度分值包括:
[0030][0031]式中,fitness为候选量化因子表达式的适应度分值,为T个时间段的平均适应度分值,λ1为复杂性惩罚因子,φ1为复杂性惩罚转换公式,len
factor
为候选量化因子表达式的长度,λ2为相关性惩罚因子,φ2为相关性惩罚转换公式,corr(
·
,
·
)为相关系数函数,factor为候选量化因子表达式的值,factor
base
为量化因子预测系统内预设的量化因子。为
[0032]进一步的,所述令适应度分值符合条件的候选量化因子表达式的值为量化因子包括:
[0033]判断各候选量化因子表达式的适应度分值与预设阈值的大小:
[0034]当候选量化因子表达式的适应度分值大于预设阈值时,令对应的候选量化因子表达式的值为量化因子,并输出量化因子。
[0035]另一方面,本专利技术提供数据处理方法,包括以下步骤:
[0036]获取的证券行情数据;
[0037]将获取的证券行情数据输入训练好的量化因子预测系统,以获得量化因子;
[0038]将获得的量化因子应用于证券业务中的高频预测场景。
[0039]另一方面,本专利技术提供数据处理系统,包括:
[0040]获取模块,用于获取的证券行情数据;
[0041]量化因子确定模块,用于将获取的证券行情数据输入训练好的量化因子预测系统,以获得量化因子;
[0042]量化因子应用模块,用于将获得的量化因子应用于证券业务中证券行情数据的进一步挖掘。
[0043]另一方面,一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行证券行情数据的处理方法。
[0044]另一方面,一种计算设备,其特征在于,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行证券行情数据的处理方法的指令。
[0045]与现有技术相比,本专利技术所达到的有益效果:
[0046]本专利技术的主程序模块和异构量化因子评估模块是两个独立的模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.量化因子预测系统,其特征在于,包括主程序模块和异构量化因子评估模块;所述主程序模块包括输入单元、候选量化因子表达式生成单元以及遗传算法单元;所述异构量化因子评估模块包括候选量化因子表达式计算单元、适应度函数评估单元以及输出单元;所述输入单元连接候选量化因子表达式生成单元,量化因子表达式生成单元通信连接候选量化因子表达式计算单元,候选量化因子表达式计算单元连接适应度函数评估单元,适应度函数评估单元输出端通信连接遗传算法单元和输出单元;所述遗传算法单元通信连接候选量化因子表达式计算单元。2.量化因子预测方法,其特征在于,包括以下步骤:获取证券行情数据;预处理获取的证券行情数据,获得各证券行情数据的候选量化因子表达式;利用获取的证券行情数据和候选量化因子表达式确定各候选量化因子表达式的适应度分值;令适应度分值符合条件的候选量化因子表达式的值为量化因子。3.根据权利要求2所述的量化因子预测方法,其特征在于,所述证券行情数据包括快照数据、逐笔成交数据和逐笔委托数据。4.根据权利要求2所述的量化因子预测方法,其特征在于,所述预处理获取的证券行情数据,获得各证券行情数据的候选量化因子表达式包括:根据预设的运算算子,利用获取证券行情数据构建候选因子表达式;所述运算算子包括基础算子、时序算子和/或截面算子。5.根据权利要求2所述的量化因子预测方法,其特征在于,所述利用获取的证券行情数据和候选量化因子表达式确定各候选量化因子表达式的适应度分值包括:式中,fitness为候选量化因子表达式的适应度分值,为T个时间段的平均适应度分值,λ1为复杂性惩罚因子,φ1为复杂性惩罚转换公式,len
fa...

【专利技术属性】
技术研发人员:方秋实肖驰牛书炜沈俊灵李瑞宋晓光
申请(专利权)人:华泰证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1