【技术实现步骤摘要】
个股投资组合的确定方法、装置、电子设备及可读存储介质
[0001]本文件涉及基于计算机技术的量化投资领域,尤其涉及一种个股投资组合的确定方法、装置、电子设备及可读存储介质。
技术介绍
[0002]量化投资领域,用于归因个股收益率的变量,按大类可分为技术因子,基本面因子,宏观因子,舆情因子,情绪因子和统计因子。各因子背后均蕴含不同的交易逻辑及经济逻辑等,表现形式为计算所得因子值,也称因子暴露。相关技术中,存在一些基于深度学习模型确定个股投资组合的方法,主要为通过给定若干个风险因子来对股票组合的收益率进行分析及预测,但是这些方法存在预测的准确性不高,对输入模型的因子的特征要求相对严格,及应用场景受限等诸多缺点。
技术实现思路
[0003]本申请实施例的目的是提供一种个股投资组合的确定方法、装置、电子设备及可读存储介质,用于通过大规模深度学习模型的端到端训练和预期收益率预测过程,提高了执行效率,帮助投资人员构建个性化的个股投资组合。
[0004]为解决上述技术问题,本申请实施例是这样实现的:
[0005]第一方面,提出了一种个股投资组合的确定方法,包括:
[0006]基于个股多个信息维度的历史数据确定影响个股收益率的有效因子及有效因子值;
[0007]利用预先训练的深度学习模型,基于所述有效因子及所述有效因子值预测所述个股的预期收益率;
[0008]基于所述有效因子、所述有效因子值、所述个股的历史收益率及所述个股的行业矩阵构建个股投资组合权重的最优化问题的数学模型;所 ...
【技术保护点】
【技术特征摘要】
1.一种个股投资组合的确定方法,其特征在于,所述方法包括:基于个股多个信息维度的历史数据确定影响个股收益率的有效因子及有效因子值;利用预先训练的深度学习模型,基于所述有效因子及所述有效因子值预测所述个股的预期收益率;基于所述有效因子、所述有效因子值、所述个股的历史收益率及所述个股的行业矩阵构建个股投资组合权重的最优化问题的数学模型;所述行业矩阵用于表征所述个股所属的行业分类;根据所述最优化问题确定符合所述目标函数的个股投资目标组合权重。2.如权利要求1所述的方法,其特征在于,基于所述有效因子、所述有效因子值、所述个股的历史收益率及所述个股的行业矩阵构建个股投资组合权重的最优化问题的数学模型,包括:基于所述有效因子值、所述个股的历史收益率及所述个股的行业矩阵确定所述有效因子的风险矩阵;所述风险矩阵为根据历史因子收益率序列计算得到各因子相关系数矩阵,因子收益率表征各因子对个股历史收益率的贡献;基于所述有效因子、所述个股的历史收益率确定所述有效因子的因子暴露矩阵;所述因子暴露矩阵表征所述个股在对应因子上的权重;通过所述预期收益率、所述风险矩阵或所述因子暴露矩阵设定个股投资组合权重的目标函数,通过所述日频风险矩阵或所述因子暴露矩阵设定个股投资组合权重的约束条件,构建所述个股投资组合权重的最优化问题。3.如权利要求1所述的方法,其特征在于,基于个股多个信息维度的历史数据确定影响个股收益率的有效因子及有效因子值,包括:获取所述个股多个信息维度的历史数据;所述多个信息维度的历史数据包括所述个股的行情数据、宏观数据、财务数据、成交数据、研报舆情数据和机构评级预测数据;根据所述历史数据的特点和需求,对所述历史数据进行数据清洗和处理,得到符合第一预设标准的历史数据;基于符合所述第一预设标准的历史数据确定选定的多维度因子的因子值;对所述因子值序列进行预处理,得到符合第二预设标准的第二因子值序列;对所述第二因子值序列进行有效性检验,根据检验结果确定与所述个股收益率有线性关系的因子,并作为所述有效因子。4.如权利要求3所述的方法,其特征在于,所述多维度因子包括估值因子、成长因子、动量因子和MACD指标;基于符合所述第一预设标准的历史数据确定选定的多维度因子的因子值,包括:根据符合所述第一预设标准的历史数据中,所述个股的净利润与总市值的比值确定所述估值因子的值;根据符合所述第一预设标准的历史数据中,所述个股的净利润的同比增长率确定所述成长因子的值;根据符合所述第一预设标准的历史数据中,所述个股的过去指定时间段的价格收益率确定所述动量因子的值;根据符合所述第一预设标准的历史数据中,所述个股价格的长短期移动平均线之间的
差值确定所述MACD指标的值。5.如权利要求3所述的方法,其特征在于,对所述因子值序列进行预处理,得到符合第二预设标准的第二因子值序列,包括:获取所述因子值序列中单一日期截面的因子序列的第一均值和第一标准差;去除大于所述第一均值与指定数值之和,或小于所述第一均值与所述指定数值之差的因子值;使用所述因子值序列的中位数填充去除后的缺失位,得到填充后的因子值序列;获取所述填充后的因子值序列的第二均值和第二标准差,得到填充后的因子值序列;将所述填充后的因子值序列减去所述第二均值后,再除以所述第二标准差后的因子值序列,作为所述第二因子值序列。6.如权利要求3所述的方法,其特征在于,对所述第二因子值序列进行有效性检验,根据检验结果确定与所述个股收益率有线性关系的因子,并作为所述有效因子,包括:将所述第二因子值序列按数值大小从大到小进行排序,得到排序结果,并将所述个股分为预设数量个分组;在每个预设周期截止后,根据所述排序结果调整各个所述分组中所述个股的持仓权重,并记录各个所述分组的收益情况;检验各个所述分组的收益情况与所述第二因子值序列之间是否存在线性关系;将存在所述线性关系的所述第二因子值序列对应的因子作为所述有效因子。7.如权利要求1所述的方法,其特征在于,利用预先训练的深度学习模型,基于所述有效因子及所述有效因子值预测所述个股的预期收益率,包括:根据所述有效因子、所述有效因子值及个股样本数量构建二维结构数据,通过预先训练的第一深度学...
【专利技术属性】
技术研发人员:吴明晖,张承炘,陈吉喆,袁佳丽,刘智,李昊,
申请(专利权)人:人保信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。