基于半监督学习的潜在相似证券投资推荐的方法及系统技术方案

技术编号:31237247 阅读:13 留言:0更新日期:2021-12-08 10:21
本发明专利技术公开了基于半监督学习的潜在相似证券投资推荐的方法及系统,该方法包括:获取证券数据样本集,并对所述证券数据样本集中的样本数据进行预处理;基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练;根据多轮学习迭代训练结果,获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力;利用概率密度函数表达获取所述证券数据样本集的数值分布,并综合所述数值分布和所述特征决策力,得到每一子模型对同一样本数据不同的特征解释结果;对所有的所述特征解释结果进行排序,并根据排序结果输出对应样本数据的证券投资推荐理由。本发明专利技术可提高证券投资准确度,为用户提供具有投资标的的证券投资建议。资标的的证券投资建议。资标的的证券投资建议。

【技术实现步骤摘要】
基于半监督学习的潜在相似证券投资推荐的方法及系统


[0001]本专利技术涉及计算机信息处理
,特别涉及基于半监督学习的潜在相似证券投资推荐的方法及系统。

技术介绍

[0002]金融投资领域,随着投顾业务的兴起和公募基金的市场规模扩张,受限于合规监管的分散投资要求,证券可投池中的交易容量无法满足短时间扩增的可投资资金。同时,有限的证券调研人力无法快速补充可投池标的,需要通过算法根据现有可投池标的进行扩增,这会极大地增加人力成本,当工作量较大时,无法保证足够的推荐准确率,并且效率比较一般。因此,如何实现证券投资推荐自动化和智能化,以提高证券投资推荐的精度和效率是本领域技术人员需要解决的问题。

技术实现思路

[0003]本专利技术实施例提供了基于半监督学习的潜在相似证券投资推荐的方法及系统,旨在提高证券投资准确度和效率,为用户提供具有投资标的的证券投资。
[0004]第一方面,本专利技术实施例提供了一种基于半监督学习的潜在相似证券投资推荐的方法,包括:
[0005]获取证券数据样本集,并对所述证券数据样本集中的样本数据进行预处理;
[0006]基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练;
[0007]根据多轮学习迭代训练结果,获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力;
[0008]利用概率密度函数表达获取所述证券数据样本集的数值分布,并综合所述数值分布和所述特征决策力,得到每一子模型对同一样本数据不同的特征解释结果;
[0009]对所有的所述特征解释结果进行排序,并根据排序结果输出对应样本数据的证券投资推荐理由,以此构建证券推荐模型,然后利用所述证券推荐模型对指定证券进行推荐处理。
[0010]第二方面,本专利技术实施例提供了一种基于半监督学习的潜在相似证券投资推荐的装置,包括:
[0011]数据预处理单元,用于获取证券数据样本集,并对所述证券数据样本集中的样本数据进行预处理;
[0012]迭代训练单元,用于基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练;
[0013]第一获取单元,用于根据多轮学习迭代训练结果,获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力;
[0014]第二获取单元,用于利用概率密度函数表达获取所述证券数据样本集的数值分
布,并综合所述数值分布和所述特征决策力,得到每一子模型对同一样本数据不同的特征解释结果;
[0015]排序输出单元,用于对所有的所述特征解释结果进行排序,并根据排序结果输出对应样本数据的证券投资推荐理由,以此构建证券推荐模型,然后利用所述证券推荐模型对指定证券进行推荐处理。
[0016]第三方面,本专利技术实施例提供了一种分布式计算机单点及集群化部署装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于半监督学习的潜在相似证券投资推荐的方法,并能够支持单机计算、多机并行计算,实现如第一方面所述的基于半监督学习的潜在相似证券投资推荐的方法。
[0017]第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于半监督学习的潜在相似证券投资推荐的方法。
[0018]本专利技术实施例提供了一种基于半监督学习的潜在相似证券投资推荐的方法及系统,该方法包括:获取证券数据样本集,并对所述证券数据样本集中的样本数据进行预处理;基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练;根据多轮学习迭代训练结果,获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力;利用概率密度函数表达获取所述证券数据样本集的数值分布,并综合所述数值分布和所述特征决策力,得到每一子模型对同一样本数据不同的特征解释结果;对所有的所述特征解释结果进行排序,并根据排序结果输出对应样本数据的证券投资推荐理由,以此构建证券推荐模型,然后利用所述证券推荐模型对指定证券进行推荐处理。本专利技术实施例通过对证券数据的基本面数据、技术面数据的分析进行建模,然后基于机器学习算法自动化地从全市场公开证券中寻找类似的可投资标的,以为用户提供更加准确的证券投资建议。
附图说明
[0019]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的方法的流程示意图;
[0021]图2为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的方法中步骤S101的子流程示意图;
[0022]图3为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的方法中步骤S102的子流程示意图;
[0023]图4为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的方法中步骤S103的子流程示意图;
[0024]图5为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的方法中步骤S104的子流程示意图;
[0025]图6为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的装置的示意性框图;
[0026]图7为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的装置中数据预处理单元的子示意性框图;
[0027]图8为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的装置中迭代训练单元的子示意性框图;
[0028]图9为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的装置中第一获取单元的子示意性框图;
[0029]图10为本专利技术实施例提供的一种基于半监督学习的潜在相似证券投资推荐的装置中第二获取单元的子示意性框图。
具体实施方式
[0030]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0032]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于半监督学习的潜在相似证券投资推荐的方法,其特征在于,包括:获取证券数据样本集,并对所述证券数据样本集中的样本数据进行预处理;基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练;根据多轮学习迭代训练结果,获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力;利用概率密度函数表达获取所述证券数据样本集的数值分布,并综合所述数值分布和所述特征决策力,得到每一子模型对同一样本数据不同的特征解释结果;对所有的所述特征解释结果进行排序,并根据排序结果输出对应样本数据的证券投资推荐理由,以此构建证券推荐模型,然后利用所述证券推荐模型对指定证券进行推荐处理。2.根据权利要求1所述的基于半监督学习的潜在相似证券投资推荐的方法,其特征在于,所述证券数据样本集中的样本数据包括技术面数据、基本面数据以及非结构数据;所述获取证券数据样本集,并对所述证券数据样本集中的样本数据进行预处理,包括:基于奈奎斯特极限约束,利用不同滑窗对所述技术面数据进行跨频滚动采样,并基于采样结果构建错频样本;对所述基本面数据进行周期对齐,并利用线性插值算法对所述基本面数据进行数据升频;按照数据业务含义对所述证券数据样本集的非结构数据进行周期前填、聚合、删除中的一种或者多种处理;根据周期末端法对所述技术面数据、基本面数据和非结构数据进行数据对齐,并按照时间轴和实体轴的全外连接法进行数据合并,得到基于时间、实体和特征的三维数据集;获取所述证券数据样本集对应的历史买入卖出操作的标记数据集;对所述三维数据集进行多重共线性分析,以及对所述三维数据集和标记数据集进行非线性特异性分析,并通过反向特征消除法进行降维压缩,以完成对所述证券数据样本集的预处理。3.根据权利要求1所述的基于半监督学习的潜在相似证券投资推荐的方法,其特征在于,所述基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练之前,包括:通过强制拟合约束对每一所述有监督集成模型分别进行结构性拟合,使每一所述有监督集成模型分别对所述证券数据样本集进行独立表达。4.根据权利要求1所述的基于半监督学习的潜在相似证券投资推荐的方法,其特征在于,所述基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练,包括:利用每一所述有监督集成模型分别对所述证券数据样本集中的样本数据进行独立表达;基于独立表达结果,按照少数服从多数的原则进行投票,以判断是否对样本数据进行标注,并得到已标注样本数据和未标注样本数据;对所述已标注样本数据和未标注样本数据继续进行下一轮学习迭代训练,数轮迭代后,当每轮样本标注的标签变动数量维持在预设水平不再继续收敛后,结束迭代,并以迭代
结束前一轮数投票结果的均值表达争议样本。5.根据权利要求4所述的基于半监督学习的潜在相似证券投资推荐的方法,其特征在于,所述根据多轮学习迭代训练结果,获取得到每一所述有监督集成模型下属的多个子模...

【专利技术属性】
技术研发人员:牛志遥龙湘君杨骏逸
申请(专利权)人:南方基金管理股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1