基于半监督学习的潜在相似证券投资推荐的方法及系统技术方案

技术编号：31237247 阅读：13 留言：0更新日期：2021-12-08 10:21

本发明专利技术公开了基于半监督学习的潜在相似证券投资推荐的方法及系统，该方法包括：获取证券数据样本集，并对所述证券数据样本集中的样本数据进行预处理；基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练；根据多轮学习迭代训练结果，获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力；利用概率密度函数表达获取所述证券数据样本集的数值分布，并综合所述数值分布和所述特征决策力，得到每一子模型对同一样本数据不同的特征解释结果；对所有的所述特征解释结果进行排序，并根据排序结果输出对应样本数据的证券投资推荐理由。本发明专利技术可提高证券投资准确度，为用户提供具有投资标的的证券投资建议。资标的的证券投资建议。资标的的证券投资建议。

全部详细技术资料下载

【技术实现步骤摘要】
基于半监督学习的潜在相似证券投资推荐的方法及系统

[0001]本专利技术涉及计算机信息处理
，特别涉及基于半监督学习的潜在相似证券投资推荐的方法及系统。

技术介绍

[0002]金融投资领域，随着投顾业务的兴起和公募基金的市场规模扩张，受限于合规监管的分散投资要求，证券可投池中的交易容量无法满足短时间扩增的可投资资金。同时，有限的证券调研人力无法快速补充可投池标的，需要通过算法根据现有可投池标的进行扩增，这会极大地增加人力成本，当工作量较大时，无法保证足够的推荐准确率，并且效率比较一般。因此，如何实现证券投资推荐自动化和智能化，以提高证券投资推荐的精度和效率是本领域技术人员需要解决的问题。

技术实现思路

[0003]本专利技术实施例提供了基于半监督学习的潜在相似证券投资推荐的方法及系统，旨在提高证券投资准确度和效率，为用户提供具有投资标的的证券投资。
[0004]第一方面，本专利技术实施例提供了一种基于半监督学习的潜在相似证券投资推荐的方法，包括：
[0005]获取证券数据样本集，并对所述证券数据样本集中的样本数据进行预处理；
[0006]基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练；
[0007]根据多轮学习迭代训练结果，获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力；
[0008]利用概率密度函数表达获取所述证券数据样本集的数值分布，并综合所述数值分布和所述特征决策力，得到每一子模型对同一样本数据不同的...

【技术保护点】

【技术特征摘要】
1.一种基于半监督学习的潜在相似证券投资推荐的方法，其特征在于，包括：获取证券数据样本集，并对所述证券数据样本集中的样本数据进行预处理；基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练；根据多轮学习迭代训练结果，获取得到每一所述有监督集成模型下属的多个子模型各自对应的特征决策力；利用概率密度函数表达获取所述证券数据样本集的数值分布，并综合所述数值分布和所述特征决策力，得到每一子模型对同一样本数据不同的特征解释结果；对所有的所述特征解释结果进行排序，并根据排序结果输出对应样本数据的证券投资推荐理由，以此构建证券推荐模型，然后利用所述证券推荐模型对指定证券进行推荐处理。2.根据权利要求1所述的基于半监督学习的潜在相似证券投资推荐的方法，其特征在于，所述证券数据样本集中的样本数据包括技术面数据、基本面数据以及非结构数据；所述获取证券数据样本集，并对所述证券数据样本集中的样本数据进行预处理，包括：基于奈奎斯特极限约束，利用不同滑窗对所述技术面数据进行跨频滚动采样，并基于采样结果构建错频样本；对所述基本面数据进行周期对齐，并利用线性插值算法对所述基本面数据进行数据升频；按照数据业务含义对所述证券数据样本集的非结构数据进行周期前填、聚合、删除中的一种或者多种处理；根据周期末端法对所述技术面数据、基本面数据和非结构数据进行数据对齐，并按照时间轴和实体轴的全外连接法进行数据合并，得到基于时间、实体和特征的三维数据集；获取所述证券数据样本集对应的历史买入卖出操作的标记数据集；对所述三维数据集进行多重共线性分析，以及对所述三维数据集和标记数据集进行非线性特异性分析，并通过反向特征消除法进行降维压缩，以完成对所述证券数据样本集的预处理。3.根据权利要求1所述的基于半监督学习的潜在相似证券投资推荐的方法，其特征在于，所述基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练之前，包括：通过强制拟合约束对每一所述有监督集成模型分别进行结构性拟合，使每一所述有监督集成模型分别对所述证券数据样本集进行独立表达。4.根据权利要求1所述的基于半监督学习的潜在相似证券投资推荐的方法，其特征在于，所述基于多个不同的有监督集成模型对经过预处理的证券数据样本集进行多轮学习迭代训练，包括：利用每一所述有监督集成模型分别对所述证券数据样本集中的样本数据进行独立表达；基于独立表达结果，按照少数服从多数的原则进行投票，以判断是否对样本数据进行标注，并得到已标注样本数据和未标注样本数据；对所述已标注样本数据和未标注样本数据继续进行下一轮学习迭代训练，数轮迭代后，当每轮样本标注的标签变动数量维持在预设水平不再继续收敛后，结束迭代，并以迭代
结束前一轮数投票结果的均值表达争议样本。5.根据权利要求4所述的基于半监督学习的潜在相似证券投资推荐的方法，其特征在于，所述根据多轮学习迭代训练结果，获取得到每一所述有监督集成模型下属的多个子模...

【专利技术属性】
技术研发人员：牛志遥，龙湘君，杨骏逸，
申请(专利权)人：南方基金管理股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人