一种数据处理方法、装置及电子设备制造方法及图纸

技术编号:33290706 阅读:30 留言:0更新日期:2022-05-01 00:08
本申请公开了一种数据处理方法、装置及电子设备,方法包括:获得资产对象集合,资产对象集合中包含有多个资产对象,资产对象具有对象数据,资产对象以对象向量表示,对象向量中包含多个向量元素,向量元素具有初始元素值;根据资产对象的对象数据,获得资产对象集合对应的对象相似矩阵,对象相似矩阵的矩阵元素为资产对象集合中任意两个资产对象之间的初始相似度;根据对象相似矩阵中的矩阵元素,对资产对象的对象向量中的向量元素的初始元素值进行处理,以得到资产对象的对象向量中的经过优化的向量元素,对象向量中的向量元素用于获得其所属资产对象与其他资产对象之间的资产相似度。似度。似度。

【技术实现步骤摘要】
一种数据处理方法、装置及电子设备


[0001]本申请涉及数据
,尤其涉及一种数据处理方法、装置及电子设备。

技术介绍

[0002]在金融领域中,任一股票、基金、指数等均可以称为资产,每个资产均对应有日收益率序列数据。为了分析资产之间的关系,需要对资产的数据进行量化,才能计算和分析各个资产之间的相似度,实现对资产的聚类,以便于对相似资产进行后续的分析和策略研究。
[0003]目前,通常以资产的日收益率序列数据表示资产,进而通过计算资产之间在日收益率序列上的相关系数,来获得资产之间的相似度。
[0004]但是,由于资产的日收益率序列本身具有随机性,可能存在日收益率缺失的情况,导致所获得到的相关系数具有较大的噪音,使得获得资产相似度的准确性较低。

技术实现思路

[0005]有鉴于此,本申请提供一种数据处理方法、装置及电子设备,用以解决现有技术所获得的资产相似度的准确性较低的技术问题。如下:
[0006]一种数据处理方法,所述方法包括:
[0007]获得资产对象集合,所述资产对象集合中包含有多个资产对象,所述资产对象具有对象数据,所述资产对象以对象向量表示,所述对象向量中包含多个向量元素,所述向量元素具有初始元素值;
[0008]根据所述资产对象的对象数据,获得所述资产对象集合对应的对象相似矩阵,所述对象相似矩阵的矩阵元素为所述资产对象集合中任意两个所述资产对象之间的初始相似度;
[0009]根据所述对象相似矩阵中的矩阵元素,对所述资产对象的对象向量中的向量元素的初始元素值进行处理,以得到所述资产对象的对象向量中的经过优化的向量元素,所述对象向量中的向量元素用于获得其所属资产对象与其他资产对象之间的资产相似度。
[0010]上述方法,优选的,根据所述对象相似矩阵中的矩阵元素,对所述资产对象的对象向量中的向量元素的初始元素值进行处理,以得到所述资产对象的对象向量中的经过优化的向量元素,包括:
[0011]以所述对象相似矩阵中的矩阵元素中的初始相似度作为相似度误差函数的输入,利用所述相似度误差函数,对所述资产对象的对象向量中的向量元素的初始元素值进行优化处理,以得到所述资产对象的对象向量中的经过优化的向量元素;
[0012]其中,所述相似度误差函数至少以所述资产对象集合中的所有任意两个所述资产对象之间的相似度误差的和表示,其中,所述相似度误差函数中的所述资产对象之间的相似度误差至少以相应所述资产对象的对象向量之间的向量距离和相应所述资产对象之间的初始相似度表示。
[0013]上述方法,优选的,以所述对象相似矩阵中的矩阵元素中的初始相似度作为相似
度误差函数的输入,利用所述相似度误差函数,对所述资产对象的对象向量中的向量元素的初始元素值进行优化处理,包括:
[0014]以所述对象相似矩阵中的矩阵元素中的初始相似度作为相似度误差函数的输入,获得所述相似度误差函数针对所述资产对象的对象向量中的向量元素的初始元素值的第一输出函数值;
[0015]根据所述第一输出函数值,对所述资产对象的对象向量中的向量元素的初始元素值进行调整;
[0016]以所述对象相似矩阵中的矩阵元素中的初始相似度作为所述相似度误差函数的输入,获得所述相似度误差函数针对所述资产对象的对象向量中的向量元素的经过调整后的元素值的第二输出函数值;
[0017]至少根据所述第二输出函数值,对所述资产对象的对象向量中的向量元素的经过调整后的元素值进行调整,返回执行所述步骤:以所述对象相似矩阵中的矩阵元素中的初始相似度作为所述相似度误差函数的输入,获得所述相似度误差函数针对所述资产对象的对象向量中的向量元素的经过调整后的元素值的第二输出函数值,直到所述资产对象的对象向量中的向量元素经过调整后的元素值满足迭代收敛条件,以得到所述资产对象的对象向量中的经过优化的向量元素;
[0018]其中,所述迭代收敛条件为:所述资产对象的对象向量中的向量元素经过调整后的元素值的变化量小于或等于变化阈值。
[0019]上述方法,优选的,所述相似度误差函数中的两个所述资产对象之间的相似度误差中,两个所述资产对象之间的初始相似度经过取对数处理;
[0020]所述相似度误差函数中的两个所述资产对象之间的相似度误差还以两个所述资产对象的对象向量各自对应的向量偏置项表示,所述向量偏置项与对其对应的对象向量中的向量元素相关;
[0021]所述相似度误差函数中的两个所述资产对象之间的相似度误差经过平方处理;
[0022]所述相似度误差函数中的两个所述资产对象之间的相似度误差经过加权处理。
[0023]上述方法,优选的,所述对象数据包含多个日期对应的收益率数据;
[0024]其中,所述对象相似矩阵的矩阵元素通过以下方式获得:
[0025]获得所述矩阵元素对应的两个所述资产对象的对象数据在每个所述日期上的收益率差值;
[0026]至少根据每个所述日期上的收益率差值,获得所述矩阵元素对应的两个所述资产对象的之间的初始相似度。
[0027]上述方法,优选的,至少根据每个所述日期上的收益率差值,获得所述矩阵元素对应的两个所述资产对象的之间的初始相似度,包括:
[0028]对所述矩阵元素对应的两个所述资产对象的对象数据在每个所述日期上的收益率差值分别进行处理,以得到每个所述日期上对应的相似度分量;
[0029]对所述相似度分量按照所述日期进行累加,以得到所述矩阵元素对应的两个所述资产对象的之间的初始相似度。
[0030]上述方法,优选的,对所述矩阵元素对应的两个所述资产对象的对象数据在每个所述日期上的收益率差值分别进行处理,以得到每个所述日期上对应的相似度分量,包括:
[0031]分别获得所述矩阵元素对应的两个所述资产对象的对象数据在每个所述日期上的收益率差值的绝对值;
[0032]对所述收益率差值的绝对值分别进行处理,以得到每个所述日期上对应的相似度分量,且每个所述日期上对应的相似度分量为大于或等于0的数值。
[0033]上述方法,优选的,所述方法还包括:
[0034]获得所述资产对象集合中任意多个所述资产对象的对象向量中的向量元素;
[0035]根据所述任意多个所述资产对象的对象向量中的向量元素,获得所述任意多个所述资产对象的对象向量之间的余弦相似度;以所述余弦相似度作为所述任意多个所述资产对象之间的资产相似度。
[0036]一种数据处理装置,所述装置包括:
[0037]对象获得单元,用于获得资产对象集合,所述资产对象集合中包含有多个资产对象,所述资产对象具有对象数据,所述资产对象以对象向量表示,所述对象向量中包含多个向量元素,所述向量元素具有初始元素值;
[0038]矩阵获得单元,用于根据所述资产对象的对象数据,获得所述资产对象集合对应的对象相似矩阵,所述对象相似矩阵的矩阵元素为所述资产对象集合中任意两个所述资产对象之间的初始相似度;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获得资产对象集合,所述资产对象集合中包含有多个资产对象,所述资产对象具有对象数据,所述资产对象以对象向量表示,所述对象向量中包含多个向量元素,所述向量元素具有初始元素值;根据所述资产对象的对象数据,获得所述资产对象集合对应的对象相似矩阵,所述对象相似矩阵的矩阵元素为所述资产对象集合中任意两个所述资产对象之间的初始相似度;根据所述对象相似矩阵中的矩阵元素,对所述资产对象的对象向量中的向量元素的初始元素值进行处理,以得到所述资产对象的对象向量中的经过优化的向量元素,所述对象向量中的向量元素用于获得其所属资产对象与其他资产对象之间的资产相似度。2.根据权利要求1所述的方法,其特征在于,根据所述对象相似矩阵中的矩阵元素,对所述资产对象的对象向量中的向量元素的初始元素值进行处理,以得到所述资产对象的对象向量中的经过优化的向量元素,包括:以所述对象相似矩阵中的矩阵元素中的初始相似度作为相似度误差函数的输入,利用所述相似度误差函数,对所述资产对象的对象向量中的向量元素的初始元素值进行优化处理,以得到所述资产对象的对象向量中的经过优化的向量元素;其中,所述相似度误差函数至少以所述资产对象集合中的所有任意两个所述资产对象之间的相似度误差的和表示,其中,所述相似度误差函数中的所述资产对象之间的相似度误差至少以相应所述资产对象的对象向量之间的向量距离和相应所述资产对象之间的初始相似度表示。3.根据权利要求2所述的方法,其特征在于,以所述对象相似矩阵中的矩阵元素中的初始相似度作为相似度误差函数的输入,利用所述相似度误差函数,对所述资产对象的对象向量中的向量元素的初始元素值进行优化处理,包括:以所述对象相似矩阵中的矩阵元素中的初始相似度作为相似度误差函数的输入,获得所述相似度误差函数针对所述资产对象的对象向量中的向量元素的初始元素值的第一输出函数值;根据所述第一输出函数值,对所述资产对象的对象向量中的向量元素的初始元素值进行调整;以所述对象相似矩阵中的矩阵元素中的初始相似度作为所述相似度误差函数的输入,获得所述相似度误差函数针对所述资产对象的对象向量中的向量元素的经过调整后的元素值的第二输出函数值;至少根据所述第二输出函数值,对所述资产对象的对象向量中的向量元素的经过调整后的元素值进行调整,返回执行所述步骤:以所述对象相似矩阵中的矩阵元素中的初始相似度作为所述相似度误差函数的输入,获得所述相似度误差函数针对所述资产对象的对象向量中的向量元素的经过调整后的元素值的第二输出函数值,直到所述资产对象的对象向量中的向量元素经过调整后的元素值满足迭代收敛条件,以得到所述资产对象的对象向量中的经过优化的向量元素;其中,所述迭代收敛条件为:所述资产对象的对象向量中的向量元素经过调整后的元素值的变化量小于或等于变化阈值。4.根据权利要求2所述的方法,其特征在于,所述相似度误差函数中的两个所述资产对
象之间的相似度误差中,两个所述资产对象之间的初始相似度经过取对数处理;所述相似度误差函数中的两个所述资产对象之间的相似度误差还以两个所述资产对象的对象向量各自对应的向量偏置项表示,所述向量偏置项与对其对应的对象向量中的向量元素相关;所述相似度误差函数中的两个所述资产对象之间的相似度误差经过平方处理;所述相似...

【专利技术属性】
技术研发人员:夏雄尉
申请(专利权)人:华夏基金管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1