System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机网络,尤其涉及一种内积矩阵的检索方法、装置、计算机设备及可读存储介质。
技术介绍
1、缺失数据是指在数据库或者数据集中,未被记录或已经丢失的数据。设备故障、网络延迟或信息遗漏,都可能造成数据的缺失。缺失数据的产生增加了内积矩阵计算的不确定性,进而影响了对内积矩阵进行的检索精确性,因此,需要对缺失数据进行补全。
2、相关技术中,一般直接依赖已有的数据来计算内积矩阵,或者通过建立概率模型来分析缺失机制和数据的分布特征,从而推断缺失值,进而计算内积矩阵。但是,前者计算得到的内积矩阵精确度低,后者可能由于数据分布和缺失推断机制与实际不相符,且概率模型运行时间过长,导致对内积矩阵进行推断的效率和精确程度均较低,进而导致对内积矩阵进行检索的效率和精确度较低。
技术实现思路
1、本申请实施例的主要目的在于提出一种内积矩阵的检索方法、装置、计算机设备及可读存储介质,能够通过提高对内积矩阵进行推断的效率和准确性,提高对内积矩阵的检索的效率和精确性。
2、为实现上述目的,本申请实施例的第一方面提出了一种内积矩阵的检索方法,所述方法包括:
3、获取目标数据集,并从所述目标数据集中确定存在缺失值的多个缺失向量;
4、通过计算任意两个所述缺失向量的内积,得到所述目标数据集对应的缺失内积矩阵;其中,任意两个所述缺失向量的维度相同;
5、从所述目标数据集中确定与所述缺失内积矩阵相同维度的完整内积矩阵,并基于所述缺失内积矩阵和所述完整内积
6、基于所述第一目标特征值对所述缺失内积矩阵进行校正,得到目标内积矩阵;
7、按照目标检索指标在所述目标内积矩阵中检索相应的矩阵元素,得到所述目标检索指标对应的检索结果。
8、相应的,本申请实施例的第二方面提出了一种内积矩阵的检索装置,所述装置包括:
9、获取模块,用于获取目标数据集,并从所述目标数据集中确定存在缺失值的多个缺失向量;
10、计算模块,用于通过计算任意两个所述缺失向量的内积,得到所述目标数据集对应的缺失内积矩阵;其中,任意两个所述缺失向量的维度相同;
11、提取模块,用于从所述目标数据集中确定与所述缺失内积矩阵相同维度的完整内积矩阵,并基于所述缺失内积矩阵和所述完整内积矩阵的特征值分布,从所述完整内积矩阵中提取第一目标特征值;
12、校正模块,用于基于所述第一目标特征值对所述缺失内积矩阵进行校正,得到目标内积矩阵;
13、检索模块,用于按照目标检索指标在所述目标内积矩阵中检索相应的矩阵元素,得到所述目标检索指标对应的检索结果。
14、在一些实施方式中,所述提取模块,还用于:
15、对所述缺失内积矩阵进行特征值分解,得到所述缺失内积矩阵的缺失对角矩阵;
16、基于所述缺失对角矩阵的特征值分布,确定第二目标特征值;
17、对所述完整内积矩阵进行特征值分解,得到所述完整内积矩阵的完整对角矩阵;
18、基于所述第二目标特征值在所述缺失对角矩阵的分布位置,从所述完整对角矩阵中确定第一目标特征值;其中,所述第一目标特征值与所述第二目标特征值的数量之和等于所述缺失对角矩阵的特征值的数量。
19、在一些实施方式中,所述提取模块,还用于:
20、基于所述缺失对角矩阵的特征值分布,确定第一特征值集合和第二特征值集合;其中,所述第一特征值集合的特征值大于所述第二特征值集合的特征值;
21、将所述第一特征值集合中的特征值作为第二目标特征值。
22、在一些实施方式中,所述校正模块,还用于:
23、对所述缺失内积矩阵进行特征分解,得到所述缺失内积矩阵的缺失正交矩阵、缺失对角矩阵和所述缺失正交矩阵的转置矩阵;
24、根据所述第一目标特征值对所述缺失对角矩阵进行校正,得到目标缺失对角矩阵;
25、基于所述缺失正交矩阵、所述目标缺失对角矩阵和所述缺失正交矩阵的转置矩阵的乘积,得到目标内积矩阵。
26、在一些实施方式中,所述缺失向量包括第一缺失向量和第二缺失向量,所述计算模块,还用于:
27、确定所述第一缺失向量和所述第二缺失向量中同时具有非缺失值的目标维度;
28、基于所述目标维度,从所述第一缺失向量中提取第一子向量,从所述第二缺失向量中提取第二子向量,基于确定所述第一子向量和所述第二子向量的内积,得到所述第一缺失向量和所述第二缺失向量的内积。
29、在一些实施方式中,所述目标检索指标为最大内积检索指标;所述检索模块,还用于:
30、获取第一目标检索对象;
31、按照最大内积检索指标,计算所述第一目标检索对象分别与所述目标内积矩阵的各矩阵元素的内积,得到第一内积;
32、从多个所述第一内积中确定具有最大内积的第一矩阵元素;
33、将所述第一矩阵元素作为所述目标检索指标对应的检索结果。
34、在一些实施方式中,所述目标检索指标为最近邻检索指标;所述检索模块,还用于:
35、获取第二目标检索对象;
36、按照最近邻检索指标,计算所述第二目标检索对象分别与所述目标内积矩阵中各矩阵元素的内积距离;
37、从多个所述内积距离中确定最小的内积距离对应的第二矩阵元素,并将所述第二矩阵元素作为所述目标检索指标对应的检索结果。
38、相应的,本申请第三方面实施例提出了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请第一方面实施例任一项所述的内积矩阵的检索方法。
39、相应的,本申请第四方面实施例提出了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本申请第一方面实施例任一项所述的内积矩阵的检索方法。
40、本申请实施例通过获取目标数据集,并从目标数据集中确定存在缺失值的多个缺失向量;通过计算任意两个缺失向量的内积,得到目标数据集对应的缺失内积矩阵;其中,任意两个缺失向量的维度相同;从目标数据集中确定与缺失内积矩阵相同维度的完整内积矩阵,并基于缺失内积矩阵和完整内积矩阵的特征值分布,从完整内积矩阵中提取第一目标特征值;基于第一目标特征值对缺失内积矩阵进行校正,得到目标内积矩阵;按照目标检索指标在目标内积矩阵中检索相应的矩阵元素,得到目标检索指标对应的检索结果。以此,能够基于完整内积矩阵的第一目标特征值对缺失内积矩阵进行高效、准确地校正,得到校正后的目标内积矩阵,进而能够基于完整地目标内积矩阵进行检索,提高了对目标内积矩阵的检索的效率和精确性。
本文档来自技高网...【技术保护点】
1.一种内积矩阵的检索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述基于所述缺失内积矩阵和所述完整内积矩阵的特征值分布,从所述完整内积矩阵中提取第一目标特征值,包括:
3.根据权利要求2所述的内积矩阵的检索方法,其特征在于,所述基于所述缺失对角矩阵的特征值分布,确定第二目标特征值,包括:
4.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述基于所述第一目标特征值对所述缺失内积矩阵进行校正,得到目标内积矩阵,包括:
5.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述缺失向量包括第一缺失向量和第二缺失向量,所述计算任意两个所述缺失向量的内积,包括:
6.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述目标检索指标为最大内积检索指标;所述按照目标检索指标在所述目标内积矩阵中检索相应的矩阵元素,得到所述目标检索指标对应的检索结果,包括:
7.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述目标检索指标为最近邻检索指标;所述按照目标检索指
8.一种内积矩阵的检索装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的内积矩阵的检索方法。
10.一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的内积矩阵的检索方法。
...【技术特征摘要】
1.一种内积矩阵的检索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述基于所述缺失内积矩阵和所述完整内积矩阵的特征值分布,从所述完整内积矩阵中提取第一目标特征值,包括:
3.根据权利要求2所述的内积矩阵的检索方法,其特征在于,所述基于所述缺失对角矩阵的特征值分布,确定第二目标特征值,包括:
4.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述基于所述第一目标特征值对所述缺失内积矩阵进行校正,得到目标内积矩阵,包括:
5.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述缺失向量包括第一缺失向量和第二缺失向量,所述计算任意两个所述缺失向量的内积,包括:
6.根据权利要求1所述的内积矩阵的检索方法,其特征在于,所述目标检索指标...
【专利技术属性】
技术研发人员:余方晨,曾奕程,
申请(专利权)人:深圳市大数据研究院福田分院深圳国际工业与应用数学中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。