System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据,具体涉及一种类别识别方法及装置、规则库构建方法及装置、电子设备。
技术介绍
1、大数据技术是一种对规模庞大的数据进行处理的技术,其含盖了数据筛选、数据分析、数据挖掘等各方面。随着人工智能在各方面应用的快速发展,与人工智能相辅相成的大数据技术也逐渐趋于成熟。类别识别是人工智能的主要应用方向之一,目前,通常是利用降维技术对训练数据进行处理,将训练数据的维数降至固定维数,然后再对该固定维数的训练数据进行扰动及挖掘,找到规则序列以构建规则库。在需要进行类别识别时,对规则库进行检索及匹配,得到识别结果。目前构建规则库及类别识别的方式,存在数据泄露的风险,数据安全性较差。
技术实现思路
1、本申请实施例公开了一种类别识别方法及装置、规则库构建方法及装置、电子设备、存储介质,能够提高数据安全性,降低数据泄露的风险。
2、本申请实施例公开一种类别识别方法,包括:
3、根据待查询数据及规则库对应的字典,生成查询向量;所述规则库包括一个或多个加密的规则序列,每个所述规则序列包括类别标签及至少一个数据特征标签,所述字典包括所述规则库内的各个类别标签及各个数据特征标签;
4、根据所述查询向量及所述规则库对应的搜索密钥生成陷门;
5、根据所述陷门及各个所述规则序列对应的索引,确定目标规则序列;其中,第一规则序列对应的索引是根据所述第一规则序列及所述搜索密钥生成的,所述第一规则序列为任一所述规则序列;
6、对所述目标规则序列的密文进
7、本申请实施例公开一种类别识别装置,所述装置包括:
8、查询向量生成模块,用于根据待查询数据及规则库对应的字典,生成查询向量;所述规则库包括一个或多个加密的规则序列,每个所述规则序列包括类别标签及至少一个数据特征标签,所述字典包括所述规则库内的各个类别标签及各个数据特征标签;
9、陷门生成模块,用于根据所述查询向量及所述规则库对应的搜索密钥生成陷门;
10、检索模块,用于根据所述陷门及各个所述规则序列对应的索引,确定目标规则序列;其中,第一规则序列对应的索引是根据所述第一规则序列及所述搜索密钥生成的,所述第一规则序列为任一所述规则序列;
11、解密模块,用于对所述目标规则序列的密文进行解密,以得到所述目标规则序列包含的目标类别标签,并根据所述目标类别标签确定所述待查询数据对应的目标类别。
12、本申请实施例公开一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如上所述的类别识别方法。
13、本申请实施例公开一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的类别识别方法。
14、本申请实施例公开一种规则库构建方法,包括:
15、对样本数据集进行预处理,得到第一序列集合,所述第一序列集合包括m个数值格式的样本序列,每个所述样本序列包括类别标签及至少一个数据特征标签;所述m为正整数;
16、对所述第一序列集合进行扰动,得到第二序列集合;
17、对所述第二序列集合进行频繁挖掘,以确定一个或多个规则序列;
18、根据所述一个或多个规则序列构建规则库,并对所述规则库中包含的所述一个或多个规则序列进行加密。
19、本申请实施例公开一种规则库构建装置,所述装置包括:
20、预处理模块,用于对样本数据集进行预处理,得到第一序列集合,所述第一序列集合包括m个数值格式的样本序列,每个所述样本序列包括类别标签及至少一个数据特征标签;所述m为正整数;
21、扰动模块,用于对所述第一序列集合进行扰动,得到第二序列集合;
22、挖掘模块,用于对所述第二序列集合进行频繁挖掘,以确定一个或多个规则序列;
23、构建模块,用于根据所述一个或多个规则序列构建规则库,并对所述规则库中包含的所述一个或多个规则序列进行加密。
24、本申请实施例公开一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如上所述的规则库构建方法。
25、本申请实施例公开一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的规则库构建方法。
26、本申请实施例公开了一种类别识别方法及装置、电子设备、存储介质,根据待查询数据及规则库对应的字典,生成查询向量;规则库包括一个或多个加密的规则序列,每个规则序列包括类别标签及至少一个数据特征标签,字典包括规则库内的各个类别标签及各个数据特征标签;根据查询向量及规则库对应的搜索密钥生成陷门;根据陷门及各个规则序列对应的索引,确定目标规则序列;对目标规则序列的密文进行解密,以得到目标规则序列包含的目标类别标签,并根据目标类别标签确定所述待查询数据对应的目标类别。在本申请实施例中,利用规则库的字典生成查询向量,根据利用搜索密钥生成的陷门及各个规则序列对应的索引,在规则库中进行搜索,找到与查询向量匹配的目标规则向量,采用可搜索加密技术实现对加密的规则库进行搜索与匹配,在不影响识别精度的情况下,实现对规则库的安全检索与匹配,避免规则库出现数据泄露的情况,提高了数据安全,降低数据泄露的风险。
27、本申请实施例公开了一种规则库构建方法及装置、电子设备、存储介质,对样本数据集进行预处理,得到第一序列集合,对第一序列集合进行扰动,得到第二序列集合,再对第二序列集合进行频繁挖掘,以确定一个或多个规则序列,然后根据该一个或多个规则序列构建规则库,并对规则库中包含的一个或多个规则序列进行加密。在本申请实施例中,将样本数据集转化为数值格式的第一序列集合,并对第一序列集合进行扰动,实现了对数据的隐私增强,且对构建的规则库进行加密,提高了数据安全,降低数据泄露的风险。
本文档来自技高网...【技术保护点】
1.一种类别识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述待查询数据包括设备状态数据,所述设备状态数据包括时间信息、位置信息、电池状态信息、外接设备的设备信息、网络连接信息中的一种或多种;
3.根据权利要求1所述的方法,其特征在于,在所述根据待查询数据及规则库对应的字典,生成查询向量之前,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述根据待查询数据及规则库对应的字典,生成查询向量,包括:
5.根据权利要求3所述的方法,其特征在于,所述第一规则序列对应的索引是根据所述第一规则序列的标识向量及所述搜索密钥生成的;
6.根据权利要求1所述的方法,其特征在于,所述搜索密钥包括可逆对角矩阵及所述可逆对角矩阵的逆矩阵;所述可逆对角矩阵的阶数与所述字典的字典长度相同;所述第一规则序列对应的索引是根据所述第一规则序列及所述可逆对角矩阵的转置矩阵生成的;
7.根据权利要求1所述的方法,其特征在于,所述根据所述陷门及各个所述规则序列对应的索引,确定目标规则序列,包括:
9.根据权利要求8所述的方法,其特征在于,所述样本数据集包括X条数据元,所述X为正整数;每条所述数据元包括类别数据项及至少一个特征数据项;所述对样本数据集进行预处理,得到第一序列集合,包括:
10.根据权利要求8所述的方法,其特征在于,所述对所述第一序列集合进行扰动,包括:
11.根据权利要求10所述的方法,其特征在于,所述根据每个样本序列的序列长度,确定所述每个样本序列对应的扰动概率,包括:
12.根据权利要求11所述的方法,其特征在于,所述基于指数基制,根据所述各个第一样本序列对应的扰动分数确定所述各个第一样本序列对应的扰动概率,包括:
13.根据权利要求10所述的方法,其特征在于,所述基于所述每个样本序列对应的扰动概率,随机从所述第一序列集合中选择目标数量的样本序列进行扰动,包括:
14.根据权利要求13所述的方法,其特征在于,所述对所述待扰动样本序列进行扰动,包括:
15.根据权利要求8所述的方法,其特征在于,所述对所述第二序列集合进行频繁挖掘,以确定一个或多个规则序列,包括:
16.根据权利要求15所述的方法,其特征在于,所述对支持度阈值添加阈值噪声,得到扰动阈值,包括:
17.根据权利要求15所述的方法,其特征在于,所述类别标签排列在样本序列的最末端;所述获取与第二类别标签对应的至少一个支持度集合,包括:
18.根据权利要求16所述的方法,其特征在于,所述对所述至少一个支持度集合进行扰动,包括:
19.一种规则库构建方法,其特征在于,包括:
20.根据权利要求19所述的方法,其特征在于,所述样本数据集包括至少X条数据元,所述X为正整数;每个所述数据元包括类别数据项及至少一个特征数据项;所述对样本数据集进行预处理,得到第一序列集合,包括:
21.根据权利要求19所述的方法,其特征在于,所述对所述第一序列集合进行扰动,包括:
22.根据权利要求21所述的方法,其特征在于,所述根据每个样本序列的序列长度,确定所述每个样本序列对应的扰动概率,包括:
23.根据权利要求19所述的方法,其特征在于,所述对所述第二序列集合进行频繁挖掘,以确定一个或多个规则序列,包括:
24.根据权利要求23所述的方法,其特征在于,所述对所述至少一个支持度集合进行扰动,包括:
25.根据权利要求19~24任一项所述的方法,其特征在于,所述方法还包括:
26.根据权利要求25所述的方法,其特征在于,所述生成所述规则库对应的字典,包括:
27.根据权利要求26所述的方法,其特征在于,所述根据所述规则库中包含的各个规则序列及所述搜索密钥,生成所述各个规则序列对应的索引,包括:
28.一种类别识别装置,其特征在于,所述装置包括:
29.一种规则库构建装置,其特征在于,所述装置包括:
30.一种电子设备,其特征在于,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如权利要求1~18或19~27任一项所述的方法。
31.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所...
【技术特征摘要】
1.一种类别识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述待查询数据包括设备状态数据,所述设备状态数据包括时间信息、位置信息、电池状态信息、外接设备的设备信息、网络连接信息中的一种或多种;
3.根据权利要求1所述的方法,其特征在于,在所述根据待查询数据及规则库对应的字典,生成查询向量之前,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述根据待查询数据及规则库对应的字典,生成查询向量,包括:
5.根据权利要求3所述的方法,其特征在于,所述第一规则序列对应的索引是根据所述第一规则序列的标识向量及所述搜索密钥生成的;
6.根据权利要求1所述的方法,其特征在于,所述搜索密钥包括可逆对角矩阵及所述可逆对角矩阵的逆矩阵;所述可逆对角矩阵的阶数与所述字典的字典长度相同;所述第一规则序列对应的索引是根据所述第一规则序列及所述可逆对角矩阵的转置矩阵生成的;
7.根据权利要求1所述的方法,其特征在于,所述根据所述陷门及各个所述规则序列对应的索引,确定目标规则序列,包括:
8.根据权利要求1~7任一项所述的方法,其特征在于,所述类别标签及数据特征标签的标签格式包括数值格式;在所述根据待查询数据及规则库对应的字典,生成查询向量之前,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述样本数据集包括x条数据元,所述x为正整数;每条所述数据元包括类别数据项及至少一个特征数据项;所述对样本数据集进行预处理,得到第一序列集合,包括:
10.根据权利要求8所述的方法,其特征在于,所述对所述第一序列集合进行扰动,包括:
11.根据权利要求10所述的方法,其特征在于,所述根据每个样本序列的序列长度,确定所述每个样本序列对应的扰动概率,包括:
12.根据权利要求11所述的方法,其特征在于,所述基于指数基制,根据所述各个第一样本序列对应的扰动分数确定所述各个第一样本序列对应的扰动概率,包括:
13.根据权利要求10所述的方法,其特征在于,所述基于所述每个样本序列对应的扰动概率,随机从所述第一序列集合中选择目标数量的样本序列进行扰动,包括:
14.根据权利要求13所述的方法,其特征在于,所述对所述待扰动样本序列进行扰动,包括:
...【专利技术属性】
技术研发人员:杨明慧,王蒙,潘蓝兰,黄海平,史振奇,常舒予,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。