一种基于云服务的存储方法和装置制造方法及图纸

技术编号:35430586 阅读:13 留言:0更新日期:2022-11-03 11:35
本发明专利技术提供了一种基于云服务的存储方法和装置,其中包括:通过第一文件找取相似的第二文件,利用第二文件对第一文件进行加密,并将加密后的密文上传至第二云服务端。本发明专利技术的有益效果:实现了对重要文件的云服务加密存储,利用两个云服务端来实现对数据的共同加密,加密过程简单高效,加密的可靠性得到了提高。高。高。

【技术实现步骤摘要】
一种基于云服务的存储方法和装置


[0001]本专利技术涉及云服务
,特别涉及一种基于云服务的存储方法和装置。

技术介绍

[0002]云服务是基于互联网的相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。越来越多的企业为了降低存储成本都会选用云端进行存储,但是云存储的安全事件不断的发生,医疗、政府、金融、科技等行业都曾发生过数据泄露事件,造成重大经济损失和不良社会影响。目前,对于一些数据,主要是通过各种各样的加密方式进行存储,简单的加密方式非常容易被破解,从而导致信息会流失,而复杂的加密信息则在加密过程和解密过程会比较麻烦,导致计算资源损耗较大,不利于推广,因此,现有的云服务的加密存储方法不能解决大众的存储重要文件(例如合同,保险订单等),亟需一种云服务的加密存储方法。

技术实现思路

[0003]本专利技术的主要目的为提供一种基于云服务的存储方法和装置,旨在解决现有的云服务加密存储技术不能解决大众的存储重要文件的问题。
[0004]本专利技术提供了一种基于云服务的存储方法,包括:获取待存储的第一文件;利用预设的文本相似度算法从第一云服务端找出与所述第一文件相近的第二文件;对所述第二文件中的语句进行词汇、短语以及单个字符的提取,并基于各个元素在所述第二文件中的位置进行标注,得到第一数据集;所述元素为词汇、短语以及单个字符中的任意一种;对所述第一文件进行短语的识别,得到多个暂时短语,并判断各个所述暂时短语是否属于所述第一数据集,将属于所述第一数据集中的暂时短语记为目标短语进行提取,得到目标短语集,并对所述第一文件中的目标短语进行遮盖处理,得到遮盖后的第三文件;对所述第三文件进行词汇的识别,得到多个暂时词汇,并判断各个所述暂时词汇是否属于所述第一数据集,将属于所述第一数据集中的暂时词汇记为目标词汇进行提取,得到目标词汇集,并对所述第三文件中的目标词汇进行遮盖处理,得到遮盖后的第四文件;对所述第四文件进行单个字符的提取,并判断是否属于所述第一数据集,将属于所述第一数据集中的字符记为目标字符进行提取,得到第一字符集,并将不属于所述第一数据集中的字符记为暂时字符进行提取,得到第二字符集;根据所述目标短语集、所述目标词汇集以及所述第一字符集中的元素按照所述第一数据集中的标注进行编码,以及对所述第二字符集中的元素按照预设的汉字编码器进行编码,并基于所述第一文件的顺序对编码后的代码进行排序,得到第一代码;将所述第一代码按照预设的加密算法进行加密,得到第二代码,将所述第二代码
上传至第二云服务端进行存储。
[0005]进一步地,所述利用预设的文本相似度算法从第一云服务端找出与所述第一文件相近的第二文件的步骤,包括:对所述第一文件进行词汇、短语以及单个字符的提取并去重,得到第二数据集,其中,所述第二数据集中包括三个级别的元素,第一级别为单个字符,第二级别为词汇,第三个级别为短语;设置所述第一文件中第一级别的权重,根据公式设置第二级别的权重以及第三级别的权重;其中,t=1或2,表示与t相关的预设参数,表示第t个级别的预设参数;根据预设的文本相似度算法计算与多个对比文件的相似度值,其中,表示第二数据集中的第i个元素,n表示第二数据集中元素的个数总和,表示对比文件中对应的数量,表示对应级别的权重,I表示第一文件,R表示对比文件,表示相似度值;根据所述相似度值的大小,选取相似度值最大的对比文件作为所述第二文件。
[0006]进一步地,所述将所述第一代码按照预设的加密算法进行加密,得到第二代码的步骤,包括:根据所述第一代码的规模生成对应维数的可逆矩阵;从预设的密钥集中筛选出与所述可逆矩阵维数相同的密钥矩阵;通过所述密钥矩阵对所述可逆矩阵进行矩阵运算得到加密矩阵;其中,加密运算公式为:M=P
·
A,M为加密矩阵,P为可逆矩阵,A为密钥矩阵。
[0007]进一步地,所述对所述第一文件进行短语的识别,得到多个暂时短语,并判断各个所述暂时短语是否属于所述第一数据集,将属于所述第一数据集中的暂时短语记为目标短语进行提取,得到目标短语集,并对所述第一文件中的目标短语进行遮盖处理,得到遮盖后的第三文件的步骤之前,还包括:从预设的数据库中读取隐私词汇集;根据预设的查询函数和所述隐私词汇集查询所述第一文件中的目标隐私词汇;采用预设的非隐私词汇替换所述第一文件中的目标隐私词汇,得到替换后的第一文件用于执行对所述第一文件进行短语的识别,得到多个暂时短语,并判断各个所述暂时短语是否属于所述第一数据集,将属于所述第一数据集中的暂时短语记为目标短语进行提取,得到目标短语集,并对所述第一文件中的目标短语进行遮盖处理,得到遮盖后的第三文件的步骤;建立非隐私词汇与所述目标隐私词汇的对应表并上传至第三云服务端。
[0008]进一步地,所述将所述第一代码按照预设的加密算法进行加密,得到第二代码,将所述第二代码上传至第二云服务端进行存储的步骤之后,还包括:判断是否接收到发起方获取所述第一文件的获取指令;
若接收到所述获取指令,则通过第一云服务端的第一验证方法向所述发起方进行第一次认证;若第一次认证通过,则将所述第二文件发送给所述发起方;基于所述第二文件触发所述第二云服务端的第二次认证;若所述第二次认证通过,则将所述第二代码发送给所述发起方;基于所述第二代码和所述第二文件执行解码指令,得到所述第一文件。
[0009]本专利技术还提供了一种基于云服务的存储装置,包括:获取模块,用于获取待存储的第一文件;寻找模块,用于利用预设的文本相似度算法从第一云服务端找出与所述第一文件相近的第二文件;提取模块,用于对所述第二文件中的语句进行词汇、短语以及单个字符的提取,并基于各个元素在所述第二文件中的位置进行标注,得到第一数据集;所述元素为词汇、短语以及单个字符中的任意一种;短语识别模块,用于对所述第一文件进行短语的识别,得到多个暂时短语,并判断各个所述暂时短语是否属于所述第一数据集,将属于所述第一数据集中的暂时短语记为目标短语进行提取,得到目标短语集,并对所述第一文件中的目标短语进行遮盖处理,得到遮盖后的第三文件;词汇识别模块,用于对所述第三文件进行词汇的识别,得到多个暂时词汇,并判断各个所述暂时词汇是否属于所述第一数据集,将属于所述第一数据集中的暂时词汇记为目标词汇进行提取,得到目标词汇集,并对所述第三文件中的目标词汇进行遮盖处理,得到遮盖后的第四文件;字符提取模块,用于对所述第四文件进行单个字符的提取,并判断是否属于所述第一数据集,将属于所述第一数据集中的字符记为目标字符进行提取,得到第一字符集,并将不属于所述第一数据集中的字符记为暂时字符进行提取,得到第二字符集;编码模块,用于根据所述目标短语集、所述目标词汇集以及所述第一字符集中的元素按照所述第一数据集中的标注进行编码,以及对所述第二字符集中的元素按照预设的汉字编码器进行编码,并基于所述第一文件的顺序对编码后的代码进行排序,得到第一代码;加密模块,用于将所述第一代码按照预设的加密算法进行加密,得到第二代码,将所述第二代码上传至第二云服务端进行存储。
...

【技术保护点】

【技术特征摘要】
1.一种基于云服务的存储方法,其特征在于,包括:获取待存储的第一文件;利用预设的文本相似度算法从第一云服务端找出与所述第一文件相近的第二文件;对所述第二文件中的语句进行词汇、短语以及单个字符的提取,并基于各个元素在所述第二文件中的位置进行标注,得到第一数据集;所述元素为词汇、短语以及单个字符中的任意一种;对所述第一文件进行短语的识别,得到多个暂时短语,并判断各个所述暂时短语是否属于所述第一数据集,将属于所述第一数据集中的暂时短语记为目标短语进行提取,得到目标短语集,并对所述第一文件中的目标短语进行遮盖处理,得到遮盖后的第三文件;对所述第三文件进行词汇的识别,得到多个暂时词汇,并判断各个所述暂时词汇是否属于所述第一数据集,将属于所述第一数据集中的暂时词汇记为目标词汇进行提取,得到目标词汇集,并对所述第三文件中的目标词汇进行遮盖处理,得到遮盖后的第四文件;对所述第四文件进行单个字符的提取,并判断是否属于所述第一数据集,将属于所述第一数据集中的字符记为目标字符进行提取,得到第一字符集,并将不属于所述第一数据集中的字符记为暂时字符进行提取,得到第二字符集;根据所述目标短语集、所述目标词汇集以及所述第一字符集中的元素按照所述第一数据集中的标注进行编码,以及对所述第二字符集中的元素按照预设的汉字编码器进行编码,并基于所述第一文件的顺序对编码后的代码进行排序,得到第一代码;将所述第一代码按照预设的加密算法进行加密,得到第二代码,将所述第二代码上传至第二云服务端进行存储。2.如权利要求1所述的基于云服务的存储方法,其特征在于,所述利用预设的文本相似度算法从第一云服务端找出与所述第一文件相近的第二文件的步骤,包括:对所述第一文件进行词汇、短语以及单个字符的提取并去重,得到第二数据集,其中,所述第二数据集中包括三个级别的元素,第一级别为单个字符,第二级别为词汇,第三个级别为短语;设置所述第一文件中第一级别的权重,根据公式设置第二级别的权重以及第三级别的权重;其中,t=1或2,表示与t相关的预设参数,表示第t个级别的预设参数;根据预设的文本相似度算法计算与多个对比文件的相似度值,其中,表示第二数据集中的第i个元素,n表示第二数据集中元素的个数总和,表示对比文件中对应的数量,表示对应级别的权重,I表示第一文件,R表示对比文件,表示相似度值;根据所述相似度值的大小,选取相似度值最大的对比文件作为所述第二文件。3.如权利要求1所述的基于云服务的存储方法,其特征在于,所述将所述第一代码按照预设的加密算法进行加密,得到第二代码的步骤,包括:
根据所述第一代码的规模生成对应维数的可逆矩阵;从预设的密钥集中筛选出与所述可逆矩阵维数相同的密钥矩阵;通过所述密钥矩阵对所述可逆矩阵进行矩阵运算得到加密矩阵;其中,加密运算公式为:M=P
·
A,M为加密矩阵,P为可逆矩阵,A为密钥矩阵。4.如权利要求1所述的基于云服务的存储方法,其特征在于,所述对所述第一文件进行短语的识别,得到多个暂时短语,并判断各个所述暂时短语是否属于所述第一数据集,将属于所述第一数据集中的暂时短语记为目标短语进行提取,得到目标短语集,并对所述第一文件中的目标短语进行遮盖处理,得到遮盖后的第三文件的步骤之前,还包括:从预设的数据库中读取隐私词汇集;根据预设的查询函数和所述隐私词汇集查询所述第一文件中的目标隐私词汇;采用预设的非隐私词汇替换所述第一文件中的目标隐私词汇,得到替换后的第一文件用于执行对所述第一文件进行短语的识别,得到多个暂时短语,并判断各个所述暂时短语是否属于所述第一数据集,将属于所述第一数据集中的暂时短语记为目标短语进行提取,得到目标短语集,并对所述第一文件中的目标短语进行遮盖处理,得到遮盖后的第三文件的步骤;建立非隐私词汇与所述目标隐私词汇的对应表并上传至第三云服务端。5.如权利要求1所述的基于云服务的存储方法,其特征在于,所述将所述第一代码按照预设的加密算法进行加密,得到第二代码,将所述第二代码上传至第二云服务端进行存储的步骤之后,还包括:判断是否接收到发起方获取所述第一文件的获取指令;若接收到所述获取指令,则通过第一云服务端的第一验证方法向所述发起方进行第一次认证;若第一次认证通过,则将所述第二文件发送给所述发起方;基于所述第二文件触发所述第二云服务端的第二次认证;若所述第二次认证通过,则将所述第二代码发送给所述发起方;基于所述第二代码和所述第二文件执行解码指令,得到所述第一文件。...

【专利技术属性】
技术研发人员:童娜
申请(专利权)人:武汉烜旭软件科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1