System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于DNA-Base128的DNA图像存储方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>大连大学专利>正文

基于DNA-Base128的DNA图像存储方法及系统技术方案

技术编号:43944640 阅读:1 留言:0更新日期:2025-01-07 21:34
本发明专利技术公开了一种基于DNA‑Base128的DNA图像存储方法及系统,涉及DNA存储技术领域;首先要将图像信息转换为二进制数据,对二进制数据进行分割和概率统计。其次构建DNA‑Base128编码表,通过贪心算法列举出所有满足生化约束的均衡码。根据易错相邻碱基出现的概率筛选并排序出前127位均衡码。然后根据数据块的概率统计和DNA‑Base128编码表进行动态映射。最后,当图像需要恢复时,DNA‑Base128通过阈值设置和漂移比较完成内部纠错。本发明专利技术利用DNA‑Base128编码表的限制、漂移比对和阈值,能实现错误类型的判断以及概率矫正。

【技术实现步骤摘要】

本专利技术涉及dna存储,具体涉及基于dna-base128的dna图像存储方法及系统。


技术介绍

1、国际数据公司报告称,数据将在2025年达到175pb,到2040年达到1.9×109pb,提供一种新的存储介质显得尤为紧迫。dna作为大多数生物体遗传信息的载体,与传统的存储介质相比,它具有存储密度高、存储寿命长等优点,因此dna成为了未来最有潜力的存储介质。dna存储主要涉及五个主要过程:编码,合成,保存,测序和解码。编码是dna存储的最重要步骤,合理有效的编码可以提高编码密度,降低测序错误的概率。2017年,erlich等人将喷泉码应用于dna编码。通过排除或操作,种子之间的编码序列满足gc含量和均聚物限制,净编码密度达到了1.57bits/nt。另外,除了使用喷泉码减少错误外,zhang等人通过引入平衡码,满足了gc含量和均聚物限制并提供了一定的内部检错功能。当前的存储方案提高了存储的密度和质量,但没有考虑图像数据的特点,在处理图像数据时存在序列稳定性和图像重建效果不足等问题。


技术实现思路

1、本专利技术的目的在于,提出基于dna-base128的dna图像存储方法及系统,其编码序列满足常见生化约束和局部gc含量,降低了易错相邻碱基含量,实现了图像的高质量重建。

2、根据本公开实施例的第一个方面,提供了基于dna-base128的dna图像存储方法,包括以下步骤:

3、采用无损方式存储图像数据,且将图像数据转为像素值形式,在将其转为二进制数据;p>

4、将所述二进制数据17位为一组进行分割,每组的前10位为奇数据块,后7位为偶数据块,统计偶数据块出现的频率;

5、构建dna-base128编码表;

6、根据偶数据块出现的次数与dna-base128编码表进行动态映射,将映射后的均衡码与奇数据块交叉组合,根据碱基映射规则进行编码;

7、在解码时将十位碱基化为一组,根据碱基映射规则进行解码,解码后的数据根据奇偶位置划分为奇数据块和偶数据块,然后判断偶数据块是否发生错误及错误类型,其错误类型包括替换错误和移位错误,所述移位错误分为插入错误类型和删除错误类型;

8、当偶数据块发生替换错误时,利用偶数据块为均衡数据块,得到替换的具体类型b,即发生0-1或者1-0的替换,针对偶数据块的不同特征进行纠错;

9、当偶数据块发生移位错误时,偶数据块针对移位错误的具体错误类型和数据块特征进行矫正,奇数据根据偶数据发生错误的位置进行插入或者删除操作;

10、对所有偶数据块进行判断和矫正,完成图像数据解码。

11、进一步地,构建dna-base128编码表方式为:首先通过贪心算法筛选出所有满足生化约束的10位平衡码,然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码,如下所示:

12、 1 1001100101 33 11001101 65 1001010110 97 1100011010 2 1001100110 34 11001011 66 111010010 98 1000100111 3 110011001 35 10011011 67 110101001 99 110101100 4 1100110010 36 1110010010 68 110010101 100 11101100 5 1100100110 37 1101001100 69 101110010 101 11011100 6 110010011 38 1001101010 70 101010011 102 11010110 7 100110011 39 111001100 71 100110101 103 1011000110 8 1101001001 40 101011001 72 100101110 104 1010011100 9 1011001001 41 100100111 73 11101001 105 1010010110 10 1010011001 42 1110100100 本文档来自技高网...

【技术保护点】

1.基于DNA-Base128的DNA图像存储方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,构建DNA-Base128编码表方式为:首先通过贪心算法筛选出所有满足生化约束的10位平衡码,然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码。

3.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,所述碱基映射规则为00-A,01-T,10-C,11-G。

4.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,判断偶数据块是否发生错误及错误类型的具体方式为:如果当前奇数据块不存在均衡码表中或在编码时没有出现,则判断偶数据块发生替换错误,否则偶数据块未发生错误;向下遍历偶数据块的个数满足设置阈值时,则判断偶数据块发生替换错误,否则为移位错误;当判断为移位错误后,如果偶数据块向左漂移且向下遍历偶数据块的个数满足设置阈值时,则发生了插入错误,否则为删除错误。

5.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,偶数据块的不同特征使用下式(1)-(4)表示:

6.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,偶数据块针对移位错误的具体错误类型和数据块特征进行矫正,具体为:

7.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,所述生化约束为GC含量限制在40%到60%之间,均聚物不大于4。

8.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,易错相邻碱基指的是组合在一起容易发生错误的三碱基,包括“GAC,”“CAC,”“GTC,”“GTG,”“GCG,”“CGC,”“TCT,”“ACT,”“AGA,”“ATA,”“TAT,”和“TGC”。

9.基于DNA-Base128的DNA图像存储系统,其特征在于,包括:

...

【技术特征摘要】

1.基于dna-base128的dna图像存储方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于dna-base128的dna图像存储方法,其特征在于,构建dna-base128编码表方式为:首先通过贪心算法筛选出所有满足生化约束的10位平衡码,然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码。

3.根据权利要求1所述基于dna-base128的dna图像存储方法,其特征在于,所述碱基映射规则为00-a,01-t,10-c,11-g。

4.根据权利要求1所述基于dna-base128的dna图像存储方法,其特征在于,判断偶数据块是否发生错误及错误类型的具体方式为:如果当前奇数据块不存在均衡码表中或在编码时没有出现,则判断偶数据块发生替换错误,否则偶数据块未发生错误;向下遍历偶数据块的个数满足设置阈值时,则判断偶数据块发生替换错误,否则为移位错误;当判断为移位错误后,如果偶数据块向左漂移且向下遍历偶数据块的个数满足设置...

【专利技术属性】
技术研发人员:王宾王坤周士华吕卉满惠子蒋伟
申请(专利权)人:大连大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1