基于DNA-Base128的DNA图像存储方法及系统技术方案

技术编号：43944640 阅读：24 留言：0更新日期：2025-01-07 21:34

本发明专利技术公开了一种基于DNA‑Base128的DNA图像存储方法及系统，涉及DNA存储技术领域；首先要将图像信息转换为二进制数据，对二进制数据进行分割和概率统计。其次构建DNA‑Base128编码表，通过贪心算法列举出所有满足生化约束的均衡码。根据易错相邻碱基出现的概率筛选并排序出前127位均衡码。然后根据数据块的概率统计和DNA‑Base128编码表进行动态映射。最后，当图像需要恢复时，DNA‑Base128通过阈值设置和漂移比较完成内部纠错。本发明专利技术利用DNA‑Base128编码表的限制、漂移比对和阈值，能实现错误类型的判断以及概率矫正。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及dna存储，具体涉及基于dna-base128的dna图像存储方法及系统。

技术介绍

1、国际数据公司报告称，数据将在2025年达到175pb，到2040年达到1.9×109pb，提供一种新的存储介质显得尤为紧迫。dna作为大多数生物体遗传信息的载体，与传统的存储介质相比，它具有存储密度高、存储寿命长等优点，因此dna成为了未来最有潜力的存储介质。dna存储主要涉及五个主要过程：编码，合成，保存，测序和解码。编码是dna存储的最重要步骤，合理有效的编码可以提高编码密度，降低测序错误的概率。2017年，erlich等人将喷泉码应用于dna编码。通过排除或操作，种子之间的编码序列满足gc含量和均聚物限制，净编码密度达到了1.57bits/nt。另外，除了使用喷泉码减少错误外，zhang等人通过引入平衡码，满足了gc含量和均聚物限制并提供了一定的内部检错功能。当前的存储方案提高了存储的密度和质量，但没有考虑图像数据的特点，在处理图像数据时存在序列稳定性和图像重建效果不足等问题。

技术实现思路

1、本专利技术的目的在于，提出基于dna-base128的dna图像存储方法及系统，其编码序列满足常见生化约束和局部gc含量，降低了易错相邻碱基含量，实现了图像的高质量重建。

2、根据本公开实施例的第一个方面，提供了基于dna-base128的dna图像存储方法，包括以下步骤：

3、采用无损方式存储图像数据，且将图像数据转为像素值形式，在将其转为二进制数据；p>

4、将所述二进制数据17位为一组进行分割，每组的前10位为奇数据块，后7位为偶数据块，统计偶数据块出现的频率；

5、构建dna-base128编码表；

6、根据偶数据块出现的次数与dna-base128编码表进行动态映射，将映射后的均衡码与奇数据块交叉组合，根据碱基映射规则进行编码；

7、在解码时将十位碱基化为一组，根据碱基映射规则进行解码，解码后的数据根据奇偶位置划分为奇数据块和偶数据块，然后判断偶数据块是否发生错误及错误类型，其错误类型包括替换错误和移位错误，所述移位错误分为插入错误类型和删除错误类型；

8、当偶数据块发生替换错误时，利用偶数据块为均衡数据块，得到替换的具体类型b，即发生0-1或者1-0的替换，针对偶数据块的不同特征进行纠错；

9、当偶数据块发生移位错误时，偶数据块针对移位错误的具体错误类型和数据块特征进行矫正，奇数据根据偶数据发生错误的位置进行插入或者删除操作；

10、对所有偶数据块进行判断和矫正，完成图像数据解码。

11、进一步地，构建dna-base128编码表方式为：首先通过贪心算法筛选出所有满足生化约束的10位平衡码，然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码，如下所示：

12、 1 1001100101 33 11001101 65 1001010110 97 1100011010 2 1001100110 34 11001011 66 111010010 98 1000100111 3 110011001 35 10011011 67 110101001 99 110101100 4 1100110010 36 1110010010 68 110010101 100 11101100 5 1100100110 37 1101001100 69 101110010 101 11011100 6 110010011 38 1001101010 70 101010011 102 11010110 7 100110011 39 111001100 71 100110101 103 1011000110 8 1101001001 40 101011001 72 100101110 104 1010011100 9 1011001001 41 100100111 73 11101001 105 1010010110 10 1010011001 42 1110100100 本文档来自技高网...

【技术保护点】

1.基于DNA-Base128的DNA图像存储方法，其特征在于，包括以下步骤：

2.根据权利要求1所述基于DNA-Base128的DNA图像存储方法，其特征在于，构建DNA-Base128编码表方式为：首先通过贪心算法筛选出所有满足生化约束的10位平衡码，然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码。

3.根据权利要求1所述基于DNA-Base128的DNA图像存储方法，其特征在于，所述碱基映射规则为00-A，01-T，10-C，11-G。

4.根据权利要求1所述基于DNA-Base128的DNA图像存储方法，其特征在于，判断偶数据块是否发生错误及错误类型的具体方式为：如果当前奇数据块不存在均衡码表中或在编码时没有出现，则判断偶数据块发生替换错误，否则偶数据块未发生错误；向下遍历偶数据块的个数满足设置阈值时，则判断偶数据块发生替换错误，否则为移位错误；当判断为移位错误后，如果偶数据块向左漂移且向下遍历偶数据块的个数满足设置阈值时，则发生了插入错误，否则为删除错误。

5.根据权利要求1所述基于DNA-Base128的D

6.根据权利要求1所述基于DNA-Base128的DNA图像存储方法，其特征在于，偶数据块针对移位错误的具体错误类型和数据块特征进行矫正，具体为：

7.根据权利要求1所述基于DNA-Base128的DNA图像存储方法，其特征在于，所述生化约束为GC含量限制在40％到60％之间，均聚物不大于4。

8.根据权利要求1所述基于DNA-Base128的DNA图像存储方法，其特征在于，易错相邻碱基指的是组合在一起容易发生错误的三碱基，包括“GAC,”“CAC,”“GTC,”“GTG,”“GCG,”“CGC,”“TCT,”“ACT,”“AGA,”“ATA,”“TAT,”和“TGC”。

9.基于DNA-Base128的DNA图像存储系统，其特征在于，包括：

...

【技术特征摘要】

1.基于dna-base128的dna图像存储方法，其特征在于，包括以下步骤：

2.根据权利要求1所述基于dna-base128的dna图像存储方法，其特征在于，构建dna-base128编码表方式为：首先通过贪心算法筛选出所有满足生化约束的10位平衡码，然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码。

3.根据权利要求1所述基于dna-base128的dna图像存储方法，其特征在于，所述碱基映射规则为00-a，01-t，10-c，11-g。

4.根据权利要求1所述基于dna-base128的dna图像存储方法，其特征在于，判断偶数据块是否发生错误及错误类型的具体方式为：如果当前奇数据块不存在均衡码表中或在编码时没有出现，则判断偶数据块发生替换错误，否则偶数据块未发生错误；向下遍历偶数据块的个数满足设置阈值时，则判断偶数据块发生替换错误，否则为移位错误；当判断为移位错误后，如果偶数据块向左漂移且向下遍历偶数据块的个数满足设置...

【专利技术属性】
技术研发人员：王宾，王坤，周士华，吕卉，满惠子，蒋伟，
申请(专利权)人：大连大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人