DNA存储编译码方法、装置、电子设备及存储介质制造方法及图纸

技术编号：44532057 阅读：6 留言：0更新日期：2025-03-07 13:21

本发明专利技术涉及编译码技术领域，揭露一种DNA存储编译码方法、装置、电子设备及存储介质，该方法包括：对待编码数据进行信息填充，得到目标二进制序列；对目标二进制序列进行编码、映射，得到DNA碱基序列；根据DNA碱基序列识别待编码数据的编码错误模式；根据编码错误模式选取对应的译码算法对DNA碱基序列进行译码，得到译码数据。通过本发明专利技术的实施，对待编码数据进行数据转换及信息填充，可以使得待编码数据的长度满足极化码的长度要求；识别DNA碱基序列对应的编码错误模式进行译码，可以通过不同的编码错误模式可以有效地提高译码的准确度，实现对待编码数据的无损编译。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及编译码，尤其涉及一种dna存储编译码方法、装置、电子设备及存储介质。

技术介绍

1、随着信息量呈指数级增长，新型数据存储技术的研发成为各行各业的关注焦点。脱氧核糖核酸(dna)分子作为信息的承载体，相较传统存储介质，具备多项优势。其高存储密度、潜在的低维护成本以及其他突出特点，使其成为信息存储的理想选择。dna存储涉及将数据通过dna编码算法转换为dna分子链中不同碱基的序列信息，并储存在相应的存储载体中。当需要时，可通过特定的dna解码算法进行读取，重新生成原始数据。

2、dna编码在dna存储中扮演着关键的角色，其目标是以尽可能少的碱基序列来无误地存储数据信息。dna编码的质量直接影响存储性能和数据读写的完整性。在dna存储信息的过程中，包括dna编码、合成、存储以及dna测序、解码，都存在潜在的错误风险，可能导致信息损失。为了最大程度地保证信息的无误读取，在dna存储过程中引入相应的纠错机制，以提高存储的准确性，利用dna存储(barcode)库来识别集合群体中标记的单个生物分子，已经成为当前大规模并行生物医学实验中的重要工具。然而，在barcode的合成、实验过程以及最终的测序中，可能会出现错误，例如核苷酸替换、插入和删除等意外情况。因此，为了从混乱(错误)版本的存储中恢复原始的码字，研究者们希望利用纠错码的技术，而无需将每个可能的错误读取与库中的每个已知码字逐一比较。这样的纠错码机制可以提高存储识别的准确性，使得恢复原始码字成为可能。

3、rs(reed-solomon)码是目前在

4、rs码采用的是一种多项式编码的方法，通过在原始数据中添加一些冗余信息来实现错误的检测和纠正，其基本原理是将数据看作是一个多项式，并对该多项式进行编码。编码过程中，通过使用离散数学中的有限域运算，将数据多项式转换为一组纠错码字。纠错码字包含了原始数据和一些额外的冗余信息。在接收端，通过对接收到的数据进行解码和纠正操作，可以恢复原始的数据。为了实现较高的纠错能力，rs码引入了较多的冗余信息，这导致了数据存储或传输的开销增加，较高的冗余度会占用更多的存储空间，rs码的编码和解码过程相对复杂，需要进行多项式运算和有限域的操作，这对于实现高效的编码和解码算法提出了一定的挑战，尤其是在资源受限的环境下，导致编码以及解码的效率及准确度较差。

技术实现思路

1、本专利技术提供一种dna存储编译码方法、装置、电子设备及存储介质，其主要目的在于解决相关技术中提供的dna存储编译码方式的准确性较差的问题。

2、为实现上述目的，本专利技术提供的一种dna存储编译码方法，包括：获取待编码数据，对待编码数据进行信息填充，得到目标二进制序列；对目标二进制序列进行编码、映射，得到待编码数据对应的dna碱基序列；根据dna碱基序列识别待编码数据的编码错误模式；根据编码错误模式选取对应的译码算法对dna碱基序列进行译码，得到译码数据。

3、本专利技术还提供一种dna存储编译码装置，包括：信息填充模块，用于获取待编码数据，对待编码数据进行信息填充，得到目标二进制序列；编码映射模块，用于对目标二进制序列进行编码、映射，得到待编码数据对应的dna碱基序列；编码错误模式识别模块，用于根据dna碱基序列识别待编码数据的编码错误模式；dna碱基序列译码模块，用于根据编码错误模式选取对应的译码算法对dna碱基序列进行译码，得到译码数据。

4、本专利技术还提供一种电子设备，包括：与至少一个处理器通信连接的存储器；其中，处理器用于执行存储在存储器上的计算机程序；存储器存储有可被至少一个处理器执行的计算机程序，计算机程序被至少一个处理器执行，以使至少一个处理器能够执行上述的一种dna存储编译码方法。

5、本专利技术还提供一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时，实现上述任意一项的dna存储编译码方法。

6、本专利技术实施例通过对待编码数据进行信息填充，可以使得待编码数据的长度满足极化码的长度要求，进而实现自适应长度的dna存储设计，有利于提高后续编码的效率及精确度；对目标二进制序列进行编码、映射，可以得到编码后的dna碱基序列；识别dna碱基序列对应的编码错误模式进行译码，可以在译码时通过其中一个出错的比特的位置可以确定另一个出错的比特的位置，进一步减小了译码的复杂度，同时可以通过不同的编码错误模式可以有效地提高译码的准确度，实现对待编码数据的无损编译。因此本专利技术提出的一种dna存储编译码方法、装置、电子设备及存储介质，可以解决dna存储编译码的准确性较差的问题，同时实现任意长度的dna存储编码。

本文档来自技高网...

【技术保护点】

1.一种DNA存储编译码方法，其特征在于，所述方法包括：

2.如权利要求1所述的一种DNA存储编译码方法，其特征在于，所述对所述待编码数据进行信息填充，得到目标二进制序列，包括：

3.如权利要求2所述的一种DNA存储编译码方法，其特征在于，所述利用预设的冻结比特信息对所述二进制序列进行信息填充，得到目标二进制序列，包括：

4.如权利要求1所述的一种DNA存储编译码方法，其特征在于，所述对所述目标二进制序列进行编码、映射，得到所述待编码数据对应的DNA碱基序列，包括：

5.如权利要求4所述的一种DNA存储编译码方法，其特征在于，所述计算所述目标二进制序列对应的极化码生成矩阵，包括：

6.如权利要求5所述的一种DNA存储编译码方法，其特征在于，所述根据所述置换矩阵及所述数据码长生成极化码生成矩阵，包括：

7.如权利要求1所述的一种DNA存储编译码方法，其特征在于，所述根据所述DNA碱基序列识别所述待编码数据的编码错误模式，包括：

8.一种DNA存储编译码装置，其特征在于，所述装置包括：

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现权利要求1至7中任意一项所述的DNA存储编译码方法。

...

【技术特征摘要】

1.一种dna存储编译码方法，其特征在于，所述方法包括：

2.如权利要求1所述的一种dna存储编译码方法，其特征在于，所述对所述待编码数据进行信息填充，得到目标二进制序列，包括：

3.如权利要求2所述的一种dna存储编译码方法，其特征在于，所述利用预设的冻结比特信息对所述二进制序列进行信息填充，得到目标二进制序列，包括：

4.如权利要求1所述的一种dna存储编译码方法，其特征在于，所述对所述目标二进制序列进行编码、映射，得到所述待编码数据对应的dna碱基序列，包括：

5.如权利要求4所述的一种dna存储编译码方法，其特征在于，所述计算所述目标二进...

【专利技术属性】
技术研发人员：刘凌，林瑞浩，李金升，朱泽轩，陈毓新，张勇，李胜康，
申请(专利权)人：深圳大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人