System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及空间组学生信,尤其是涉及一种空间组学测序定位匹配方法及装置、空间组学测序设备及计算机可读存储介质。
技术介绍
1、转录(transcription)是遗传信息从dna流向rna的过程,即以双链dna中的一条链(模板链用于转录,编码链不用于转录)为模板,以a、u、c、g四种核糖核苷酸为原料,在rna聚合酶催化下合成rna的过程。作为蛋白质生物合成的第一步,进行转录时,一个基因会被读取并被复制为mrna,即特定的dna片段作为遗传信息模板,以依赖dna的rna聚合酶作为催化剂,通过碱基互补的原则合成前体mrna。mrna转录时,dna分子双链打开,在rna聚合酶的作用下,游离的四种核糖核苷酸按照碱基互补配对原则结合到dna单链上,并在rna聚合酶的作用下形成单链mrna分子,至此,转录完成。
2、传统的基因表达分析,如rna-seq能提供丰富的基因表达信息,但它通常需要将样本组织研磨成单个细胞或rna分子的混合物,从而后续测序获得的基因表达丢失了空间信息。空间转录组学(spatial transcriptomics),本文中统称空间组学,一门结合组织学和基因表达分析的交叉学科,是测量完整组织切片的mrna,将mrna的空间信息与形态学内容相结合,并绘制所有基因表达发生的位置,以获得生物完整的基因表达图谱,从而致力于在细胞层面上理解基因表达的空间异质性。
3、空间组学是通过在固定的组织切片上应用带有位置条码(barcode)的微阵列技术来保留和解析空间信息,从而允许研究者将测序获得的基因表达数据可以根
4、然而,两次测序过程中都可能发生错误,导致二次测序获得的位置条码匹配率低。错误可能源于测序过程中的基础错误、序列重复或条码设计缺陷等。目前行业内较为推广的对空间组学利用位置条码保留空间信息的技术,如10x genomics公司推出的是通过已预先定义好位置条码的白名单(whitelist),然后利用位置条码与白名单的对应以确定空间位置,这些白名单不需要每次实验时重新测序,可以避免一定测序错误,相应的位置条码有效比对率也会提升。而常用的利用位置条码与白名单比对的基因定量比对软件,如starsolo,它是基于star(spliced transcripts alignment to a reference)对rna-seq数据进行比对的工具,虽然它们的性能已经很好,但在处理空间组学的数据时,对位置条码往往是直接进行比对且匹配标准很严格,以减少错误匹配的可能性,即使引入白名单进行比对,也意味着一定比例的实际有效的位置条码可能会被错误地排除;尤其是针对具有更大长度的位置条码的比对场景,比对率低,大大降低了位置条码的有效率。
技术实现思路
1、为解决现有存在的技术问题,本申请提供一种比对率更高、能够提高位置条码的有效率的空间组学barcode定位方法及装置、计算机设备及计算机可读存储介质。
2、本申请实施例第一方面,提供一种空间组学的测序定位匹配方法,包括:
3、获取带有空间位置信息的第一位置条码;
4、针对每一所述第一位置条码,获取多个参考短序列,根据各所述参考短序列所在第一位置条码的序号和位置建立索引信息,构建所述第一位置条码的索引信息库;
5、获取二次测序获得的第二位置条码;
6、针对每一所述第二位置条码,获取多个待选短序列,将所述待选短序列与所述索引信息库进行比对确定匹配短序列,构建所述匹配短序列与所述第一位置条码的匹配信息库;
7、根据所述匹配信息库,确定所述第一位置条码的比对优先级;
8、针对每一所述第二位置条码,将其与所述第一位置条码按照所述比对优先级进行比对,确定与所述第二位置条码的编辑距离满足目标要求的候选第一位置条码,基于所述候选第一位置条码的所述空间位置信息计算空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码。
9、第二方面,还提供一种空间组学的测序定位匹配装置,包括:
10、获取模块,用于获取带有空间位置信息的第一位置条码;
11、索引建立模块,用于针对每一所述第一位置条码,获取多个参考短序列,根据各所述参考短序列所在第一位置条码的序号和位置建立索引信息,构建所述第一位置条码的索引信息库;
12、所述获取模块,还用于获取二次测序获得的第二位置条码;
13、匹配模块,用于针对每一所述第二位置条码,获取多个待选短序列,将所述待选短序列与所述索引信息库进行比对确定匹配短序列,构建所述匹配短序列与所述第一位置条码的匹配信息库;
14、优先级模块,用于根据所述匹配信息库,确定所述第一位置条码的比对优先级;
15、比对模块,用于针对每一所述第二位置条码,将其与所述第一位置条码按照所述比对优先级进行比对,确定与所述第二位置条码的编辑距离满足目标要求的候选第一位置条码,基于所述候选第一位置条码的所述空间位置信息计算空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码。
16、第三方面,提供一种空间组学测序设备,包括处理器及与所述处理器连接的存储器,所述存储器上存储有可被所述处理器执行的计算机程序,所述计算机程序被所述处理器执行时实现如本申请任一实施例所述的空间组学的测序定位匹配方法。
17、第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如本申请任一实施例所述的本申请任一实施例所述的空间组学的测序定位匹配方法。
18、上述实施例中,通过分别将第一位置条码拆分为多个参考短序列的形式构建索引信息库,将第二位置条码拆分为多个待选短序列,采用待选短序列与参考短序列进行比对来筛选确定匹配短序列,构建匹配短序列与第一位置条码的匹配信息库,以此获得能够与第二位置条码之间更大概率存在匹配关系的潜在第一位置条码的信息,确定第一位置条码的比对优先级。将第二位置条码与第一位置条码进行比对的过程中,可以按照第一位置条码的比对优先级来进行比对,可以提升比对效率;其次,可以更加精准地快速锁定编辑距离满足目标要求的第一位置条码作为候选,基于候选第一位置条码的空间位置信息计算相对空间距离,基于空间距离满足目标条件确定比对成功的第二位置条码,如此,结合比对优先级、编辑距离以及多条本文档来自技高网...
【技术保护点】
1.一种空间组学的测序定位匹配方法,其特征在于,包括:
2.如权利要求1所述的测序定位匹配方法,其特征在于,所述确定与所述第二位置条码的编辑距离满足目标要求的候选第一位置条码,基于所述候选第一位置条码的所述空间位置信息计算空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码,包括:
3.如权利要求2所述的测序定位匹配方法,其特征在于,所述以编辑距离最小对应的候选第一位置条码的空间位置信息为标准点,计算其它编辑距离对应的候选第一位置条码的空间位置信息与所述标准点之间的空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码,包括:
4.如权利要求3所述的测序定位匹配方法,其特征在于,所述判断编辑距离最小对应的候选第一位置条码是否唯一,包括:
5.如权利要求2所述的测序定位匹配方法,其特征在于,所述计算其它编辑距离对应的候选第一位置条码的空间位置信息与所述标准点之间的空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码包括:
6.如权利要求1所述的测序定位匹配方法,其特征在于,所述针对每一所述
7.如权利要求6所述的测序定位匹配方法,其特征在于,还包括:
8.如权利要求1所述的测序定位匹配方法,其特征在于,所述针对每一所述第一位置条码,获取多个参考短序列,根据各所述参考短序列所在第一位置条码的序号和位置建立索引信息,构建所述第一位置条码的索引信息库,包括:
9.如权利要求8所述的测序定位匹配方法,其特征在于,所述针对每一所述第一位置条码,采用滑动窗口在所述第一位置条码上依序滑动间隔地提取长度为K的参考短序列,包括:
10.如权利要求8所述的测序定位匹配方法,其特征在于,所述根据各所述参考短序列所在第一位置条码的序号和位置转换为哈希值,建立各所述参考短序列对应的索引信息,还包括:
11.如权利要求1所述的测序定位匹配方法,其特征在于,所述获取带有空间位置信息的第一位置条码,包括:
12.一种空间组学的测序定位匹配装置,其特征在于,包括:
13.一种空间组学测序设备,其特征在于,包括处理器及与所述处理器连接的存储器,所述存储器上存储有可被所述处理器执行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至11中任一项所述的空间组学的测序定位匹配方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至11中任一项所述的空间组学的测序定位匹配方法。
...【技术特征摘要】
1.一种空间组学的测序定位匹配方法,其特征在于,包括:
2.如权利要求1所述的测序定位匹配方法,其特征在于,所述确定与所述第二位置条码的编辑距离满足目标要求的候选第一位置条码,基于所述候选第一位置条码的所述空间位置信息计算空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码,包括:
3.如权利要求2所述的测序定位匹配方法,其特征在于,所述以编辑距离最小对应的候选第一位置条码的空间位置信息为标准点,计算其它编辑距离对应的候选第一位置条码的空间位置信息与所述标准点之间的空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码,包括:
4.如权利要求3所述的测序定位匹配方法,其特征在于,所述判断编辑距离最小对应的候选第一位置条码是否唯一,包括:
5.如权利要求2所述的测序定位匹配方法,其特征在于,所述计算其它编辑距离对应的候选第一位置条码的空间位置信息与所述标准点之间的空间距离,基于所述空间距离满足目标条件确定比对成功的第二位置条码包括:
6.如权利要求1所述的测序定位匹配方法,其特征在于,所述针对每一所述第二位置条码,获取多个待选短序列,将所述待选短序列与所述索引信息库进行比对确定匹配短序列,构建所述匹配短序列与所述第一位置条码的匹配信息库,包括:
7.如权利要求6所述的测序定位匹配方法,其特...
【专利技术属性】
技术研发人员:梁文宇,徐枣旭,王谷丰,赵陆洋,
申请(专利权)人:深圳赛陆医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。