联合归一化和差异检测方法技术

技术编号：22503400 阅读：16 留言：0更新日期：2019-11-09 02:58

本发明专利技术公开了一种联合归一化和差异检测方法，基于高通量染色质相互作用数据集进行差异比较预处理和可视化处理；基于已进行差异比较预处理的高通量染色质相互作用数据集进行联合归一化；基于完成联合归一化的高通量染色质相互作用数据集进行差异检测与分析。优点：本发明专利技术开创性提出了差异比较预处理和可视化处理，填补了目前对于多个数据集的归一化和差异检测方法的空白；能够实现多个高通量染色体相互作用数据集的高效准确归一化和差异检测；另外该技术方法相对高效且快速，且可视化程度高。

Joint normalization and difference detection method

The invention discloses a joint normalization and difference detection method, which performs difference comparison preprocessing and visualization based on the high-throughput chromatin interaction data set; performs joint normalization based on the high-throughput chromatin interaction data set that has undergone difference comparison preprocessing; performs difference detection and visualization based on the high-throughput chromatin interaction data set that has completed joint normalization Analysis. Advantages: the invention creatively puts forward the difference comparison preprocessing and visualization processing, fills in the blank of normalization and difference detection methods for multiple data sets at present; can realize efficient and accurate normalization and difference detection for multiple high-throughput chromosome interaction data sets; in addition, the technical method is relatively efficient and fast, and has a high degree of visualization.

全部详细技术资料下载

【技术实现步骤摘要】
联合归一化和差异检测方法
本专利技术涉及一种联合归一化和差异检测方法，属于生物信息学

技术介绍
基因组的3D染色体结构中染色质相互作用频率IF(InteractionFrequency)是一组具有重要意义的数据。它不仅决定了细胞类型和特异性基因表达，也决定了癌症中肿瘤基因和肿瘤抑制因子的错误调节。因此研究染色质相互作用是理解基因组调控不可或缺的重要一步。现代生物学的发展使传统的染色质构象捕获(3C)技术演变为Hi-C测序技术，这使我们可以检测整个基因组中的长距离染色质相互作用，也使我们对染色质相互作用的影响因素有了更明确的认识，主要分为技术特异性偏差和DNA序列造成的偏差。这些偏差的存在使我们在进一步对整个数据集进行研究对比之前，必须对数据集进行归一化。目前的生物学信息领域中，对于数据集的归一化方法主要集中在对单一数据集的归一化，缺少对于多个数据集的高效的归一化方法。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的缺陷，提供一种联合归一化和差异检测方法。为解决上述技术问题，本专利技术提供一种联合归一化和差异检测方法，基于高通量染色质相互作用数据集进行差异比较预处理和可视化处理；基于已进行差异比较预处理的高通量染色质相互作用数据集进行联合归一化；基于完成联合归一化的高通量染色质相互作用数据集进行差异检测与分析。进一步的，所述差异比较预处理和可视化处理，具体为：利用高通量染色质相互作用数据集建立可供比较的数据集；基于可供比较的数据集建立单位距离D和染色质相互作用频率差M的连接，构建差异比较数据表；基于单位距离D和染色质相互作用频率差M的连接，...

【技术保护点】
1.一种联合归一化和差异检测方法，其特征在于，基于高通量染色质相互作用数据集进行差异比较预处理和可视化处理；基于已进行差异比较预处理的高通量染色质相互作用数据集进行联合归一化；基于完成联合归一化的高通量染色质相互作用数据集进行差异检测与分析。

【技术特征摘要】
1.一种联合归一化和差异检测方法，其特征在于，基于高通量染色质相互作用数据集进行差异比较预处理和可视化处理；基于已进行差异比较预处理的高通量染色质相互作用数据集进行联合归一化；基于完成联合归一化的高通量染色质相互作用数据集进行差异检测与分析。2.根据权利要求1所述的联合归一化和差异检测方法，其特征在于，所述差异比较预处理和可视化处理，具体为：利用高通量染色质相互作用数据集建立可供比较的数据集；基于可供比较的数据集建立单位距离D和染色质相互作用频率差M的连接，构建差异比较数据表；基于单位距离D和染色质相互作用频率差M的连接，将待比较的数据集以散点的形式进行可视化，创建横轴为M，纵轴为D的散点图，即MD图。3.根据权利要求2所述的联合归一化和差异检测方法，其特征在于，所述利用高通量染色质相互作用数据集建立可供比较的数据集，具体为：利用GEO数据库中公开的高通量染色质相互作用数据集建立可供比较的BEDPE格式的数据集。4.根据权利要求1所述的联合归一化和差异检测方法，其特征在于，所述联合归一化，具体为：对完成差异比较预处理的数据集进行非参数化方法构建回归模型；基于所述回归模型对数据集...

【专利技术属性】
技术研发人员：汤斌华，王宇琦，
申请(专利权)人：河海大学常州校区，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人