当前位置: 首页 > java >正文

bismark OT CTOT OB CTOB 以及mapping后的bam文件中的XG,XR列的含义

首先,OT,OB,CTOT,CTOB都是描述测序reads的,而不是描述参考基因组的。

bisul-fate建库会将DNA双链文库中非甲基化的C转化成U。转化结束后,被转化的U和互补链的G并不配对。此时正链(+,OT,original top strand)和反链(-,OB,original bottom strand)中,均为C to T转换的原始reads。

上述的reads经过PCR扩增后,正反单链均产生完全互补链。OT的互补链为CTOT(Complementary original top strand),OB的互补链为CTOB(Complementary bottom strand)。可知CTOT和CTOB均为GA转换。

图片引用自:

https://zhuanlan.zhihu.com/p/163495878

  • 正链(+):是指 FASTA 文件中提供的原始序列本身,即参考基因组中记录的那条链。

  • 负链(-):是指 FASTA 文件中记录的序列的反义链,也就是将参考序列取反向互补得到的链。

关于bismark比对,可以参考这篇:

https://www.zxzyl.com/archives/759/

比对生成的bam文件中,XR字段如果是CT,表示该reads是经过CT变换后匹配到了基因组中,即该reads属于OB或者OT;此时若XG字段为GA,表示它mapping到了参考基因组正链中的GA变换也就是反链中的CT变换,即表示它属于反链,即OB。如上图,即(2)对应的情况(reads上的C全部转换成T,然后mapping到了基因组正链GA转换。)

列个表供参考:

XRXG说明Strand
CTCTread 是 C→T(OB或者OT),基因组是 C→T(OT或CTOT)OT
CTGAread 是 C→T(OB或者OT),基因组是 G→A(OB或CTOB)OB
GACTread 是 G→A(CTOT或者CTOB),基因组是 C→T(OT或CTOT)CTOT
GAGAread 是 G→A(CTOT或者CTOB),基因组是 G→A(OB或CTOB)CTOB
http://www.xdnf.cn/news/10495.html

相关文章:

  • 用go从零构建写一个RPC(4)--gonet网络框架重构+聚集发包
  • 【知识点】第3章:基本数据类型
  • Linux之进程间通信
  • 600+纯CSS加载动画一键获取指南
  • NLP学习路线图(十九):GloVe
  • Windows不关防火墙,安全开放端口方法
  • 【图论 拓扑排序 贪心 临项交换】P5603 小 C 与桌游 题解|普及+
  • ubuntu 添加应用到启动菜单
  • Unity中应对高速运动的物体,碰撞组件失效的问题?
  • Android高级开发第四篇 - JNI性能优化技巧和高级调试方法
  • 小团队如何落地 Scrum 模型:从 0 到 1 的实战指南
  • Mysql水平分表(基于Mycat)及常用分片规则
  • 【黑马程序员uniapp】项目配置、请求函数封装
  • win32相关(虚拟内存和物理内存)
  • 模块二:C++核心能力进阶(5篇)篇二:《多线程编程:C++线程池与原子操作实战》(14万字深度指南)
  • PolyGen:一个用于 3D 网格的自回归生成模型 论文阅读
  • 计算机网络 : 应用层自定义协议与序列化
  • 【iOS安全】使用LLDB调试iOS App | LLDB基本架构 | LLDB安装和配置
  • Hadoop 大数据启蒙:初识 HDFS
  • 【基于阿里云搭建数据仓库(离线)】Data Studio创建资源与函数
  • sqlite-vec:谁说SQLite不是向量数据库?
  • 【C#】Quartz.NET怎么动态调用方法,并且根据指定时间周期执行,动态配置类何方法以及Cron表达式,有请DeepSeek
  • 【Linux】pthread多线程基础
  • 借助 Python 实现 AIOps 高级日志分析:实践者行动指南
  • leetcode0513. 找树左下角的值-meidum
  • 深入了解linux系统—— 进程间通信之管道
  • Java中Integer类常用静态方法详解
  • 吴恩达机器学习笔记(1)—引言
  • 大楼智能化建设设计方案(Word)
  • 三大模块曝光:分钟级搭建专属平台,解锁算力灵活操控新体验,重新定义智能开发效率天花板