当前位置: 首页 > ops >正文

基因表达数据的K-M生存曲线的数据处理及绘制

基因表达K-M(Kaplan-Meier )生存曲线是将经典的生存分析与基因表达数据相结合,用于探究特定基因的表达水平高低是否与患者(或其他研究对象)的生存预后(如总体生存期、无病生存期)存在显著关联。

Kaplan-Meier 曲线:一种统计学方法,用于估计在不同时间点患者的生存概率。它能很好地处理在研究结束时部分患者尚未发生终点事件(如死亡)的“删失”数据。

基因表达:通过测序(如RNA-seq)或芯片技术测量得到的基因在细胞中的mRNA水平。表达水平通常是一个连续数值。

简单来说: 将一个连续测量的基因表达值,通过一个阈值(如中位数或最佳截断值)划分为高表达组低表达组,然后比较这两组患者的生存曲线,看是否存在统计学上的显著差异。

本期教程详细介绍了基因表达数据的K-M生存曲线的数据处理及绘制。

一、数据处理与分组:

1.将表达数据按照表达数据的中位数分为高、低的表达组:①单元格G2中,使用公式=MEDIAN(C2:C468)计算得出的表达数据的中位数为588;②单元格E2中用公式=IF(D2<$G$2,"LOW","HIGH")判断与中位数的大小关系,若小于中位数则为LOW,高于则为HIGH,据此对表达数据进行高低分组。③在单元格F2中,使用公式=IF(C2="Dead",1,0)将C列中的文字状态描述转化为数字描述,1表示Dead,0表示Alive。

2.打开选中组别列,也就是E列,点击右上角的排序与筛选,选择降序,在跳出的对话框选择扩展选定区域。

二、数据分析及绘图

1.打开Graphpad prism软件,安装下右图的格式将生存时间和状态数据按照高、低表达组(High expression & Low expression)两列错位输入;

2.点击左侧的工具栏,选择“New Analysis”选项,在弹出的Analyze Data或Create New Analysis界面中选择Survival analyses,选择Simple survival analysis(Kaplan-Meier);

3.在弹出的参数设置界面按以下图示设置即可;

4.在左侧工具栏中,点击Graphs下的Survival proportions,页面出现图形即为生存曲线图形,需要对其进一步细节美化;

5.双击坐标轴,在跳出的对话框下,分别修改边框大小,数据间隔改为0;

6.双击图形,分别对两条曲线进行修改颜色和大小;

7.添加误差带,点击对话框下的“Change Graph Type”,在跳出的对话框,选择将Error bars,选择95%CI;

回到图层设置页面,分别对两条曲线进行修改置信区间的颜色等;

8.接着对其进行其它细节美化,包括字体格式、图例、添加注释等,K-M生存曲线最终效果图如下图所示:

以上就是基因表达数据的K-M生存曲线的数据处理及绘制步骤,根据以上步骤即可绘制出带有置信区间的生存曲线,大家快去试试吧!

——END——

http://www.xdnf.cn/news/19669.html

相关文章:

  • C++条件变量学习
  • UML状态图之trigger(触发器)、guard(守卫条件)和action(动作)
  • Linux 文本处理神器——sed
  • 拔河(蓝桥杯)(前缀和)
  • OpenStack:典型的面向服务架构(Service-Oriented Architecture, SOA)
  • milvus-standalone启动失败unhealthy,错误日志context deadline exceeded
  • 面试官常问:Redis 为什么快?这篇回答满分!
  • 【数据结构探秘】手把手用单链表实现增删查改:一篇面向 C 程序员的实战指南
  • C#枚举类型的定义及其用法
  • WS2812灯带效果设计器上位机
  • 微服务的编程测评系统19-我的消息功能-竞赛排名功能
  • ChartView的基本使用
  • 【学Python自动化】 7.1 Python 与 Rust 输入输出对比学习笔记
  • Linux系统shell脚本(二)
  • 【Python - 基础 - 工具】解决pycharm“No Python interpreter configured for the project”问题
  • 机器学习入门,支持向量机
  • Vite + React + Tailwind v4 正确配置指南(避免掉进 v3 的老坑)
  • 为什么程序员总是发现不了自己的Bug?
  • Flutter 3.35.2 主题颜色设置指南
  • 使用 qmake 生成 Makefile,Makefile 转换为 Qt 的 .pro 文件
  • Redis核心数据类型解析——string篇
  • 基于YOLO8的番茄成熟度检测系统(数据集+源码+文章)
  • 2025年女性最实用的IT行业证书推荐:赋能职业发展的8大选择
  • Elasticsearch面试精讲 Day 5:倒排索引原理与实现
  • IoTDB对比传统数据库的五大核心优势
  • 深度估计:单目视觉实现车距测量和车速估计(含完整项目代码)
  • ubantu20.04 git clone 无法连接问题与解决方法
  • netstat用法
  • 别再让分散 IO 拖慢性能!struct iovec:高效处理聚集 IO 的底层利器
  • pikachu之 unsafe upfileupload (不安全的文件上传漏洞)