当前位置: 首页 > web >正文

常用的关系性统计方法

在这里插入图片描述

  1. 相关性分析

    • Pearson相关:用于衡量两个连续变量之间的线性关系,要求数据符合正态分布。
    • Spearman相关:用于衡量两个变量之间的等级相关性,适用于非正态分布的数据或等级资料。
  2. 回归分析

    • 不考虑时间
      • 数值变量(Y):可以是一元线性回归或多元线性回归,用于分析一个或多个自变量对一个连续因变量的影响。
      • 等级变量(Y):可以使用有序logistic回归,适用于因变量是有序分类的情况。
      • 分类变量(Y):可以使用二项logistic回归或多项logistic回归,适用于因变量是二分类或多分类的情况。
    • 考虑时间
      • 生存分析:包括寿命表法、Kaplan-Meier方法和Cox回归,用于分析生存时间数据,通常在医学研究中使用。
  3. 降维分析

    • 主成分:主成分分析(PCA),用于减少数据集的维度,同时尽可能保留原始数据的信息。
    • 因子分析:用于识别观测变量背后的潜在因子,这些因子可以解释变量间的相关性。
  4. 聚类分析

    • 系统聚类:一种层次聚类方法,通过计算样本间的相似性来构建聚类树。
    • K-Means聚类:一种划分聚类方法,将数据划分为K个簇,使得簇内样本相似度最大,簇间样本相似度最小。
    • 两步聚类:一种结合了划分聚类和层次聚类优点的聚类方法。
  5. ROC曲线

    • 数值变量ROC:用于评估连续变量预测模型的分类性能。
    • 等级变量ROC:用于评估有序分类变量预测模型的分类性能。
    • 联合实验ROC:可能指的是在多个实验或数据集上评估模型性能的ROC曲线。

  1. 相关性分析的定义和重要性

    • 相关性分析是探索变量之间关系的重要工具,它帮助我们从观察变量间的差异过渡到理解变量间的关联。掌握相关性分析是学习更复杂的统计方法的基础。
  2. 线性相关

    • 线性相关描述了两个变量之间是否存在线性趋势的关系。这是最常讨论的相关性类型。
  3. Pearson相关和Spearman相关

    • Pearson相关:用于衡量两个连续变量之间的线性关系,要求数据符合正态分布。
    • Spearman相关:用于衡量两个变量之间的等级相关性,适用于非正态分布的数据或等级资料。Spearman相关更为灵活,可以处理不同类型的变量。
  4. 相关系数的比较

    • 在数据满足正态分布的条件下,通常优先选择Pearson相关,因为它能更好地反映线性关系。Spearman相关则更多关注变量之间的单调变化关系。理论上,Spearman相关系数总是大于或等于Pearson相关系数。
  5. 不同类型的相关性分析

    • 单变量对单变量:使用Pearson或Spearman相关。
    • 单变量对多变量:使用偏相关来排除其他变量的影响。
    • 多变量对单变量:计算复相关系数。
    • 多变量对多变量:采用典型相关分析。
  6. 假设检验

    • 由于抽样误差,通过样本计算得到的相关系数可能不完全准确。因此,需要对相关系数进行假设检验,以确定其统计显著性。
  7. 结果展示

    • 在展示相关分析结果时,应附上散点图。散点图可以直观地展示变量之间的关系,特别是当相关系数可能受到极端值影响时。
http://www.xdnf.cn/news/6392.html

相关文章:

  • 【物联网】基于树莓派的物联网开发【4】——WIFI+SSH远程登录树莓派
  • 2505C++,py和go调用雅兰亭库的协程工具
  • 2025年渗透测试面试题总结-阿里云[实习]阿里云安全-安全工程师(题目+回答)
  • 2025认证杯第二阶段数学建模B题:谣言在社交网络上的传播思路+模型+代码
  • 贝叶斯优化Transformer融合支持向量机多变量回归预测,附相关性气泡图、散点密度图,Matlab实现
  • 【Python 正则表达式】
  • PostgreSQL 联合索引生效条件
  • 揭秘LLM:矩阵运算揭秘LLM单词生成机制
  • C++11多线程thread、原子变量
  • Kafka 中过多的 topic 导致整体上性能变慢的原因
  • Spark--RDD中的转换算子
  • Node.js
  • Miniconda介绍介绍和使用
  • Web3.0:互联网的去中心化未来
  • FPGA: UltraScale+ bitslip实现(ISERDESE3)
  • 记一次bug排查(.exe链接mysql失败)-每天学习一点点
  • (5)python开发经验
  • 组合问题(去重)
  • C++23 新增的查找算法详解:ranges::find_last 系列函数
  • uniapp微信小程序-长按按钮百度语音识别回显文字
  • 印度Rummy游戏支付通道申请策略:技巧类游戏的合规与创新
  • 从零开始学习three.js(18):一文详解three.js中的着色器Shader
  • Spring MVC HttpMessageConverter 的作用是什么?
  • 区块链blog1__合作与信任
  • 电池组PACK自动化生产线:多领域电池生产的“智能引擎”
  • 【美团】后端一面复盘|项目驱动 + 手撕 + JVM + 数据库全面覆盖
  • 重磅发布!OpenAI 推出最新模型 GPT-4.1 系列!
  • 多模态大语言模型arxiv论文略读(七十七)
  • 【氮化镓】HfO2钝化优化GaN 器件性能
  • 【React全栈进阶】从组件设计到性能优化实战指南