当前位置: 首页 > java >正文

从0开始学习R语言--Day20--Wilcoxon秩和检验

Wilcoxon秩和检验

当数据不满足正态分布时,我们常常会苦恼于如何处理数据。即使是用缩进的方法,把数据缩进到(1-99%)或(1-95%)的范围内,假如有一些数据点集中在数据分布的尾端,这依然会影响到我们对数据特点的判断,尤其是需要探寻数据组之间的联系或关系的时候。

而实际上,假设我们要探究的不是数据在统计上的数值关系,而是因果关系或比较,我们可以把数据处理成秩次的形式,从而去对比数据组,这样相当于把数据的分布都固定下来,也就相当于去对比两组数据的中位数了。

要注意的是,使用这个方法的前提是对比的数据之间要相互独立,不能是分类数据,在使用前要核对数据量的差别不能太大,统一好单位,避免无关的变量影响结果。

以下是一个例子:

# 生成两组数据(假设A组和B组)
set.seed(123)  # 确保结果可重复
group_A <- rnorm(30, mean = 50, sd = 10)  # A组:均值50,标准差10
group_B <- rnorm(35, mean = 60, sd = 12)  # B组:均值60,标准差12# 创建数据框
data <- data.frame(value = c(group_A, group_B),group = factor(rep(c("A", "B"), times = c(30, 35))))head(data)  # 查看前6行boxplot(value ~ group, data = data, col = c("lightblue", "pink"),main = "Comparison of Group A and B",xlab = "Group", ylab = "Value")# 方法1:直接输入两组数据
wilcox.test(group_A, group_B)# 方法2:使用公式(推荐)
wilcox.test(value ~ group, data = data)# 输出结果解读:
# p-value < 0.05 表示两组中位数差异显著
# W值:秩和统计量

输出:

	Wilcoxon rank sum exact testdata:  value by group
W = 211, p-value = 1.819e-05
alternative hypothesis: true location shift is not equal to 0

从结果可以看到,p值远小于0.05,所画的箱线图也证明了A、B组的差异比较明显,中位数相差了10。

http://www.xdnf.cn/news/12964.html

相关文章:

  • 组件库实战-基建思路
  • Docker拉取MySQL后数据库连接失败的解决方案
  • P3 QT项目----记事本(3.8)
  • Qt的学习(二)
  • 用神经网络读懂你的“心情”:揭秘情绪识别系统背后的AI魔法
  • HDMI 显示器热插拔对应显示应用启停测试
  • 高分辨率图像合成归一化流扩展
  • 02.运算符
  • 使用Spring Cloud Stream 模拟生产者消费者group destination的介绍(整合rabbitMQ)
  • c++默认类模板参数
  • K8S中的PV、PVC和StorageClass
  • 【C++】std::bind和std::placeholders
  • c# 局部函数 定义、功能与示例
  • 「Java基本语法」变量的使用
  • redis--黑马点评--Redisson快速入门
  • 自动化过程中,如何定位一闪而过的toast?
  • 【11408学习记录】考研数学攻坚:行列式本质、性质与计算全突破
  • Xen Server服务器释放磁盘空间
  • 什么是CRM客户管理系统?怎样的企业需要用CRM客户管理系统?
  • SQL 注入:JDO与Hibernate
  • @Lazy原理与实战
  • 商品中心—1.B端建品和C端缓存的技术文档二
  • 【动态规划】B4336 [中山市赛 2023] 永别|普及+
  • 【阅读笔记】MemOS: 大语言模型内存增强生成操作系统
  • 总结___
  • CppCon 2015 学习:Reactive Stream Processing in Industrial IoT using DDS and Rx
  • python基础day06
  • 【大模型:知识库管理】--开源工具Ragflow构建知识库
  • 多核处理器系统中内存一致性问题举例
  • 记录一次opengl显示不出物体的错误原因